Partenaires

CNRS
Logo tutelle


Rechercher

Sur ce site

Sur le Web du CNRS


Accueil du site

Atelier "Linked Data en linguistique", Francfort / Main, Allemagne

7 mars 2012

L’explosion des technologies de l’information a conduit à une croissance substantielle de la quantité, la diversité et la complexité du Web accessibles les données linguistiques. Ces ressources deviennent encore plus utiles lorsqu’elles sont liées. Cet atelier présentera les principes, les cas d’utilisation, et les meilleures pratiques pour l’utilisation du paradigme de données liées à représenter, d’exploiter, stocker, et de connecter les différents types de collections de données linguistiques.

Les récents développements pertinents incluent :

- (1) Archives de langue pour la documentation des langues, avec des transcriptions audio, vidéo et texte à partir de centaines de (en danger) langues (Dobes par exemple).

- (2) les bases de données typologiques avec des données typologiques et géographiques sur les langues de toutes les parties du globe (Wals, par exemple).

- (3) le développement, la distribution et l’application des lexico-sémantique des ressources (DSL) en PNL (par exemple WordNet).

- (4) multi-couches d’annotations (par exemple ISO TC37/SC4) et l’annotation sémantique de corpus (par exemple PropBank) par les linguistes de corpus et linguistes informaticiens, souvent accompagnée de la mise en relation avec des corpus LSR (OntoNotes par exemple).

La tendance générale de fournir des données en ligne est accompagné par le nouveau développement de possibilités de relier les données linguistiques et des métadonnées . Cela peut inclure des sources de données générales (par exemple DBpedia.org), mais aussi les dépositaires de l’information linguistique spécifique sur les langues (Multitree.org, LL-MAP, ISO 639-3), ainsi que sur les catégories linguistiques et les phénomènes (OR, ISOcat) .

C’est le défi de notre temps pour stocker, Interlink et exploiter cette mine de données, par exemple la modélisation des ressources linguistiques différentes données liées. Notre atelier s’appuie sur le paradigme de Digital Humanities sein de la linguistique, en se concentrant sur l’utilisation des technologies de l’information pour améliorer la data-driven la recherche linguistique.

Cet atelier invite les chercheurs dans les domaines de la documentation des langues, typologie, linguistique computationnelle, linguistique de corpus, ainsi que des chercheurs d’autres disciplines empiriquement orientée de la linguistique qui partagent un intérêt pour les données et la modélisation des métadonnées avec les technologies du Web sémantique comme RDF ou OWL.

Vous pouvez consulter le site de l’atelier en cliquant sur le lien suivant.