Partenaires

CNRS
Logo tutelle


Rechercher

Sur ce site

Sur le Web du CNRS


Accueil du site > Actualités > TYPOLING - Bulletin d’information n°129

TYPOLING - Bulletin d’information n°129

Sommaire :

- 1-Appel à projet ANR-Corpus
- 2-Plate-forme d’interrogation des revues SHS et comparaisonréférencement
- 3-Second Workshop on Annotation and Exploitationof Parallel Corpora


- 1-Appel à projet ANR-Corpus

l’Agence Nationale de la Recherche (ANR) vient de lancer un appel à projet "CORPUS" susceptible d’intéresser vos équipes et laboratoires. Nous vous invitons à prendre connaissances des modalités de soumission.

Corpus, données et outils de la recherche en sciences humaines et sociales

Le programme « Corpus, données et outils de la recherche en sciences humaines et sociales » a pour objectif de soutenir les projets de recherche impliquant la constitution, l’enrichissement, la valorisation, la documentation de corpus, ou permettant l’amélioration des outils et des procédures d’analyse nécessaires à l’exploitation scientifique de corpus ou d’ensembles de données. Au travers de cet appel à projets, l’ANR vise à soutenir le développement de nouveaux instruments à la disposition des chercheurs en sciences humaines et sociales dans un souci de libre accès, de partage et de pérennité des données. L’appel à projets concerne tous les types de sources (textes, manuscrits, données statistiques, documents sonores, multimédia, traces, données du web, images, films, photographies...) et l’ensemble des sciences humaines et sociales.

Pour plus d’informations :

http://www.agence-nationale-recherc...


- 2- Plate-forme d’interrogation des revues SHS et comparaisonréférencement

Nous avons le plaisir de vous annoncer la mise en ligne de la plateforme JournalBase, http://journalbase.cnrs.fr  :

JournalBase, une plate-forme bilingue d’interrogation des revues en sciences humaines et sociales (SHS) et de comparaison de leur référencement.

Construit à partir des données du Web of Science, de Scopus, des listes d’autorité ERIH et AERES, la plateforme web "JournalBase" offre, en libre accès, un service inédit pour les SHS de recensement des revues et de comparaison de leur référencement dans les bases de données nationales et internationales. Enrichi de toutes les informations indispensables sur chaque revue : champ disciplinaire, site web de la revue, langue de publication, éditeur, pays de l’éditeur, statut (libre d’accès ou payant), cet outil pionnier permettra à tous les acteurs de la recherche de disposer d’une source d’information et de comparaison complète sur la question.

Conçu dans un esprit collaboratif, les internautes sont invités à participer à l’amélioration des données sur les revues (précision, information manquante ou erronée etc.) sur la page descriptive de la revue.

JournalBase : ", http://journalbase.cnrs.fr

Bien cordialement, Michèle Dassa et Christine Kosmopoulos


- 3 -Second Workshop on Annotation and Exploitationof Parallel Corpora

Second Workshop on Annotation and Exploitation of Parallel Corpora

(AEPC 2) http://www.bultreebank.org/AEPC2/

RANLP 2011 Workshop 15th or 16th September, Hissar, Bulgaria Deadline extension - see below.

This workshop is a follow-up of the First Workshop on Annotation and Exploitation of Parallel Corpora

http://math.ut.ee/tlt9/aepc/index.html

The creation of parallel corpora has been very active especially since 90s. The globalization, the extension of EU with new countries as well as the availability of open-source places for information, such as Wikipedia, DBPeadia, etc. required a multilingual approach towards the interpersonal and official communication. This status quo produced a lot of parallel data - especially administrative and political documents in several languages (EuroParl), but also news (SETIMES) and texts on various topics (wikipedia, bi- and multilingual web sites). However, the fast compilation of large amounts of data very often compromised in lower quality of paralleling texts. Here comes the challenge to discover the inconsistencies in these huge quantities of parallel data, to process them in adequate ways, and to exploit them for various applications : QA, Information Retrieval, Machine Translation, etc. The parallel corpora go beyond word-to-word alignments.

They rely on dependency, constituent or semantic pairings. There appeared guidelines and tools for aligning linguistic structures, which raised up the issue of transferability of aligning schemes from one language to another, and also for the compatibility among various resources.

Topics

The topics of interest include, but are not limited to :
- Strategies for creation of annotated parallel corpora
- Annotation guidelines for alignment
- Annotation alignment transfer over languages
- Tools for manual and automatic processing and exploitation of parallel corpora
- Problems in manual and automatic alignment
- Syntax-based and semantic-based approaches to using parallel corpora in

MT

- Parallel Grammars
- Parallel Statistical Parsing
- Usability of the existing parallel resources for various applications

Organizers
Jörg Tiedemann (Uppsala University) Kiril Simov (IICT, Bulgarian Academy of Sciences) Petya Osenova (Sofia University "St. Kl. Ohridski"

and IICT Bulgarian Academy of Sciences) Radovan Garabik (JÚ¥©, Slovak Academy of Sciences)

Important Dates
- Deadline for paper submission : 27th June 2011
- Notification of acceptance : 29th July 2011
- Final version of the papers : 29th August 2011

Submission details http://lml.bas.bg/ranlp2011/submissions.php

We ask for papers (6 to 10 pages conforming to the RANLP guidelines -

We welcome work in progress reports if they contain at least preliminary results. Papers should be submitted in PDF. Submissions should be made via the START System -

_https://www.softconf.com/ranlp11/ae....

Program Committee Antonio Branco (University of Lisbon) Nicoletta Calzolari (Institute of Computational Linguistics of the National Research Council) Koenraad De Smedt (University of Bergen) Dan Flickinger (Stanford University) Dale Gerdemann (University of Tübingen) Voula Giouli (Institute for Language and Speech Processing) Silvia Hansen (University of Mainz) Erhard Hinrichs (University of Tübingen) Valia Kordoni (University of Saarland) Vladislav Kubon (Charles University) Lothar Lemnitzer (Berlin-Brandenburg Academy of Sciences and Humanities) Preslav Nakov (National University of Singapore) Cristina Vertan (University of Hamburg) Eline Westerhout (University of Utrecht)