La création de l’Infrastructure de Recherche CORPUS (Coopération des Opérateurs de Recherche Pour un Usage des Sources numériques) a ouvert la possibilité de constituer un consortium linguistique spécialement dédié aux Corpus écrits.
Partant du constat que la création de corpus numériques écrits à des fins de recherche a connu des développements considérables dans les dernières années et que des attentes fortes se font jour en matière de partage d’information, d’homogénéisation des pratiques et de mise en conformité avec des standards internationaux, le consortium « Corpus écrits » se donne précisément pour but de fédérer les équipes et laboratoires, les chercheurs, enseignants-chercheurs, ou ingénieurs engagés dans la production de corpus numériques écrits, quels que soient la langue et l’alphabet considérés et d’offrir la représentation la plus large possible de cette communauté, afin d’accompagner le développement des corpus écrits, d’en faire converger les pratiques et les besoins, de financer des actions répondant à ses missions.
- DIMENSION NATIONALE
Nous évaluons à une cinquantaine le nombre d’entités de recherche en linguistique (laboratoires CNRS et équipes universitaires) sur le territoire national, et à une trentaine les entités potentiellement concernées par le thème des corpus écrits.
Le porteur du consortium, l’ILF est une structure fédérative du CNRS qui par son statut même est en interaction permanente avec nombre de ces entités dans toute la France.
En outre, l’ATILF/CNRTL, très impliqué dans les projets du consortium, apporte à travers sa participation une plateforme commune du réseau national des MSH pour les aspects textes, lexiques et dictionnaires.
- DIMENSION INTERNATIONALE
Le comité de pilotage du consortium « Corpus écrits » a identifié comme un objectif hautement prioritaire l’insertion des chercheurs français dans les réseaux européens. Parmi les laboratoires représentés au comité de pilotage du consortium, certains ont déjà et depuis longtemps pris des engagements et établi des collaborations allant dans ce sens. L’ATILF, notamment, est engagé à travers :
- Sa participation au projet européen CLARIN d’infrastructure européenne partagée pour les SHS (Common Language Resources and Technology Infrastructure: www.clarin.eu) s’appuyant sur des centres régionaux « certifiés » dans leurs domaines respectifs.
- La mise en place d’un accord de partenariat entre l’ATILF et l’INIST (février 2009) a permis de positionner le CNRTL, comme un des principaux centres de cette future infrastructure de recherche. sa fonction de centre européen support de la TEI : issue d’un partenariat entre l’ATILF, l’INIST et le LORIA, cette fonction de centre européen support de la TEI, assurée jusqu’alors par le CNRTL, est reprise pour l’avenir directement par le TGE ADONIS.
- Des collaborations directes avec des centres partenaires, en Grande-Bretagne (Université d’Oxford), en Allemagne (Centres de compétence de Trèves et de Würzburg, Université de Sarrebruck, MPI Berlin), aux Pays Bas (Université de Nimègue) et en Angleterre (Oxford).