Text Encoding Initiative
Text Encoding Initiative
Le Projet TEI (ACH-ACL-ALLC)
Bref survol
Nancy Ide
Présidente du Comité de Pilotage TEI
Octobre 1994 (Traduction française de J.-L. Duchet, 1995)
Qu'est-ce que la TEI?
La TEI (Text Encoding Initiative) est un projet international visant à mettre au point des directives pour l'élaboration et l'échange de documents électroniques à des fins de recherche érudite, et pour répondre aux besoins les plus variées des industries de la langue en général. Ce projet est patronné par l'Association for Computers and the Humanities (ACH), l'Association for Computational Linguistics (ACL), et l'Association for Literary and Linguistic Computing (ALLC). Un soutien important a été apporté au projet par le NEH américain (National Endowment for the Humanities), la Direction 13 de la Commission des Communautés Européennes, la Fondation Andrew Mellon, et le Conseil de la Recherche en humanités et sciences sociales du Canada.
La TEI a été lancée par un congrès constituant convoqué par l'ACH, à Vassar College, Poughkeepsie, New York, les 12 et 13 novembre 1987, en réponse au besoin pressant d'un système commun de codage des textes, besoin que rendait évident la diversité chaotique des systèmes utilisés dans le milieu des années 80. Depuis lors, le besoin de pratiques standardisées d'encodage des textes s'est révélé plus flagrant encore, au fur et à mesure qu 'augmentait l'utilisation, et, plus encore, la réutilisation d'énormes quantités de textes électroniques pour les besoins de la recherche comme pour ceux de l'industrie. La diversité croissante des usages du texte électronique s'étend au traitement des langues naturelles, aux éditions savantes, au stockage et à la diffusion de l'information, à l'hypertexte, la publication électronique et à diverses formes d'analyse littéraire et historique et à la lexicographie. L'objectif central de la TEI est de faire en sorte que tout texte créé électroniquement puisse être utilisé pour n'importe laquelle de ces applications, ainsi qu'à d'autres fins, dont certaines encore insoupçonnées.
Organisation
La TEI est dirigée par un comité de pilotage, constitué de deux représentants de chacune des associations fondatrices. Quinze associations savantes sont représentées au Conseil Consultatif de la TEI, qui a approuvé le plan de charge et approuve le Guide publié par la TEI. Deux rédacteurs, l'un europén et l'autre nord-américain, coordonnent le travail et sont chargés de l'édition de ce Guide.
Le Guide TEI
En mai 1994, la TEI a publié son Guide de l'encodage et de l'inter-communication des textes électroniques. Le Guide TEI définit des conventions d'encodage pour décrire l'aspect physique et la structure logique d'une vaste gamme de types de textes et de caractéristiques textuelles, pertinents pour la recherche dans les industries de la langue, les humanités, et la linguistique informatique. Ceci recouvre les alphabets et jeux de caractères, les corpus linguistiques, la linguistique générale, les dictionnaires, le traitement des données terminologiques, les textes oraux, les hypermedia, la prose littéraire, la poésie, le théâtre, les matériaux historiques primaires, les apparats critiques d'éditions de textes. Le Guide traite des problèmes d'encodage des textes en général, y compris les références intra- et inter-textuelles, la démarcation de segments de textes, l'alignement de textes parallèles, les hiérarchies emboîtées, etc. En outre, elles définissent des conventions pour lier les textes à des données acoustiques ou visuelles.
Le Guide TEI répond aux besoins fondamentaux d'une vaste palette de scientifiques, d'éditeurs et de bibliothécaires, bref, tous ceux qui s'intéressent en général à la conservation et à la diffusion des documents. Il répond aussi à la plupart des besoins des industries de la langue, monde en plein essor, qui accumule des corpus importants de textes écrits et oraux et de dictionnaires multilingues et multi-vecteurs, contribuant ainsi à la recherche sur la connaissance du langage humain, sa production et sa traduction.
Liste de messagerie
La TEI gère une liste de messagerie électronique qui diffuse les informations sur le codage des textes et offre un forum d'échanges de points de vue au sujet du Guide TEI. Pour s'y abonner, envoyer un message électronique ne comportant qu'une seule ligne: SUBSCRIBE TEI-L
à LISTSERV@UICVM.BITNET ou LISTSERV@UICVM.UIC.EDU
[NDT: Depuis le réseau RENATER, c'est à la deuxième adresse qu'il faut envoyer le message.]
Prospective
La TEI a atteint un stade décisif en établissant les bases intellectuelles cohérentes d'un système de codage et d'un jeu de conventions de codage assez substantiel pour répondre aux besoins fondamentaux de la plupart des projets d'encodage de textes, quelle qu'en soit l'étendue. Toutefois la plus grosse part de ce travail de mise au point s'est fait a priori, en amont de toute mise en pratique.
La TEI aborde maintenant une nouvelle phase au cours de laquelle l'objectif majeur sera la diffusion et l'application à grande échelle des conventions TEI. La mise en Ïuvre effective de la TEI est désormais la moteur principal de son extension et de son amélioration. La préoccupation centrale sera donc l'évaluation systématique à la lumière de l'expérience acquise par l'usage des conventions TEI. Les résultats de cette évaluation guideront le développement ultérieur de la TEI.
Ce passage de la création d'une norme standard à sa mise en Ïuvre et à son évaluation implique que l'activité au sein de la TEI devra se porter sur le soutien des usagers. Ce qui exige la mise au point de matériaux didacticiels, d'ateliers de formation, et autres matériaux de formation et d'information, ainsi que la prestation de services de conseil auprès des individus et équipes utilisant le Guide TEI.
Informations complémentaires
Pour toute information complémentaire entrer en contact avec les rédacteurs :
En Europe : Lou Burnard, Oxford University Computing Service, 13 Banbury Rd, Oxford OX2 6NN, England. E-mail: lou@vax.ox.ac.uk. Phone: (+44 865) 273238. Fax : (+44 865) 273275.
Ailleurs : C. M. Sperberg-McQueen, Computer Center (M/C 135), University of Illinois at Chicago, 1940 W. Taylor St., Room 124, Chicago IL 60612- 7352, USA. Bitnet: u35395@uicvm. Internet: u35395@uicvm.uic.edu Phone: (+1 312) 413-0317 Fax: (+1 312) 996-6834.
Texte original de N. Ide. Traduction française de Jean-Louis Duchet, janvier 1997