En juillet 2005, la direction de l’information scientifique (DIS) et le département des Sciences Humaines et Sociales du CNRS ont lancé un appel à candidatures pour la mise en place de centres de ressources numériques adaptés aux sciences humaines. Les centres de ressources numériques, actuellement au nombre de six, ont pour objectif la mise en place d'une infrastructure permettant la production, la validation et la diffusion de ressources numériques et facilitant l'accès aux services disponibles grâce à une centralisation des connaissances et des moyens. S’agissant de l’axe des « sources historiques manuscrites », c’est le projet proposé par l’École nationale des chartes (ENC) et l’Institut de recherche et d’histoire des textes (IRHT) qui a été retenu : Telma (Traitement ELectronique des Manuscrits et des Archives).
La proposition de Telma replace l’appel à projet de la DIS dans un contexte spécifique : celui de l’étude des sources du patrimoine culturel et, en particulier, dans le cas qui nous intéresse, des manuscrits, des archives, conservés dans les fonds des bibliothèques ou des dépôts d’archives. Depuis la naissance de l’imprimerie, ces sources sont largement éditées de manière critique, publiées et diffusées. L’émergence du support électronique a permis de prolonger très nettement et rapidement cette entreprise, mais l’essentiel réside toujours dans la conservation et la mise en valeur du patrimoine –parfois son exploitation aussi. C’est dans ce cadre que le projet Telma a vu le jour, s’attachant à promouvoir conservation, mise en valeur et, partant, exploitation des sources anciennes qui constituent ce patrimoine.
D’autres entreprises aux objectifs similaires ont été mises en place en d’autres points du globe, se donnant pour objectif de constituer des relais techniques et des sources d’information, de conseil et de formation. Citons parmi elles le Humanities Computing and Media Centre de l’université de Victoria, le Centre for Computing in the Humanities au King’s college, à Londres, ou encore l’Institute for Advanced Technology Humanities de l’université de Virginia aux Etats-Unis.
Se référant à ces exemples à l’étranger, l’entreprise Telma prend appui sur un constat : dans ce domaine, il n’y a guère, à l’heure actuelle, d’expérience française qui soit capable de fournir la structure fédérative au niveau national indispensable pour envisager les différentes initiatives existantes à long terme.
En effet, le recours au support informatique implique un changement de paradigme, en obligeant désormais toutes les institutions qui créent et gèrent du contenu à le penser en terme de continuité dans le temps et donc d’archivage. Pour cela, il est nécessaire d’aborder les grands principes fondamentaux d’interopérabilité, de standards, de granularité variable de l’information traitée, de dissémination et d’appropriation des technologies et des savoirs… le tout dans le cadre fondamental du logiciel libre et de l’accès libre aux données et aux techniques.
L’un des enjeux que Telma se propose d’adresser est celui de la conservation sur le long terme des éditions critiques et des entreprises de repérage de sources réalisées sur support numérique par les chercheurs. Aujourd’hui, nous savons que la vitesse de changement des environnements informatiques est telle que toute production électronique se trouve par nature menacée. Les supports sur lesquels l’information est stockée sont loin d’avoir fait leurs preuves, les formats de données doivent répondre à des critères d’ouverture et d’accessibilité pour pouvoir être encore lisibles demain, les logiciels permettant d’exploiter l’information évoluent rapidement et les services de mise en ligne, considérés aujourd’hui comme des publications, doivent, au contraire du papier, être maintenus et pérennisés pour rester à la disposition de la communauté qui les utilise.
Pour poser les jalons d’une solution à ces différents problèmes, Telma propose aux chercheurs une assistance à la publication en ligne des sources manuscrites sur lesquelles ils travaillent, tout en prenant la pleine mesure des contraintes sous-jacentes au média numérique. Pour cela, le projet s’appuie sur des solutions de stockage et de conservation de données de manière pérenne et sur des formats et des logiciels ouverts et libres. Cette mise à disposition des données à la communauté scientifique doit passer par leur insertion dans un entrepôt et leur adaptation à des normes éditoriales et techniques.
En outre, cette prise de conscience implique d’intervenir très en amont de la production des données et donc d’aider les chercheurs à s’approprier ces techniques de gestion de l’information numérique appliquées aux sources anciennes. Ce rôle de relais d’information assuré par le centre Telma passe par le biais de formations et de conseils, mais se révèle aussi dans le partage de la veille technologique et la participation à des entreprises internationales de normalisation.
Enfin, le centre a vocation à se rapprocher des institutions de conservation, bibliothèques et archives, et de leurs tutelles (Direction des archives de France, Direction du livre et de la lecture, Sous-direction des bibliothèques et de la documentation) afin d’établir une coordination permettant la programmation de plans de numérisation satisfaisant à la fois aux contraintes des établissements et aux besoins des chercheurs en Sciences humaines et sociales.
Une plate-forme technologique répond aux problématiques relatives à la gestion de corpus de sources historiques au format numérique, en particulier aux exigences de conservation des données numériques en se basant sur le modèle OAIS1, ou norme ISO 14721. Au cœur du dispositif se trouve le format XML mis au point au W3C, World Wide Web Consortium2, et recommandé par la Direction générale de la modernisation de l'État (anciennement ADAE)3. Les grammaires XML utilisés par cette plate-forme sont le format METS, mis au point par la Library of Congress, pour réunir dans un point d’accès unique toutes les métadonnées utiles pour assurer les missions de préservation et d’accès aux données et, d’autre part, la recommandation de la TEI pour l’encodage des ressources elles-mêmes au plus proche de l’information produite par les chercheurs. Même si l'utilisation de la TEI est recommandée, elle n'est pas imposée, la plate-forme aceptant tous types de fichiers XML.
Pour accéder à ces données, une application basée sur des logiciels libres existants a été développée. Cette plate-forme, simple dans sa structure, est destinée à accueillir de la sorte tout type de corpus documentaire, textuel ou autre. Son angle d’attaque –les sources anciennes, au sens large– en fait un réceptacle idéal pour la recherche en cours et à venir, en sciences humaines et sociales. L’ensemble de ces choix techniques permet de garantir une totale indépendance entre les données et les applications permettant de les exploiter ; cela favorise ainsi une conservation à long terme et une interopérabilité avec des données produites par d'autres institutions.
Le site web du centre, accessible à l'adresse http://www.cn-telma.fr, donne accès aux corpus constitués et hébergés par le centre. Au-delà de l’accès aux fichiers de données brutes, il fournit différentes interfaces de consultation pour les utilisateurs, des fonctionnalités d’annotations destinées à un usage privé et un moteur de recherche offrant les outils lexicographiques de base (recherche en texte intégral, recherche booléenne, concordances, co-occurences, index de formes).
Le site web reflète également la vocation de relais d’information du centre, en fournissant la documentation de la plate-forme, ainsi que toutes les explications nécessaires pour permettre aux spécialistes de comprendre son fonctionnement technique. Il sert aussi de lieu de convergence et de partage pour la veille scientifique et technologique réalisée par les membres de Telma.
Fort de cette infrastructure, TELMA se fixe pour objectif de servir de relais d’information et de soutien technique pour la communauté des chercheurs, avec différents niveaux d’offre de service :
Cette activité de conseil et d’assistance à maîtrise d’ouvrage est fondamentale, puisqu'elle est vouée à aider et à accompagner l'appropriation de ces technologies nouvelles par les chercheurs du domaine. Ce rôle de relais se fait avec différents interlocuteurs : informaticiens, spécialistes de la normalisation, institutions de conservation, chercheurs traitant des sources historiques non imprimées. Cet effort est complété par une offre de formation qui se traduit par l'organisation de une à deux écoles thématiques par an dont les sujets sont en rapport avec les activités du centre.
1. Open Archival Information System ; traduction française disponible à l'adresse http://vds.cnes.fr/pin/documents/projet_norme_oais_version_francaise.pdf
2. Le W3C est un consortium indépendant chargé de normaliser les langages et protocoles utilisés sur le Web, http://www.w3.org
3. http://www.adae.gouv.fr/upload/documents/formats_supports.rtf