L’essence même de l’Histoire est l’écriture que les hommes se sont appropriée. Ils ont écrit leur vie, leurs espérances et leurs désespoirs, ils ont compté et calculé sur des tablettes de cire ou des morceaux de poterie, ils ont couché sur papyrus, sur parchemin, sur papier des règles pour vivre ensemble. Ces traces de leur vie ont souvent disparu, parfois été conservées plus ou moins. Elles ont fasciné les hommes des siècles suivants, qui les ont décryptées, analysées, en usant avec précaution ou sans vergogne… Curieux des temps passés, journalistes, théologiens ou philosophes, guerriers ou prêtres, mais surtout historiens de toutes les époques s’en sont emparés ; ils ont parfois eux-mêmes rédigé des écrits sur le passé, se basant sur ces traces. Hérodote, Tite-Live, Tacite, Richer de Reims ou Raoul Glaber, Mabillon ou Papebroch, Michelet et Renan, Halphen comme Bloch… tous ont puisé aux sources anciennes.

Ces sources, c’est ce que l’on appelle aujourd’hui le patrimoine culturel. Ce que nous avons hérité de nos pères. Ce sont, dans le cas qui nous intéresse, des manuscrits, des archives, conservés en « originaux » dans les fonds anciens des bibliothèques ou des dépôts d’archives. Des fonds plus ou moins classés, plus ou moins connus, plus ou moins accessibles. Parfois certaines de ces pièces manuscrites ou d’archives sont recopiées et critiquées consciencieusement par un érudit qui les publie, c’est-à-dire qu’il les diffuse largement en les publiant en un ouvrage imprimé (ou de plus en plus, en ligne). Ces ouvrages reproduisent donc le contenu –parfois la forme aussi- de la source ancienne, mais plus clairement, de manière critique, afin qu’elle soit accessible au plus grand nombre et pas seulement au lecteur de la bibliothèque où le document original est conservé. Parfois ce sont des photographies (ou des gravures) de ces sources anciennes elles-mêmes qui sont publiées sous forme imprimée : on parlera alors d’un fac-simile.

Mais l’essentiel réside dans cette conservation et mise en valeur du patrimoine –parfois son exploitation aussi. C’est dans ce cadre que le projet TELMA a vu le jour, s’attachant à promouvoir conservation, mise en valeur et, partant, exploitation des sources anciennes qui constituent ce patrimoine. Le projet TELMA veut embrasser à la fois archives et manuscrits littéraires, à la fois documents produits pas une personne physique ou morale dans le cadre de son activité afin de l’assister dans celle-ci et documents produits afin de transmettre un message de type littéraire ou liturgique… Toutes les périodes de l’Histoire sont envisagées, de l’Antiquité à la période immédiate. L’espace couvert par ces sources ou du moins d’où ces sources proviennent est l’espace français.

Depuis la naissance de l’imprimerie, ces sources anciennes sont largement éditées de manière critique, publiées et diffusées. La gravure a permis quelques reproductions « en forme » de ces pièces anciennes, mais c’est surtout la photographie et le microfilm qui ont permis de mieux diffuser les reproductions à l’identique des manuscrits et des archives. Seules limites, mais de taille : le coût de la reproduction, la moindre qualité de reproduction et/ou de conservation de celles-ci.

L’émergence du support électronique (en langage binaire) a permis de prolonger très nettement et rapidement ces différents stades, notamment grâce à une automatisation et une mécanisation accrues. De nombreuses expériences ont vu le jour, dès les années ’80 mais surtout dès l’explosion de la microinformatique dans les années ’90 puis l’explosion de l’internet « pour tous » à partir des années ’95 environ.

Voici l’état des ressources disponibles sur le web (ou sur d’autres supports, mais toujours en configuration électronique). Il se voudrait très exhaustif mais en aucun cas ne pourra l’être totalement. Mais la mise en place de cet état permet de poser des questions essentielles pour le monde scientifique : qu’est ce qui est « édité » en « électronique », avec quel degré de qualité de production et de diffusion (de l’édition) ? Les sources anciennes bénéficient-elles vraiment des apports de l’électronique ou bien sacrifie-t-on à des effets de mode ? Quel est l’apport de l’édition électronique, en réalité ? Et, in fine, quelle place pour une nouvelle plate-forme, pour Telma ?1

Les pionniers

Avant toutes choses, il faut revenir aux balbutiements. On me pardonnera de m’appuyer surtout sur des dossiers de sources médiévales et modernes : l’exemple est porteur et ses conclusions peuvent être étendues à d’autres périodes.

Les premiers ensembles de sources de taille importante qui furent versés en format électronique étaient commercialisés et diffusés en CD-ROM2 : le CLCLT du Centre de Traitement Electronique de Documents de l’Université Catholique de Louvain (aujourd’hui intégralement conçu chez Brepols, Turnhout), la Patrologie latine et les Acta Sanctorum édités par Chadwick-Healey… : ce furent les pionniers en la matière et ils popularisèrent chez les historiens l’usage du texte ancien versé en format électronique. Un des pionniers universitaires : le CETEDOC de Louvain-la-Neuve, centre dédié au traitement électronique des sources antiques et médiévales, supprimé en 2001 (et transféré chez Brepols sous l’acronyme CTLO), a conçu plusieurs bases de données lexicales dont une base de données de textes anciens encodés d’après des éditions critiques de qualité : cette base a été publiée sur CD Rom uniquement pendant de nombreuses années, avant d’être maintenant accessible sur le site commercial Brepolis, avec accès payant3. Chadwick-Healey, éditeur commercial pur4, a fait saisir en mode texte l’intégralité de la Patrologia latina, collection d’éditions anciennes de textes patristiques et médiévaux, établie et publiée par l’abbé J.P. Migne entre 1844 et 1855, en 221 volumes5. Après l’avoir exclusivement diffusé pendant des années sur CD-ROM, la base est accessible sur le web, en accès payant. Chadwick-Healey a aussi publié en version électronique les Acta sanctorum de la société des Bollandistes, cette grande entreprise d’édition de textes hagiographiques réalisée depuis le XVIIe s., en 68 volumes couvrant pratiquement tout le calendrier hagiographique6.

La particularité de ces premiers ensembles, réunis dans les années ’80 pour le CETEDOC ou au début des années ’90 pour Chadwick-Healey. Dans le cas du CETEDOC, ce sont des éditions papier de qualité du point de vue scientifique, plus ou moins récentes, qui ont été reprises puis lemmatisées et traitées lexicalement afin de permettre un nombre important d’interrogations sur le corpus. Dans le cas de la Patrologia latina, c’est un corpus de qualité douteuse au départ qui a été traité de manière brute ; de même les Acta sanctorum dont la qualité d’élaboration est, elle, plus importante : mais là aussi, le traitement d’édition électronique a été assez brut : on a confondu texte médiéval et texte de l’éditeur scientifique, ce qui handicape profondément toute requête lexicale.

Il n’empêche, ces quelques corpus publiés alors ont permis à la communauté scientifique de se rendre compte de l’utilité incontestable de l’outil informatique pour l’édition, la diffusion et la recherche sur les sources anciennes. C’est alors que de nombreux projets se mirent à fleurir au cours des années ’90.

Les portails

En 1997, le portail français Ménestrel est créé : il veut rassembler toutes les ressources numériques concernant la médiévistique7. C’est sur le modèle de la Virtual Library History américaine (élargie au monde !) que d’autres pays ont créé leur propre Virtual Library : ainsi les Allemands. Dans chacun des cas, de gigantesques portails où, hélas, sources et travaux sont confondus parfois (ainsi sur le portail Ménestrel), et parfois plus clairement distingués (dans la Virtuelle Bibliothek Geschichte-Mittelalter de Stuart Jenks, par exemple). Pour le Moyen Âge, on verra aussi le portail allemand « mediaevum.de » et le portail ORB (On line reference books for medieval studies) avec ses pages sur les sources médiévales par Paul Halsall 8. On notera aussi l’existence du vieux portail Labyrinth, Resources for Medieval Studies ainsi que la Labyrinth Library9. Les italiens ont eux aussi mis en place leur grand portail national : Reti Medievali.

On notera aussi la présence de certains portails plus spécialisés comme celui dédié à la comptabilité médiévale ou encore ce portail français consacré aux sources en ligne concernant le haut Moyen Âge, très complet10.

Chaque fois des répertoires de liens fort utiles mais pas toujours commentés et n’expliquant pas comment les textes présentés ont été ici édités en ligne.

Ce que les portails nous montrent, c’est la multitude des documents anciens publiés de manière explosée sur le web, plus ou moins gratuitement, plus ou moins nettement, avec une qualité de publication relative, sans que les origines des textes soient toujours clairement indiquées. La plupart des éditions en ligne sont d’ailleurs souvent incomplètes ou en cours et les moteurs d’interrogation bien frustes ; tandis que le format ou la mise en page peuvent être totalement obsolètes (comme les éditions réalisées avec des « frames »). De ce magma bouillonnant, je ne peux dresser le tableau exhaustif, il ne serait d’ailleurs pas d’un grand intérêt. Je retiendrai plutôt les principales éditions électroniques, celles qui valent le détour scientifique, soit par leurs solutions, soit par leurs réussites, soit par leurs faiblesses.

Les répertoires

La publication de sources anciennes sur le web n’est pas si simple11. Beaucoup d’entreprises commencent par publier des répertoires de sources ou des répertoires bibliographiques liés à des sources. C’est le premier pas vers la publication électronique de sources. La aussi, il faut distinguer le répertoire de sources qui reprend de l’information déjà imprimée, tentant d’y ajouter de la valeur scientifique supplémentaire parfois (mais pas toujours) et celui qui reprend l’ouvrage ab ovo. Ainsi les Regesta imperii , liste des témoignages d’archives (et parfois dans des sources littéraires) relatifs aux empereurs romano-germaniques et aux papes, des Carolingiens à Maximilien 1er. Ces ouvrages anciens, publiés au cours du XIXe et du XXe s. en papier, ont été numérisés et scannés en mode texte : les pages des ouvrages peuvent être interrogées et consultées des deux manières. Le répertoire permet en outre l’interrogation d’une base de données bibliographique et de quelques travaux plus originaux, comme cette base de données des reproductions en fac simile de diplomes royaux et impériaux en Europe tout au long du Moyen Âge –mais donnant accès seulement aux reproductions… imprimées. Ou encore ce répertoire des chartes norvégiennes entre 1050 et 1590, en fait la saisie numérique de 21 volumes du Diplomatarium Norvegicum publié entre 1840 et 1972. Chaque fois, un petit moteur de recherche assez complet permet d’accéder à des regestes et des éditions des textes anciennes et souvent fort abrégées. 

Plus novateur est le projet Narrative sources développé par l’université de Gand, l’université Catholique de Leuven et l’Université de Groningue. Un répertoire des sources narratives relatives aux Pays Bas anciens ou provenant de ce territoire, pour le Moyen Âge : outre les traditionnelles coordonnées de lieu et de temps, des indications des manuscrits et des éditions pour chacune des œuvres, on a des indications bibliographiques précieuses et récentes. La structure est un modèle propriétaire Silver Platter mais la base est gratuite d’accès. Elle est considérée comme évolutive et on permet aux utilisateurs de proposer des additions et corrections. De contenu et d’élaboration neuve, c’est un modèle même si son format et si sa présentation sont un peu désuets. 

Outre ces répertoires d’œuvres, on constate sur le web la présence d’un nombre croissant de catalogues de manuscrits ou de catalogues de catalogues de manuscrits, soit des répertoires de manuscrits en ligne, soit des répertoires de liens vers d’autres catalogues de manuscrits, fonctionnant comme des portails en quelque sorte. Quelques exemples intéressants : un site donnant accès à un grand nombre de catalogues de manuscrits numérisés et consultables en mode image (page par page, en jpg)12. Plus sous la forme d’un portail, celui-là donne accès à des dizaines de catalogues de manuscrits en ligne, sur le site de la bibliothèque de l’université de Francfort sur le Main13. Ou encore on remarquera ce très beau portail-catalogue de catalogues de manuscrits autrichiens avec plusieurs modes d’entrée dans les catalogues (par série de sermons, auteurs, initia…)14. Moins médiéval, ce répertoire-portail donnant accès à un nombre impressionnant de sources en lignes concernant l’histoire américaine, de Christophe Colomb à l’an 200015. Malgré tout, un simple portail et aucun moteur de recherche pour accéder plus précisément aux informations.

On comptera aussi avec des projets plus pointus comme la BHLMs qui associe travaux anciens dont on saisit les informations et nouvelle philosophie : la BHL est en quelque sorte « encodée » mais par le biais des manuscrits hagiographiques qui contiennent les vies des saints identifiés, manuscrits repris dans un ensemble de catalogues imprimés épars et rassemblés ici. Il s’agit d’une base multitables relationnelle de type Ms Access. Autre répertoire « thématique », celui concernant les répertoires de manuscrits médiévaux de langue allemande, mis en place à l’université de Marburg : aucun moteur de recherche de qualité, hélas. Ou encore cette base de données d’autographes et d’originaux (c’est-à-dire auxquels les auteurs des œuvres qui y sont transcrites ont participé plus ou moins largement), pour l’Allemagne, publiée en ligne à Münster : elle renvoie chaque fois au manuscrit correspondant, sommairement décrit.

Mis à part ces « portails » et autres répertoires cumulatifs, de nombreux répertoires de manuscrits sont en ligne. Un catalogue cumulatif gigantesque, déjà cité, et muni d’un module d’interrogation assez complet, traite plus de 63000 manuscrits conservés en Allemagne. Un répertoire de fragments de manuscrits allemands conservés en Autriche est publié par Christine Glassner, en format html, sans guère de modules d’interrogation que des listes par auteur ou par cote de manuscrit…16 Pour les Pays Bas, un catalogue des manuscrits conservés aux Pays-Bas ou les concernant est en ligne : le Bibliotheca Neerlandica Manuscripta, créé depuis 1992, doté d’un interface d’interrogation assez simple et donnant accès à des notices courtes : efficace mais sobre. Citons encore rapidement le catalogue de manuscrits suisses, conçu sur le modèle du portail. Le National Union Catalog of Manuscript Collections est, en quelque sorte, un modèle de catalogue cumulatif national, pour les Etats-Unis. Fonctionnant sur le modèle EAD, c’est un entrepôt ouvert. On comptera aussi avec les catalogues de manuscrits conservés en microfilms par des institutions scientifiques comme la Hill Monastic Manuscript Library ou encore la base Medium de l’IRHT.

Les éditions de sources

Quant aux éditions de sources elles-mêmes, il faut reconnaître qu’elles sont très hétéroclites, du moins en qui concerne leur qualité. Revenons au concept même d’édition de source : il s’agit de publier et de diffuser des transcriptions de sources anciennes, prises sur le manuscrit original ou une série de manuscrits approchant l’original au plus près. Ces transcriptions doivent être rédigées de manière à ce que chaque scientifique puisse les lire dans la langue du texte, avec éventuellement une traduction en vis-à-vis, sans devoir décrypter des abréviations, sans avoir à buter sur des problèmes de forme (réglés et explicités par l’éditeur critique dans des notes infrapaginales, renvoyant du texte à la dite note en bas de page, dans l’ « étage de notes » consacré à la critique de forme) ou sur des problèmes de fonds (réglés de même, dans un autre étage de notes, consacré aux explications « historiques » : identification des personnages, des lieux, des événements, des actions juridiques…).

Le plus souvent, ces éditions sont livrées sur papier, éditées en articles ou dans des livres imprimés. Chaque édition critique demande un travail souvent très important : il faut partir des manuscrits recensés et catalogués, lire chacun d’eux et le transcrire, comparer les variantes, établir l’arbre généalogique des manuscrits si l’original n’a pas été conservé (c’est-à-dire dresser le tableau de leurs relations de dépendance, afin de choisir les « meilleurs manuscrits » ou du moins de tenter de comprendre comment le texte original a pu être déformé au fil des copies), puis restituer le texte dans son état original (ou dans un autre de ses états postérieurs), enfin identifier les objets historiques qu’il contient. Un travail tellement lourd qu’il n’est plus effectué que par un petit nombre de chercheurs, philologues ou historiens. Mais considéré comme essentiel par tous. Tellement essentiel que pour ce genre de travail érudit, l’imprimé s’impose comme une presqu’évidence. La labilité potentielle de l’internet fait peur, seul le texte imprimé semble pérenne –vrai et en même temps, on oublie trop souvent que certaines éditions du XVIIe ou XVIIIe s., voire du XIXe siècles, essentielles, ne sont plus conservées qu’en deux ou trois exemplaire consultables en Europe… La peur de l’internet empêche bon nombre de chercheurs de se tourner vers l’édition électronique et ses innombrables avantages en terme d’écho scientifique, d’indexation multiple, d’interrogabilité de qualité, de potentialités d’évolution, de transformation, de correction…

Ces angoisses expliquent le petit nombre d’éditions mises sur le web depuis une dizaine d’années. Je veux dire, d’édition neuves, sricto sensu, qui n’aient pas été précédées par des versions sur papier.

Car des éditions électroniques de textes déjà édités, on en compte des centaines. J’ai déjà cité les pionnières, celles du CLCLT ou de la Patrologie latine ou encore des Acta sanctorum : soit des versions électroniques plus ou moins réussies des versions imprimées, ou encore, pour le CLCLT, une brillante compilation des meilleures éditions de textes patristiques ou médiévaux disponibles. Le Thesaurus diplomaticus est un autre exemple de ce genre de compilation d’éditions de qualité parfois très variable, pour des chartes médiévales avant 1200, sur l’espace belge. Un projet similaire est mis en place pour la France et devrait voir le jour sous les auspices de l’équipe de l’ARTEM/UMR 7002 de Nancy, sous la direction de Benoît Tock17. Les modules de départ sont identiques : une base de données monotable « Idealist » de Blackwell, liant texte, indexation simple (mais suffisante) et éventuellement photographie de la charte, numérisée à posteriori. Ce genre d’édition électronique reste de grande utilité puisqu’elle apporte bien davantage que les versions imprimées éparses : une compilation, des modes d’interrogation multiples et bienvenus, la possibilité de faire des coupes statistiques dans la base, la confrontation de l’image et de l’édition ancienne… Hélas, ces premiers instruments ont été confiés, pour la production et la diffusion matérielle, à des éditeurs privés qui les vendent en CD Rom ou en accès sur le web, à des prix regrettablement prohibitifs.

Bien des anciens textes sont ainsi jetés en pâture aux chercheurs par le biais d’une publication en ligne. Parfois, ce sont des images numérisées des pages des éditions qui sont ainsi données, en fichier PDF : la démarche de recherche est totalement semblable à celle en usage pour les ouvrages en papier : pas d’index mais le repérage via les tomes et pages de l’ouvrage, permettant l’accès aux données. Dans certains cas, le PDF est interrogeable sur une chaîne de caractères, mais bien souvent, ce n’est guère le cas. Ainsi l’exemple de Gallica qui offre gratuitement des éditions de sources anciennes numérisées, comme les fameux Acta sanctorum, mais ici en mode « image ». Ou encore celui des Monumenta Germaniae Historica , cette grande collection de sources allemandes de l’époque médiévale, numérisées complètement -un projet d’édition électronique plus ambitieux, avec des modules de recherche sur le contenu, des textes déjà publié par les MGH, avait été envisagé dès 1994 en partenariat avec Brepols, mais hélas, le projet a tourné court et Brepols supporterait seul, d’après le site des MGH, l’aventure18.

D’autres entreprises ont un faciès complexe, comme la Bibliotheca Augustana , consacrée aux éditions en ligne de textes anciens, quelle qu’en soit la langue. Ce site contient à la fois des liens vers des éditions en ligne existantes, mais aussi des textes d’éditions anciennes numérisées, semble-t-il, à l’instigation de l’auteur, Ulrich Harsch. Un travail de bénédictin, certes, mais dont les fondements sont peu clairs –quels sont les éditions qui ont été numérisées, comment ont-elles fait l’objet d’une reconnaissance de caractère, y a-t-il eu des procédures de révision et de validation a posteriori ? De plus, aucun moteur de recherche ne permet d’enquête, d’autant plus que le texte de chaque source est disponible en html simple. Un travail énorme, certes, gratuit, évidemment, accessible sans difficulté. Mais perdu pour de futures exploitations, dans l’état actuel19.

Mieux réalisé mais sans mode image, cependant davantage potentiellement récupérable pour de futures exploitations, le travail de l’ALIM, Archivio della Latinita Italiana del Medioevo, mené dans le cadre de l’Union académique internationale : il s’agit de mettre en ligne, en libre accès, le texte d’éditions de référence pour des textes latins médiévaux essentiels pour l’Italie. On donne la possibilité à l’utilisateur de télécharger le texte des œuvres en fichiers .doc. Pas de moteur de recherche, malheureusement : c’est simplement un portail donnant accès aux œuvres déjà numérisées et passées à l’OCR (revues et bien corrigées, semble-t-il…) qui permet au chercheur d’entrer dans le corpus.

Avec la même philosophie, le portail scolaire « The Latin Library », mis en place dans une institution américaine au nom évocateur de Ad fontes academy, travaillant sur un Classical Christian Model d’éducation : le portail est, lui, moins « connoté », mais propose des mises en ligne de textes latins antiques et médiévaux, numérisés d’après des éditions anciennes connues dans le meilleur des cas, récupérées sur le web sans autre mention dans le pire…20 Evidemment, aucun moteur de recherche.

Tandis que se mettait en place une entreprise de mise en base de données d’un auguste répertoire indexant et résumant le contenu de registres de lettres pontificales médiévales relatives à la France21, les archives vaticanes décidèrent de numériser tous ces registres et de commercialiser des cd rom de ces numérisations en mode image. Plusieurs centaines de CD Roms sont en vente, à des prix très élevés, pour les registres médiévaux. Aucun mode d’interrogation ne permet de naviguer dans ces images, sinon un déplacement feuille à feuille. Que l’on ne veuille pas transcrire et éditer les actes anciens, cela peut se comprendre ; de même on peut comprendre que les CD Roms coûtent si cher… Mais il serait bon que les deux entreprises, celle d’indexation et celle de numérisation, qui se complètent nécessairement, soient scientifiquement et matériellement couplées.

Ce genre de numérisation en mode image est de plus en plus fréquent, à la manière de Gallica, mais parfois pour des projets plus ponctuels, comme l’Urkundenbuch des territoires médio-rhénans (Mittelrheinischen Territorien), publié en 1860 et numérisé en numérisé en jpg sur des pages html, sans aucun moteur mais avec un mode de déplacement feuille à feuille et partie par partie, sur le site de la Rheinische Landesbibliothek.

D’autres éditions de textes anciens vont heureusement plus loin. On notera la publication en ligne, en accès libre, du corpus iuris canonici de Gratien, d’après l’édition imprimée de Friedberg qui fait référence. Chaque partie est livrée sous format numérisé, en jpg ou en pdf, mais aussi en version texte. Un moteur de recherche avancé permet d’interroger sur des chaînes de caractères en plein texte, dans les titres aussi, mais également de se livrer à des recherches contextuelles (mot distant d’autres mots spécifiés, à une distance décidée par le chercheur). Un très bel instrument.

On notera également l’entreprise « Duderstadt », un projet de numérisation des archives anciennes (jusqu’à 1650) de Duderstadt, mené par le Max-Planck-Institut de Göttingen et le Stadtarchiv de Duderstadt, entre 1996 et 1999. L’ancienneté du programme explique une structure assez désuète, composée de pages HTML et d’une base de données Kleio. Comme pour Telma, deux modes d’interrogation existent : simple et avancé. Il s’agit surtout d’une base de données d’images numériques. L’entreprise ne porte pas ses dix ans d’âge !

Des mises en ligne d’éditions anciennes de chartes médiévales seront bientôt disponibles sous le portail ChaGall –en mode texte seulement ? de même, on ne sait encore quel sera le moteur de recherche et ce qu’il permettra…22.

Quelques éditions au profil similaire à TELMA : Le Progetto Lombardo Archivi in INternet (PLAIN1), sous la tutelle de l’université de Pavie, en accord avec la Regione Lombardia et les archives de l’Etat à Milan a mis en place un espace d’accès aux ressources archivistiques anciennes conservées en Lombardie : des bases de données évolutives sont consultables sur une plateforme numérique sur le web. D’autres ensembles documentaires doivent encore être intégrés à cette plateforme et susceptibles d’être interrogés par des moteurs de recherche communs. Une composante est le Codex diplomatico della Lombardia medievale (secoli VIII-XII) qui vise à rassembler un nombre impressionnantes de textes diplomatiques lombards de ces époque. Structuré en XML, il n’utilise cependant pas la DTD TEI, malheureusement, mais a développé sa propre DTD. Ses modules d’interrogation sont similaires à ceux développés par Telma.

Conclusions

qu’est ce qui est « édité » en « électronique », avec quel degré de qualité de production et de diffusion (de l’édition) ? Les sources anciennes bénéficient-elles vraiment des apports de l’électronique ou bien sacrifie-t-on à des effets de mode ? Quel est l’apport de l’édition électronique, en réalité ? Et, in fine, quelle place pour une nouvelle plate-forme, pour Telma ?

L’exposé pourrait être poursuivi : des centaines d’entreprises du même genre ont fait flores partout dans le monde, révélant des centaines et des centaines de sources différentes, des textes de toute époque et de tout genre, avec une qualité d’édition du médiocre au remarquable. L’évolution de l’édition électronique, car elle existe, est impressionnante : d’entreprises menées voire kidnappées par des maisons d’édition aux objectifs purement commerciaux, de logiciels complexes et vite démodés, de formats propriétaires ou presque, de grammaires de données hétéroclites ou hermétiques, on passe de plus en plus à des entreprises libres, ouvertes, gratuites, interopérables, avec dans l’esprit l’utilisation de standards, la mise en œuvre de grammaires et de dictionnaires communs… Certes, il y a encore du chemin, mais les regards des éditeurs scientifiques convergent de plus en plus dans le même sens : une sorte d’aurore rafraichissante dont les rayons bienfaisants éclaireront tous d’un même éclat.

Il n’empêche : en France, le travail reste encore ardu et la friche en cours. Telma y a sa place, une place centrale, car l’édition électronique sous des formats ouverts, le XML, la TEI, les archives ouvertes sont encore assez balbutiants dans la communauté francophone : le monde français des spécialistes des sources découvre tout cela d’un œil curieux.

Le positionnement de Telma montre combien l’entreprise a une place essentielle : il n’y a guère, à l’heure actuelle, d’expérience française en matière de digital humanities , qui soit mieux aboutie, associant les grands principes fondamentaux d’interopérabilité, de standards, de granularité variable de l’information traitée, de dissémination et d’appropriation des technologies et des savoirs… le tout dans les cadres fondamentaux du logiciel libre et de l’accès libre aux données et aux techniques. Digital humanities : une philosophie de la gestion de l’information numérique, mais aussi de l’étude des relations complexes entre le numérique et les sciences humaines.

C’est aussi dans ce cadre que se place Telma : il apparaît clairement que l’édition numérique modifie nettement la vision du document édité. Certes, les modes d’interrogation du document numérique induisent d’autres questions qui n’avaient pu être posées jusque là… Mais on peut aller plus loin encore : la structuration des sources pour l’édition en format XML – TEI induit de même une modification de l’appréhension du document. En d’autres termes, la source (re- ou dé-) structurée est ainsi passée à un autre crible qu’un questionnaire historien traditionnel et le résultat de cette nouvelle mise en perspective change l’appréhension du chercheur, le mène à une autre vision de la source et à des questions qu’il n’aurait jamais posées autrement.

En effet, l’édition traditionnelle, sur papier, présentait toujours la source de manière séquentielle, avec une sorte de reproduction intellectuelle héritée de la présentation ancienne sur le manuscrit. Ici, le document reproduit de manière électronique est listé, balisé, segmenté, déstructuré (pour mieux en comprendre la structure initiale), déconstruit et reconstruit sans être trahi… On sait depuis longtemps combien est illusoire l’efficacité d’une édition quasi-photographique, qui n’a qu’un seul avantage : rassurer le scientifique. La seule vraie édition est celle qui donne accès à un texte réellement ancien tout en le dotant de mille serrures et de mille clefs données aux chercheurs pour le disséquer, l’analyser, le comprendre de mille et mille façons. L’édition électronique telle que la propose Telma y donne accès, avec des balisages TEI d’une granularité plus ou moins fine, avec la mise en place d’ontologies, avec des modules d’interrogations multiples, avec enfin une interopérabilité entre corpus qui permette des interrogations conjointes…

Telma n’est pas la panacée, certes, loin s’en faut. Mais c’est à l’heure actuelle le fer de lance en matière d’édition électronique de sources historiques manuscrites, en France. Pas de protectionnisme ni de monopole cependant, car Telma appartient à la communauté scientifique toute entière. Telma, tout ouverte, doit nous apprendre à désapprendre, selon les mots de Roland Barthes, et ainsi à chercher à nouveau…

« Nul pouvoir, un peu de savoir, un peu de sagesse, et le plus de saveur possible », voilà ce qui devrait être notre devise et notre leitmotiv23.

Notes

1. Et d’abord, qu’est-ce que l’édition électronique : Christine Ducourtieux, « L’édition électronique en quête de définition(s) », Le Médiéviste et l’ordinateur, 43, 2004 [En ligne] http://lemo.irht.cnrs.fr/43/43-02.htm

2. Voir l’article de R. Pellen, Les CD-ROM pour médiévistes : premiers éléments dune discographiedans Le Médiéviste et l’ordinateur, 28, 1993 [En ligne]: http://lemo.irht.cnrs.fr/28/mo2806.htm.

3. Sur le Cetedoc, voir cette petite introduction aux activités passées du centre. On notera sur la même page quelques mots sur le LASLA de l’Université de Liège, laboratoire travaillant sur l’analyse automatique des langues anciennes, mais n’ayant hélas pas rendu leurs travaux accessibles aisément sur le web. Sur le CLCLT, voir l’accès à Brepolis. Sur Brepolis et sa politique scientifico-commerciale, voir la présentation suivante. : D. Poirel, « Le site Brepolis : compte rendu d’une journée de présentation tenue le 20 novembre 2003 à l’IRHT », Le Médiéviste et l’ordinateur, 43, 2004 [En ligne] http://lemo.irht.cnrs.fr/43/43-07.htm.

4. Une branche de ProQuest.

5. Voir sur la Patrologie les notices de wikipedia en allemand et en anglais. Voir le site de la PL Database ainsi qu’une introduction claire sur le site de la bibliothèque de l’université de Laval au Québec.

6. Voir le site des Acta sanctorum database. Voir la Société des Bollandistes, le lien suivant et sur les Acta sanctorum, celui-ci.

7. http://www.ext.upmc.fr/urfist/mediev.htm

8. http://www.the-orb.net/ ; http://www.fordham.edu/halsall/sbook.html

9. http://www.georgetown.edu/labyrinth/ ; avec surtout des sources littéraires reproduites et parfois traduites.

10. On verra aussi cet autre portail de sources anciennes : http://hbar.phys.msu.su/gorm/chrons.htm

11. Même si certains tentent des listes de manière plus empirique, sur des blogs par exemple : http://affordance.typepad.com/mon_weblog/2006/09/bibliothques_nu.html

12. http://www.manuscripta-mediaevalia.de/hs/kataloge-online.htm. Au départ, c’est un vrai portail ouvert sur le manuscrit médiéval : http://manuscripta.mediaevum.de/index.htm, du plus haut intérêt !

13. http://www.ub.uni-frankfurt.de/webmania/lhsn.html#top et surtout http://www.ub.uni-frankfurt.de/webmania/lhsn.html#kat

14. En version sipple : http://www.oeaw.ac.at/ksbm/k4.htm et plus compliquée: http://www.oeaw.ac.at/ksbm/_k5.htm

15. http://www.vlib.us/amdocs/ . De la même facture et sans réelle unité : http://vlib.iue.it/carrie/

16. Même philosophie pour le catalogue suivant : http://www.ksbm.oeaw.ac.at/kataloge/AT/STB/

17. Voir l’article de M.-J. Gasse-Grandjean, La base de données des chartes originales de l’ARTEM sous Idealist, dans Le Médiéviste et l’ordinateur, 42 (2003), en ligne : http://lemo.irht.cnrs.fr/42/mo42_03.htm ; voir surtout http://www.univ-nancy2.fr/MOYENAGE/Diplomatique/accueil/diplo.htm et http://www.univ-nancy2.fr/MOYENAGE/Diplomatique/accueil/BaseOriginaux.htm.

18. http://www.mgh.de/emgh/ - voir http://www.brepolis.net/info/info_mgh_en.html

19. Même type de travail d’édition hybride : http://hbar.phys.msu.su/gorm/chrons.htm

20. http://thelatinlibrary.com/index.html ; on verra les origines édifiantes de chacun des textes ici : http://thelatinlibrary.com/cred.html.

21. http://www.irht.cnrs.fr/publications/litterae_papales.htm ; http://www.brepolis.net/pl_fr.html ; http://www.brepols.net/publishers/pdf/Papal_letters.pdf.

22. Voir, pour l’instant, http://www.archeologie-cultures-societes.cnrs.fr/recherche/CBMA.htm

23. Roland Barthes, Leçon inaugurale de la chaire de sémiologie littéraire du Collège de France prononcée le 7 janvier 1977, Paris, 1978 (ici, collection "Points", Paris, 1989, p. 45-46.