Textus : une solution d’annotation Open Source et collaborative

J’ap­pre­nais il y a quelques semaines (via Dig­i­tal Human­i­ties Inter­na­tion­al) l’ex­is­tence d’un pro­jet impor­tant (annon­cé en décem­bre dernier) dont j’ig­no­rais tout : Tex­tus de l’Open Knowl­edge Foun­da­tion. Impor­tant, en effet, parce qu’il se présente comme une solu­tion d’an­no­ta­tion Open Source déclin­able (le pre­mier à en béné­fici­er devrait ain­si être l’Open Phi­los­o­phy) chargée de fournir aux universitaires/scolaires les moyens de tra­vailler ensem­ble. Ce qui veut dire que des étu­di­ants pour­ront, par exem­ple, mar­quer un texte du domaine pub­lic (textes édités mais aus­si brouil­lons, cor­re­spon­dances, avant-textes, etc.) et exporter leurs anno­ta­tions dans un doc­u­ment PDF, voir com­ment d’autres étu­di­ants l’ont par­cou­ru, ou organ­is­er, sous la coulpe d’un pro­fesseur, de petits groupes de travaux à “l’in­térieur” des marges.

Plate­forme qui s’adresse égale­ment aux chercheurs (ce bil­let du blog de Tex­tus résume bien les enjeux) et dont on mesure tout l’in­térêt en ter­mes d’édi­tion col­lab­o­ra­tive où une équipe pour­rait s’oc­cu­per d’établir une ver­sion cri­tique d’un texte en ligne (pour la tra­duc­tion, voir TLHUB). Plate­forme qui sup­pose des out­ils de mar­quage mais égale­ment de ges­tion pour tri­er les col­lec­tions de textes, les hiérar­chis­er et les faire cir­culer avec la garantie de pou­voir les retrou­ver, comme en témoigne la liste de “User Sto­ries”.

Fonctions et interface

Plus pré­cisé­ment, on pour­ra :

  1. Citer un pas­sage d’un texte avec une url sta­ble.
  2. Télécharg­er un texte.
  3. Exporter ses pro­pres anno­ta­tions d’un texte.
  4. Créer des listes bib­li­ographiques avec des liens.
  5. Accéder à des sec­tions d’un texte à par­tir d’une table détail­lée.
  6. Faire des liens entre des par­ties d’un texte.
  7. Traduire un texte.

L’origine du projet

Le posi­tion­nement de Tex­tus — man­i­feste­ment uni­ver­si­taire — ne peut se com­pren­dre sans l’ex­plo­ration des trans­for­ma­tions dont il a hérité. La plate­forme est une évolution/fusion de deux pro­jets (voir Wikipedia et Slideshare) : Open Shake­speare et Open Cor­re­spon­dance et s’ap­puie sur des solu­tions déjà dévelop­pées (Anno­ta­tor — pour annot­er les pages Web — et Bib­Serv­er — partage de listes bib­li­ographiques). Ces deux ini­tia­tives sont de pre­mières ten­ta­tives pour éval­uer le tra­vail col­lab­o­ratif en ligne entre sci­en­tifiques. Le pro­jet Tex­tus part en effet de trois con­stats (3ème slide de cette présen­ta­tion) :

  1. Des mil­liers de textes du domaine pub­lic évolu­ent sur des plate­formes dif­férentes (Wik­isource, Inter­netArchive, Pro­jet Guten­berg) et gag­n­eraient à être mutu­al­isés (une opéra­tion effec­tuée sur un texte hébergé sur une plate­forme spé­ci­fique n’est en effet éditable que sur cette plate­forme).
  2. Les plate­formes qui per­me­t­tent d’ac­céder à ces textes ne pro­posent pas de méta­don­nées utiles pour la recherche sci­en­tifique.
  3. La plu­part des por­tails publics ne gèrent pas la col­lab­o­ra­tion et l’in­ter­ac­tion autour des textes (d’où le nom choisi pour la plate­forme — “Tex­tus” pour texte” — qui désigne éty­mologique­ment le tis­sage, l’en­trelace­ment)

Un travail de définition

C’est la rai­son pour laque­lle le pro­jet Tex­tus est avant tout un tra­vail de déf­i­ni­tion (Open Book­Marks a déjà échoué dans ce domaine) qui doit déter­min­er la mise en rela­tion tech­nique entre des pro­duc­tions d’ac­teurs. Si, par exem­ple, une anno­ta­tion est définie comme la pro­duc­tion d’une don­née sur un doc­u­ment, il est bien évi­dent qu’il fau­dra bien pou­voir retrou­ver cette don­née, l’archiv­er, la faire cir­culer.

Avec tout ce que cela com­porte comme prob­lèmes, bien iden­ti­fiés par le tra­vail de stan­dard­i­s­a­tion réal­isé par NISO et Inter­netArchive : var­iété des formes de l’an­no­ta­tion (souligner/signaler sans com­menter, etc.), sta­bil­ité des coor­don­nées textuelles dans un univers mou­vant (un texte peut être mis à jour) donc des références accolées et de leur valid­ité. La solu­tion retenue — impar­faite — avait con­sisté à s’ap­puy­er sur l’in­tel­li­gence du lecteur en lui four­nissant une série d’indi­ca­tions, au cas où le texte serait mod­i­fié. Si, en effet, je pro­duis une anno­ta­tion en face d’une par­tie de texte et que cette dernière change d’emplacement suite à un ajout ou à un retrait, l’an­no­ta­tion cor­re­spon­dante per­dra en con­texte. D’où l’idée de fournir des références procé­du­rales, c’est-à-dire de découper le texte en don­nées sta­bles (chapitres, sec­tions, para­graphes, etc.) qui ne souf­friront pas de son évo­lu­tion (un para­graphe peut s’a­grandir à l’in­fi­ni tant qu’il pos­sède un numéro, il peut être cité et retrou­vé). Au lecteur, ensuite, de faire cor­re­spon­dre l’an­no­ta­tion d’un texte qui aurait cir­culé à par­tir d’une url à sa posi­tion ini­tiale dans le texte désta­bil­isé.

À la lec­ture de ce bil­let, on con­state que l’équipe de Tex­tus s’est posé des ques­tions sim­i­laires. Cer­tains util­isa­teurs ont par exem­ple émis le souhait de supprimer/modifier leurs annotations…Or, Tex­tus repose sur la pro­duc­tion d’urls sta­bles, de liens en per­ma­nence vali­dent. Solu­tion trou­vée : le lien sera tou­jours opéra­tionnel mais pré­cis­era que le corps de l’an­no­ta­tion a été supprimé/modifié.

De la même façon, la présence de références procé­du­rales indique le souci de cir­cu­la­tion et de lis­i­bil­ité. La local­i­sa­tion d’un pas­sage de type “20665 à 20782” pren­dra ain­si cette forme : “Sec­tion 1, chapitre 2, para­graphe 12, car­ac­tère 2 à…”. Un tra­vail que refuse bien évidem­ment de faire Ama­zon, qui tente d’im­pos­er ses pro­pres références (les fameux “emplace­ments”) et qui révèle bien que l’un des enjeux des textes numériques est le découpage textuel déter­mi­nant l’ac­cès (et la tra­duc­tion de ce découpage dans des références lis­i­bles, com­préhen­si­bles), vieille tech­nolo­gie apparue aux alen­tours du XIIème siè­cle 1Illich Ivan, Du lis­i­ble au vis­i­ble : La Nais­sance du texte, un com­men­taire du “Didas­cal­i­con” de Hugues de Saint-Vic­tor, Cerf, 1991.sans laque­lle nous ne pour­rions pas nous référ­er à, citer, mais égale­ment con­sul­ter rapi­de­ment, manip­uler, c’est-à-dire faire pren­dre des formes divers­es à un texte. La stan­dard­i­s­a­tion des anno­ta­tions et de ce découpage, qui paraît bien anodine, déter­mine ain­si des enjeux très impor­tants de pou­voir et de con­trôle de la cul­ture qui se traduisent par des ten­ta­tives pour gér­er sa cir­cu­la­tion et sa trans­mis­sion à tra­vers les caté­gories spa­tiales et tem­porelles.

Une anthropologie nécessaire des pratiques

Pour cela, les opéra­tions matérielles, intel­lectuelles et cor­porelles des pra­tiques d’an­no­ta­tions devront être pris­es en compte. Faire l’an­thro­polo­gie de ces pra­tiques, c’est  analyser non seule­ment ce qui s’est inscrit sur un sup­port (un mot, une phrase, un signe, etc.) mais égale­ment la manière dont ce qui s’est inscrit s’est inscrit. Un étu­di­ant peut par exem­ple com­mencer à annot­er sur un ordi­na­teur pour finir sur une tablette ou associ­er écran et papi­er (ce que Tex­tus a bien com­pris avec ses tests util­isa­teurs), utilis­er plusieurs appli­ca­tions (Zotero, Mende­ley). Con­séquence : la plate­forme doit être partout acces­si­ble et fournir l’ex­port des anno­ta­tions. Autre exem­ple : l’u­til­i­sa­tion par­al­lèle d’une édi­tion cri­tique imprimée peut sig­ni­fi­er que le sci­en­tifique cherche à cor­riger l’édi­tion numérique. Con­séquence : pro­pos­er des out­ils de cor­rec­tion, etc.

Une inter­face effi­cace doit ain­si traiter ces gestes et ces straté­gies mais égale­ment un ensem­ble de ques­tions théoriques (ou commence/s’arrête un texte numérique ? Les notes en page de page font-elles dou­blon avec les anno­ta­tions ?; l’an­no­ta­tion est-elle un tag ?; la présence de notes en bas de page a‑t-elle une inci­dence sur la nature des anno­ta­tions ?, etc.) qui posent des prob­lèmes tech­niques (com­ment surlign­er un texte quand l’u­nité est la page et que le pas­sage souligné l’ex­cède ? Doit-on sug­gér­er des tags si l’on con­sid­ère que cer­taines anno­ta­tions ont pour fonc­tion de thé­ma­tis­er un pas­sage ?) ou per­me­t­tent, à l’in­verse, de résoudre des prob­lèmes graphiques (si la note en bas de page prend bien en charge une des fonc­tions de l’an­no­ta­tion, les marges seront désen­gorgées).

Notes   [ + ]

1. Illich Ivan, Du lis­i­ble au vis­i­ble : La Nais­sance du texte, un com­men­taire du “Didas­cal­i­con” de Hugues de Saint-Vic­tor, Cerf, 1991.