Logo du programme d'indexation de FamilySearch.org

Indexation, le système FamilySearch

FamilySearch a, semble-t-il depuis quelques années, décidé que l’indexation des documents qu’il a numérisés était une priorité. Pour indexer de façon efficace, exhaustive et systématique, il se base sur trois piliers importants. Une communauté de bénévoles, toujours plus importante, une méthode rodée laissant peu de place aux erreurs et enfin, l’utilisation des nouvelles technologies à bon escient.

Une communauté

La communauté de FamilySearch est composé en partie des membres de l’Église des Mormons et en partie de passionnés de généalogie ou d’histoire. Ce sont ces bénévoles qui, chaque jour, décrypte et indexent les documents de FamilySearch. The Ancestry Insider recense environ 30 000 indexeurs par jour (au mois d’Avril) et plus de 3 000 arbitres. Ainsi ce jour, 33 000 personnes travaillent bénévolement sur les documents de FamilySearch. C’est énorme mais nécessaire car l’ambition de ce site est quand même d’indexer l’Etat Civil du monde entier (voir la liste des projets en cours).

Notons que cette communauté a grandi de façon linéaire depuis janvier jusqu’à la mise en ligne du recensement américain de 1940 le 2 avril, où le nombre de bénévoles a totalement explosé (voir le graphique ci-dessous issus de The Ancestry Insider).

Je crois que faire le choix d’une grande communauté de passionnés est le bon, au contraire de certains sites payants qui choisissent d’embaucher des gens pour indexer des documents qu’ils n’utilisent pas voire dont ils ne comprennent pas l’intérêt. Evidemment se baser sur une communauté nécessite que les documents produits soient disponibles pour cette communauté après, donc une gratuité des documents. C’est je crois le principal défaut du modèle payant en généalogie : ne pas faire participer les passionnés de généalogie aux travaux du site.

Number of indexers and arbritrators for FamilySearch (The Ancestry Insider)

Une méthode

Mais la communauté n’est pas la seule raison du succès du système FamilySearch. A mon sens, leur méthode est très performante.

Les documents à indexer sont séparés en lots (un petit nombre de pages, plus facile à indexer car on voit « le bout » du travail) classés en fonction de la langue, du type de document (recensement, registres paroissiaux, registres d’état civil) et de leur difficulté d’indexation (Niveau Débutant, Moyen ou Avancé). Chaque membre de FamilySearch peut choisir un lot à indexer dans la liste et travaillera en remplissant le formulaire fourni. Ainsi, moi qui débute en paléographie et en indexation, je choisis un lot en français, et de niveau débutant (état civil du XIXè siècle par exemple). C’est vraiment simple et chacun est capable de le faire. Une fois le document rempli, on l’envoie à FamilySearch et le tour est joué.

Pour éviter les erreurs, ils ont mis en place une astuce : chaque lot est donné à deux bénévoles. Une fois le lot terminé, les deux index sont comparés : s’ils sont identiques, c’est validé. S’ils sont différents, un arbitre compare les index, relis le document et corrige. Enfin, notons qu’il existe des administrateurs de groupe, disons des chefs d’une poignée de bénévoles, qui organisent les avancées des travaux.

Ce que je retiens de cette méthode, c’est qu’elle est taillée pour réaliser un travail efficace, exhaustif et sans erreurs. On voit bien que l’objectif numéro 1 de FamilySearch est d’indexer la totalité des documents, les mettre en ligne pour les visualiser semble secondaire. Certains site d’archives départementales en France proposent d’indexer les documents, mais cela de manière non systématique, un peu anarchique et sans forcément vérifier la qualité de l’index créé. C’est dommage parce que je pense que la grande communauté de généalogistes existe aussi en France.

Evidemment, mon souhait de généalogiste amateur en France serait de voir un index total et gratuit de l’Etat civil et des registres paroissiaux français (au mieux, sur un site public). J’aimerais également participer à son élaboration mais les récentes dispositions de la CNIL ne semblent pas aller dans ce sens.

Technique d’indexation de FamilySearch : 1 lot est donné à deux indexeurs. Ceux-ci produisent deux index qui seront comparés et arbitrés pour ne garder qu’une copie propre et sans fautes.

Des moyens

Enfin, Une méthode n’est pas suffisante si on ne met pas à disposition de la communauté les moyens technologiques de réaliser un travail simple et précis. FamilySearch a fait le pari de créer des logiciels qui organisent l’indexation. Et c’est un pari réussi.

Ils proposent tout d’abord un logiciel PC qui permet de télécharger des lots, puis d’indexer très facilement ces lots. Indexation FamilySearch affiche les documents (que l’on peut zoomer, tourner ou modifier les contrastes) et propose des cases à remplir (cf. capture d’écran ci-dessous). C’est enfantin. Et, pour ajouter à la simplicité, chaque élément est mis en surbrillance afin de ne pas se tromper de ligne.

Sur cette capture d’écran d’un lot à indexer que j’ai téléchargé, il me surligne le nom de famille lorsque je dois rentrer le nom de famille. Ici, le recensement d’une ville d’Alabama.

FamilySearch propose aussi d’indexer à partir des smartphones avec leur application FamilySearch Indexing (bêta). Cela reste un gadget mais prouve leur habileté technologique et leur volonté de toucher le plus de monde possible.

Le logiciel d’indexation de FamilySearch est aussi disponible sur Android

Ainsi, on remarque que le site FamilySearch met vraiment les moyens pour que sa grande communauté puisse travailler pour lui de façon efficace (grâce à sa méthodologie) et simple (grâce à ses logiciels). Notons enfin que tous ces index sont disponibles gratuitement pour leur communauté et pour les autres sur leur site (exemple avec le nom de famille BECLE) et peuvent rendre de grands services aux généalogistes amateurs, même français.

Related Posts Plugin for WordPress, Blogger...

2 réflexions sur “ Indexation, le système FamilySearch ”

  1. Bonjour Clotilde,

    Je ne souhaitais pas opposer deux types de sites, commerciaux et non commerciaux. Il y a du bon et du mauvais de partout, des deux côtés.
    Pour ce qui est de l’indexation, je crois par contre que je peux comparer les deux méthodes (mêmes si elles ne sont pas exclusives l’une à l’autre ni rattaché à un type de site) et je trouve qu’il y a plus de bon dans la méthode participative avec une communauté très impliquée. Déjà intellectuellement, c’est plus intéressant je crois pour le « consommateur », mais également pour le site qui bénéficie ainsi d’une image très positive.

    Mon avis.

  2. Bonjour Clément,
    l’indexation collaborative est effectivement une manière tout à fait pertinente d’ouvrir davantage la consultation des documents d’archives au grand public.
    Je me permets néanmoins de préciser un point : il me semble en effet dommage d’opposer deux méthodes (indexation collaborative bénévole et indexation professionnelle payante) alors qu’elles me semblent au contraire complémentaires.Sur notre site, même s’il appartient à la catégorie « commerciale », les deux démarches sont proposées: ainsi le Projet des Archives Mondiales (http://community.ancestry.fr/awap) permet de faire participer les passionnés de généalogie aux travaux d’indexation de certains documents d’archives de grande valeur (comme en ce moment des fiches électorales du début du 20ème siècle sur la France entière) tout en garantissant la gratuité des données ainsi indexées au grand public. Le système fonctionne de la même façon (double indexation pour faire apparaître d’éventuelles erreurs, logiciel à télécharger pour indexer les images en mode offline, etc…).
    Cordialement,
    Clotilde de Mersan

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Vous pouvez utiliser ces balises et attributs HTML : <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>