Archives pour la catégorie Archives en Ligne

Toute l’actu des archives en ligne sur le web. Et les réflexions à ce sujet.

Le Château des Ducs de Savoie à Chambéry, siège de la maison départementale et du conseil général de la Savoie.

A propos de la gratuité des Archives en Ligne

Selon La Revue Française de Généalogie, les archives en ligne du département de la Charente verront leur accès payant via un abonnement : 20€ par mois ou 200€ pour l’année de consultation. Actuellement, seul le Calvados a choisi de faire payer l’accès à ses archives en ligne. Du côté des généalogistes locaux, évidemment, c’est la colère et une pétition proposée par Bruno Rivet a d’ailleurs recueillie 22 586 signatures pour demander la gratuité totale de cette mise en ligne.

En tant que généalogiste amateur, mon avis sur les archives en ligne est simple et a déjà été évoqué dans un précédent billet datant de deux ans mais toujours d’actualité (A propos du débat sur les archives : mon brainstorming) : je souhaite évidemment que les accès en ligne soit gratuits afin que je puisse pratiquer mon loisir facilement. D’un côté plus juridique, Jordi Navarro estime lui que le conseil général de la Charente « se rend coupable d’une appropriation indue d’un bien qui ne lui appartenait pas et participe à la privatisation du bien commun ». Mais tenir un tel discours pourrait avoir un effet pervers : « On ne publie pas parce qu’on n’en a pas les moyens et nous ne serions pas compris/autorisé à faire payer l’accès ». Qui pense au département du Jura ?

Image: 'Look after the pennies and the pounds will look after themselves'  Found on flickrcc.net

Image: ‘Look after the pennies and the pounds will look after themselves’
Found on flickrcc.net

Il faut comprendre que chaque généalogiste a des ancêtres un peu de partout. Payer une licence d’utilisation globale pour la France aurait un certains sens. Mais payer une licence pour rechercher un acte, c’est difficilement envisageable pour l’amateur. Mais je comprends bien qu’il existe d’autres problématiques pour les conseils généraux :

  • La numérisation a un coût
  • La mise en ligne a un coût (par exemple ce site coûte 40€ par an, alors qu’il est tout simple…)
  • La maintenance des serveurs a un coût
  • Le budget du conseil général n’est pas extensible
Image: 'Data centre'  http://www.flickr.com/photos/52725445@N00/2480365594 Found on flickrcc.net

Image: ‘Data centre’
Found on flickrcc.net

Ces problématiques peuvent expliquer pourquoi certains départements ont fait le choix d’un péage numérique pour l’accès aux archives en ligne. C’était ainsi le choix initial du département de la Savoie.

L’exemple étonnant des archives en ligne de la Savoie, où sont cachés les réponses

En 2003, la Savoie faisait payer 10€ de l’heure la consultation des archives en ligne sur internet, puis une baisse des prix en 2006 (forfaits un jour=2€ / 4j=5€ / 30j=30€) avait fait très largement monter l’audience du site. Finalement, en 2012, la consultation était devenue gratuite sous l’impulsion de Pierre-Marie Charvoz, Vice-Président du conseil général de la Savoie en charge de la Culture.

Pour aller plus loin dans ma propre réflexion, je me suis donc rendu dans son bureau à Chambéry afin de comprendre pourquoi dans un premier temps le choix du payant avait été fait puis pourquoi, dans un deuxième temps, le tout-gratuit avait été privilégié.

Le Château des Ducs de Savoie à Chambéry, siège de la maison départementale et du conseil général de la Savoie.

Le Château des Ducs de Savoie à Chambéry, siège de la maison départementale et du conseil général de la Savoie.

Le contre-argument du retour sur investissement

Ardoisières et ardoisiers de Maurienne. Les carrières de Saint-Julien Pierre-Marie Charvoz

Ardoisières et ardoisiers de Maurienne. Les carrières de Saint-Julien par
Pierre-Marie Charvoz

M. Charvoz ne se rappelle plus bien les raisons qui ont poussées la Savoie à rendre dans un premier temps leurs archives en ligne payantes, « certainement un consensus entre les différents élus autour de la table pour amortir l’investissement ». Faire payer l’accès pour obtenir un retour sur investissement ? Pas vraiment ! Le péage numérique des archives en ligne de la Savoie remboursait « une dizaine de pour cent du coût annuel, tout au plus. C’était vraiment peanuts« . Et l’élu a rapidement pu constater, en utilisant les archives en ligne et les archives en salle pour son livre, la problématique des dépenses du chercheur amateur ou professionnel.

D’un point de vue comptable, l’accès payant n’est donc pas vraiment intéressant pour le département et pourtant, il est cher pour l’utilisateur.

Un service public, qui doit être gratuit

Par contre le vice-président se souvient très bien du jour où il a proposé la gratuité du service : « on a bien débattu en conseil sur ce sujet, entre le service du budget et le service de la culture ». Pour lui, « les archives en ligne font partie du service public« , et cela n’a pas de sens d’en faire payer l’accès. Dans son esprit, le parallèle est rapidement fait avec de nombreux autres services publics comme les transports en commun ou les collèges. Certes la généalogie est un loisir pratiqué par une petite partie de la population, mais l’élu déclare aussi que « tous les autres postes de dépenses du conseil général ne s’adressent pas non plus à tous les habitants », « et d’ailleurs le but premier de la communication des archives n’est pas de faire plaisir aux généalogistes, mais de garantir le droit de toute personne à l’information et à la liberté d’accès aux documents administratifs « .

Quand j’ai voulu savoir le nombre d’individus qui utilisaient les archives (en ligne ou en salle) l’élu déclare ne pas connaître les chiffres, très honnêtement, et ne pas connaître non plus l’impact de la gratuité sur la fréquentation du site internet. Mais là n’est clairement pas la priorité pour lui.

« Le Code du Patrimoine dispose que les archives sont communicables de plein droit et la Loi dispose que la consultation est gratuite sur place » selon les conditions d’accès que nous connaissons. Aussi « je considère totalement normal que cela soit de même pour l’accès en ligne ». L’élu ne fait donc pas de distinction entre le contenu (l’information qui doit être publique selon les conditions de la loi) et le type de contenant (numérique ou physique). Et à ce titre, il ne semble pas inquiet par les dernières recommandations de la CNIL qui modifient les délais de mise en ligne du contenant numérique sur internet, ses « services ne l’ayant pas alerté à ce sujet, et la loi prévalant toujours sur les recommandations ». De la même façon, le projet de loi européen sur le droit à l’oubli numérique lui semble totalement aberrant mais il avoue ne pas être très bien au fait de ces deux derniers sujets (et comme moi non plus…).

Un avenir prometteur

Enfin, nous avons évoqué le futur du site internet des archives en ligne de la Savoie qui a, selon l’élu, vocation à recevoir une version numérisée de l’intégralité des documents présents en salle, pour en faire une véritable salle de lecture virtuelle. Cela ravira ses proches, membre de l’association généalogique de la Maurienne.

Logo du programme d'indexation de FamilySearch.org

Indexation, le système FamilySearch

FamilySearch a, semble-t-il depuis quelques années, décidé que l’indexation des documents qu’il a numérisés était une priorité. Pour indexer de façon efficace, exhaustive et systématique, il se base sur trois piliers importants. Une communauté de bénévoles, toujours plus importante, une méthode rodée laissant peu de place aux erreurs et enfin, l’utilisation des nouvelles technologies à bon escient.

Une communauté

La communauté de FamilySearch est composé en partie des membres de l’Église des Mormons et en partie de passionnés de généalogie ou d’histoire. Ce sont ces bénévoles qui, chaque jour, décrypte et indexent les documents de FamilySearch. The Ancestry Insider recense environ 30 000 indexeurs par jour (au mois d’Avril) et plus de 3 000 arbitres. Ainsi ce jour, 33 000 personnes travaillent bénévolement sur les documents de FamilySearch. C’est énorme mais nécessaire car l’ambition de ce site est quand même d’indexer l’Etat Civil du monde entier (voir la liste des projets en cours).

Notons que cette communauté a grandi de façon linéaire depuis janvier jusqu’à la mise en ligne du recensement américain de 1940 le 2 avril, où le nombre de bénévoles a totalement explosé (voir le graphique ci-dessous issus de The Ancestry Insider).

Je crois que faire le choix d’une grande communauté de passionnés est le bon, au contraire de certains sites payants qui choisissent d’embaucher des gens pour indexer des documents qu’ils n’utilisent pas voire dont ils ne comprennent pas l’intérêt. Evidemment se baser sur une communauté nécessite que les documents produits soient disponibles pour cette communauté après, donc une gratuité des documents. C’est je crois le principal défaut du modèle payant en généalogie : ne pas faire participer les passionnés de généalogie aux travaux du site.

Number of indexers and arbritrators for FamilySearch (The Ancestry Insider)

Une méthode

Mais la communauté n’est pas la seule raison du succès du système FamilySearch. A mon sens, leur méthode est très performante.

Les documents à indexer sont séparés en lots (un petit nombre de pages, plus facile à indexer car on voit « le bout » du travail) classés en fonction de la langue, du type de document (recensement, registres paroissiaux, registres d’état civil) et de leur difficulté d’indexation (Niveau Débutant, Moyen ou Avancé). Chaque membre de FamilySearch peut choisir un lot à indexer dans la liste et travaillera en remplissant le formulaire fourni. Ainsi, moi qui débute en paléographie et en indexation, je choisis un lot en français, et de niveau débutant (état civil du XIXè siècle par exemple). C’est vraiment simple et chacun est capable de le faire. Une fois le document rempli, on l’envoie à FamilySearch et le tour est joué.

Pour éviter les erreurs, ils ont mis en place une astuce : chaque lot est donné à deux bénévoles. Une fois le lot terminé, les deux index sont comparés : s’ils sont identiques, c’est validé. S’ils sont différents, un arbitre compare les index, relis le document et corrige. Enfin, notons qu’il existe des administrateurs de groupe, disons des chefs d’une poignée de bénévoles, qui organisent les avancées des travaux.

Ce que je retiens de cette méthode, c’est qu’elle est taillée pour réaliser un travail efficace, exhaustif et sans erreurs. On voit bien que l’objectif numéro 1 de FamilySearch est d’indexer la totalité des documents, les mettre en ligne pour les visualiser semble secondaire. Certains site d’archives départementales en France proposent d’indexer les documents, mais cela de manière non systématique, un peu anarchique et sans forcément vérifier la qualité de l’index créé. C’est dommage parce que je pense que la grande communauté de généalogistes existe aussi en France.

Evidemment, mon souhait de généalogiste amateur en France serait de voir un index total et gratuit de l’Etat civil et des registres paroissiaux français (au mieux, sur un site public). J’aimerais également participer à son élaboration mais les récentes dispositions de la CNIL ne semblent pas aller dans ce sens.

Technique d’indexation de FamilySearch : 1 lot est donné à deux indexeurs. Ceux-ci produisent deux index qui seront comparés et arbitrés pour ne garder qu’une copie propre et sans fautes.

Des moyens

Enfin, Une méthode n’est pas suffisante si on ne met pas à disposition de la communauté les moyens technologiques de réaliser un travail simple et précis. FamilySearch a fait le pari de créer des logiciels qui organisent l’indexation. Et c’est un pari réussi.

Ils proposent tout d’abord un logiciel PC qui permet de télécharger des lots, puis d’indexer très facilement ces lots. Indexation FamilySearch affiche les documents (que l’on peut zoomer, tourner ou modifier les contrastes) et propose des cases à remplir (cf. capture d’écran ci-dessous). C’est enfantin. Et, pour ajouter à la simplicité, chaque élément est mis en surbrillance afin de ne pas se tromper de ligne.

Sur cette capture d’écran d’un lot à indexer que j’ai téléchargé, il me surligne le nom de famille lorsque je dois rentrer le nom de famille. Ici, le recensement d’une ville d’Alabama.

FamilySearch propose aussi d’indexer à partir des smartphones avec leur application FamilySearch Indexing (bêta). Cela reste un gadget mais prouve leur habileté technologique et leur volonté de toucher le plus de monde possible.

Le logiciel d’indexation de FamilySearch est aussi disponible sur Android

Ainsi, on remarque que le site FamilySearch met vraiment les moyens pour que sa grande communauté puisse travailler pour lui de façon efficace (grâce à sa méthodologie) et simple (grâce à ses logiciels). Notons enfin que tous ces index sont disponibles gratuitement pour leur communauté et pour les autres sur leur site (exemple avec le nom de famille BECLE) et peuvent rendre de grands services aux généalogistes amateurs, même français.

3285599824_8124ab31f5 (1)

A propos du débat sur les archives : mon brainstorming

Voilà un débat que je ne suis que de très loin, notamment sur geneinfos. Il est compliqué, alambiqué et fait intervenir de nombreux individus : généalogistes, blogueurs, archivistes, directeurs, sociétés privées, politiques etc. Et comme c’est actuellement en débat, je vais vous livrer ici mon point de vue, très personnel, très naïf aussi sans doute de ce que j’aimerais.

Je ne suis ni un professionnel des archives (comme c’est le cas du blogueur Jordi Navarro par exemple) ni un professionnel de la généalogie (comme certaines sociétés ou revues spécialisées), ni un homme politique. Je suis un simple citoyen amateur de généalogie. Et voilà ce que je pense. Ce que je dirais peut être faux, erroné, irréalisable ou autre. Tant pis, puisque c’est ce que je pense, au moment où j’écris.

Les archives sont la mémoire de l’état français, et doivent être gérées par lui. Je suis favorable à une centralisation des archives. Non pas dans leur localisation géographique – je trouve tout à fait normal que les archives du Vaucluse reste en Avignon – mais dans leur gestion. Ce que j’aimerais en fait est assez simple : une homogénéisation nationale de ce qui est du ressort national. Par exemple, l’organisation interne du service des archives physiques du Vaucluse ne devrait pas être du ressort national, mais local. Par contre, le contenu le devrait. Et la mise à disposition du contenu, notamment sur internet, aussi, ainsi que la « propriété intellectuelle » (si on peut appeler ça comme ça).

Un « mémoire des hommes » des archives

Sur internet, aujourd’hui, il n’y a pas deux services d’archives qui se ressemblent. Entre ceux qui font payer l’accès, ceux qui possèdent des licences de réutilisation, ceux qui n’en possèdent pas, ce qui utilisent une technologie, ceux qui utilisent une autre, et ceux qui ne sont pas en ligne, le gap est immense. Dans la grande famille des différences, on retrouve, pêle-mêle :

  • des archives en ligne / d’autres non
  • des prestataires de service  différents
  • des outils numériques différents
  • des possibilités différentes
  • sur des sites différents, avec des navigations différentes
  • avec des licences de réutilisation différentes
  • des contacts différents

Le tout, pour un même contenu : la mémoire de la France. Evidemment le public peut s’adapter. C’est comme lorsque l’on va dans les salles d’archives, la façon de fonctionner est différente. Mais l’intelligence humaine est suffisante pour comprendre qu’un service unifié, national, simple et efficace serait nettement plus intéressant.

Dans l’idéal, je verrais un site internet, géré par l’Etat, sur les serveurs de l’Etat, qui comprendrait toutes les archives nationales et départementales, en accès libre. Le système de visionnage des archives serait simple, mais suffisant, unique, quelque soit l’archive consultée. Il y aurait des outils collaboratifs pour l’indexation des fichiers, et les images seraient téléchargeables et en JPEG haute définition.

Ce site ressemblerait, dans une certaine mesure, à mémoire des hommes. Cela éviterait les usines à gaz, les outils impossibles à utiliser, les multiples inscriptions sur des sites internet, les ordres et les contre-ordres. Une licence de réutilisation unique serait alors applicable à tout utilisateur. Quand je consulte les archives départementales du Vaucluse, j’ai les mêmes droits et les mêmes devoirs, au même prix, que lorsque j’utilise les archives départementales de la Savoie. Aujourd’hui, ce n’est pas le cas.

Image: 'Contando Dinheiro' http://www.flickr.com/photos/72236935@N00/8228640

Le prix à payer

Aujourd’hui, j’ai le droit de consulter librement et gratuitement les archives en salle de lecture, après inscription. De la même façon, j’aurai le droit de consulter gratuitement ce site internet. Contre une inscription, même une inscription validée par carte d’identité.

Les archives sont une mémoire et doivent être librement consultables. Si des restrictions sont présentes dans les salles de lecture, à propos de la fragilité de certains ouvrages, ou autre, c’est tout à fait normal. Cette restriction ne devrait pas avoir lieu sur internet.

Le coût de tout cela serait payé par l’impôt. Rien d’autre. Au passage, je place le fait que pour moi, un service public n’a pas vocation à être rentable stricto sensu. Il doit être en « déficit » car il est un service, mis à disposition du public, avec un coût.

Image: 'Jacob und Wilhelm Grimm Centrum / HU+Berlin' http://www.flickr.com/photos/67499195@N00/4119691598

Que fait le grand public ?

La même chose qu’en salle. Je dois pouvoir consulter les archives, les copier, les indexer, les annoter dans mon bloc-notes et les utiliser.

Je ne suis pas contre l’interdiction de les copier/publier sur mon site internet. Je peux comprendre ça car elles ne m’appartiennent pas. Par contre, je dois pouvoir y avoir accès très facilement, avec par exemple une URL de destination par acte/image. Je dois aussi pouvoir les copier pour mon utilisation privée, sur mon ordinateur par exemple, et pouvoir les partager dans le cercle familial.

En tout cas, il faut qu’une bonne fois pour toute, on soit clair sur les droits et les devoirs de l’utilisateur.

Que font les entreprises privées ?

Les entreprises privées peuvent-elles vendre les actes de l’Etat civil ? Je réponds non. Par contre, je pense qu’elles devraient avoir le droit de vendre la valeur qu’elles ajoutent. Par exemple, si le site MyHeritage indexe tout l’Etat civil de Frontignan, sans en publier les images, il pourrait très bien demander un abonnement pour avoir accès au moteur de recherche. Les réponses à la requête seraient alors des fichiers html avec le contenu, mais pas la « copie » de l’acte. Un lien renverrait alors vers le site national.

C’est en fait un peu ce que font les associations généalogiques : on cotise pour rentrer et avoir accès aux données de l’association. Sauf que l’association ne propose, évidemment, pas que ça.

Si le site national est suffisamment bien fait, la collaboration permettra d’apporter une valeur ajoutée suffisante pour que ces sites ne soient plus d’une utilité majeure. En tout cas, toute la valeur ajoutée de l’entreprise privée pourra être vendue, tant qu’elle ne vend pas l’acte en lui-même.

Voilà mon idée, mon brainstorming. Evidemment, c’est utopique, et pas forcément réalisable, pas forcément juste, et d’ailleurs je suis tout ouïe pour que l’on m’explique un peu mieux comment cela fonctionne en vrai.