La philosophie des start-up du net est assez simple : une idée = une entreprise (se résumant le plus souvent à quelques employés, un serveur internet, un site, et de l’huile de coude). Et des idées dans le monde de la généalogie, gennus.org et brozer.fr en ont de bonnes.

logo de gennus.org
logo de gennus.org

Gennus.org, une ambition d’arbre généalogique universel, mondial, gratuit, amélioré par la communauté.

La première start-up que je souhaite présenter c’est gennus.org. Actuellement en phase de développement bêta (donc de tests et d’amélioration quotidienne, dans une version instable) ce site est ambitieux. Le projet démarre en janvier 2011 quand Pierre et Bastien commencent à s’intéresser à leurs généalogies. Ces deux informaticiens souhaitent proposer un service innovant de généalogie à base de matching : en mettant en ligne mon arbre généalogique via un import gedcom, gennus.org me proposera un matching (un individu similaire d’un arbre d’un autre utilisateur) que je pourrai valider ou non. Il me proposera ensuite d’enrichir mon arbre avec les données des autres internautes. Mais Pierre et Bastien vont encore plus loin : ils veulent créer un arbre universel de qualité sur une plateforme mondiale (donc multilangue) gratuite et sans utilisation commerciale des données. Quelle ambition ! Mais sans elle, point de travail acharné.

arbre universel gennus.org
L’arbre universel, un vieux fantasme de généalogiste bien plus compliqué à mettre en place qu’il n’y parait.

La qualité de ce service s’évaluera à mon avis sur plusieurs points :

1) La qualité du matching, c’est-à-dire de la pertinence des propositions d’individus similaires. J’ai récemment (suite à cet article) réfléchi à cette problématique qui est compliquée : comment savoir que deux individus sont identiques vu les variations possibles d’écriture de patronymes, des prénoms, des métiers, des dates (et la gestion de calendriers différents), des lieux de vie, des conjoints potentiels etc. J’en était arrivé à une question presque philosophique : “qu’est-ce qui définit un individu ?”. Autant dire que je m’étais perdu dans ma propre réflexion. Pris sous un angle différent, cette problématique se résume à une reconnaissance efficace des doublons dans la base de donnée. Sur ce sujet, Heredis se casse les dents (la gestion des doublons dans ma généalogie est catastrophique), geneanet a du mal, seul MyHeritage propose des SmartMatchs a peu près cohérents. C’est la création de cet algorithme de “gestion des doublons” qui est le cœur de métier de Pierre et Bastien. La qualité du site sera principalement définie par la pertinence des matchings, et donc par la qualité de l’algorithme. Voilà comment travaille l’algorithme : En fait, ce n’est pas seulement l’individu qui est analysé, mais tout son environnement, ce qu’il est mais également ce qu’il a vécu, ses parents, ses conjoints, ses enfants. Pierre nomme cela une empreinte. Dans un premier temps, il faut extraire toutes les empreintes de chaque arbre en ligne, puis l’algorithme compare les empreintes une à une; enfin le site propose les empreintes similaires à l’utilisateur concerné et les soumet à la validation de l’humanae intelligentiae, car c’est bien l’utilisateur qui a le dernier mot et décide si “son” Jean Martin est le même que celui proposé par l’algorithme.

Un algorithme très puissant donc, qui intégrera de nombreuses variables, simulant l’intelligence et la réflexion du généalogiste quand il travaille sur son arbre. Et cet algorithme sera affiné tous les jours par les actions de la communauté.

L'algorithme, difficile à mettre en place, mais indispensable au succès de gennus.org
L’algorithme, difficile à mettre en place, mais indispensable au succès de gennus.org

2) La qualité des données mises en ligne sur le site : en effet, si les données mises en ligne sont fausses, on me proposera des données fausses pour enrichir ma généalogie qui deviendra… fausse également. Bref ce point est crucial et j’avoue qu’une longue discussion récemment avec Pierre sur ce sujet m’a largement rassuré. En effet, le service proposera un système d’authority rank, c’est-à-dire que les arbres et les généalogistes se verront attribuer une “note” de qualité. Par exemple, je m’inscris sur le site avec une généalogie petite, mais complète, bien sourcée, et dont les informations sont fiables : ma généalogie sera bien notée, mon arbre fera autorité parmi les autres. Ainsi si une généalogie X similaire de mon arbre voit le jour sur le site comprenant des erreurs (un cousin moins assidu dans ses recherches, un co-pilleur d’arbre comme sur geneanet) , gennus.org comprendra grâce à mon autorité élevée que mon arbre est plus fiable que celui de M. X. Et les matchings que proposera le site se feront principalement à partir de mes données plutôt que celles de X.

En sera-t-il alors fini des erreurs de généalogie qu’on voit se propager sur tous les arbres geneanet, dont on ne sait plus trier le bon grain de l’ivraie ? Pas si sur, mais nous le verrons à l’usage.

3) La qualité de l’import gedcom : le généalogiste est un passionné, qui aime parfois le labeur des listes et des relevés exhaustifs. Mais le généalogiste n’aime pas devoir faire plusieurs fois la même chose. Ainsi l’import gedcom devra être propre et exhaustif quel que soit le logiciel qui a généré le gedcom. Vu que la norme gedcom est ancienne, vu qu’aucun logiciel ne respecte parfaitement la norme gedcom, vu que les calendriers utilisés peuvent varier, ce travail d’import propre devra être prédominant. C’est d’ailleurs cela qui est principalement analysé dans cette première version bêta.

La communauté, ciment de l'algorithme pour faire marcher gennus.org
La communauté, ciment de l’algorithme pour faire marcher gennus.org

4) La qualité de la communauté : il semble évident à ce stade que gennus.org sera un site communautaire, et nécessitera de nombreuses actions des utilisateurs pour s’affiner, progresser et devenir une référence. Sans une communauté active, efficace et nombreuse, l’algorithme ne s’affinera pas, le nombre de données sera faible et le service rendu inutile. Gennus revendique dans sa version bêta1.0  35 testeurs pour 25.000 fiches créées qui éprouvent chaque jour la plateforme. 250 généalogistes seraient en attente d’un accès pour la prochaine version d’essai.

L’ambition des créateurs de ce site va plus loin : pourquoi ne pas créer un arbre universel de qualité en intégrant les données des meilleures généalogies du site ? Plusieurs grands acteurs se sont déjà cassés les dents sur un tel projet, mais le système d’autorité avec des arbres de grande qualité et des généalogistes fiables pourrait surmonter les problématiques que rencontrent actuellement les grands sites participatifs.

Enfin, je dois signaler que la philosophie du site me plait : une interface qui promet d’être lisible, claire, rapide et simple (“à la google” dira Pierre Ammeloot) le tout propulsé par un site gratuit, sans publicité, sans but lucratif et sans réutilisation commerciale des données (qui a dit wikipédia ?).

Le financement du site devrait se faire via le fundraisings : les utilisateurs de ce service gratuit pourront effectuer des dons à gennus. Mais la participation au site ne sera pas uniquement financière : tous les utilisateurs pourront s’impliquer activement si le coeur leur en dit (traduction, aide, …) et participer à l’amélioration de gennus.org.

Pour en savoir plus :

  1. Demander des informations à pierre@gennus.org 
  2. S’inscrire à la bêta 2 sur gennus.org et espérer être sélectionner pour tester le service
  3. lire une interview de Pierre Ammeloot sur le blog ami rhit-genealogie.blogspot.fr