tree

Deux start-ups françaises de généalogie prometteuses : #1 Gennus.org

La philosophie des start-up du net est assez simple : une idée = une entreprise (se résumant le plus souvent à quelques employés, un serveur internet, un site, et de l’huile de coude). Et des idées dans le monde de la généalogie, gennus.org et brozer.fr en ont de bonnes.

logo de gennus.org
logo de gennus.org

Gennus.org, une ambition d’arbre généalogique universel, mondial, gratuit, amélioré par la communauté.

La première start-up que je souhaite présenter c’est gennus.org. Actuellement en phase de développement bêta (donc de tests et d’amélioration quotidienne, dans une version instable) ce site est ambitieux. Le projet démarre en janvier 2011 quand Pierre et Bastien commencent à s’intéresser à leurs généalogies. Ces deux informaticiens souhaitent proposer un service innovant de généalogie à base de matching : en mettant en ligne mon arbre généalogique via un import gedcom, gennus.org me proposera un matching (un individu similaire d’un arbre d’un autre utilisateur) que je pourrai valider ou non. Il me proposera ensuite d’enrichir mon arbre avec les données des autres internautes. Mais Pierre et Bastien vont encore plus loin : ils veulent créer un arbre universel de qualité sur une plateforme mondiale (donc multilangue) gratuite et sans utilisation commerciale des données. Quelle ambition ! Mais sans elle, point de travail acharné.

arbre universel gennus.org
L’arbre universel, un vieux fantasme de généalogiste bien plus compliqué à mettre en place qu’il n’y parait.

La qualité de ce service s’évaluera à mon avis sur plusieurs points :

1) La qualité du matching, c’est-à-dire de la pertinence des propositions d’individus similaires. J’ai récemment (suite à cet article) réfléchi à cette problématique qui est compliquée : comment savoir que deux individus sont identiques vu les variations possibles d’écriture de patronymes, des prénoms, des métiers, des dates (et la gestion de calendriers différents), des lieux de vie, des conjoints potentiels etc. J’en était arrivé à une question presque philosophique : « qu’est-ce qui définit un individu ? ». Autant dire que je m’étais perdu dans ma propre réflexion. Pris sous un angle différent, cette problématique se résume à une reconnaissance efficace des doublons dans la base de donnée. Sur ce sujet, Heredis se casse les dents (la gestion des doublons dans ma généalogie est catastrophique), geneanet a du mal, seul MyHeritage propose des SmartMatchs a peu près cohérents. C’est la création de cet algorithme de « gestion des doublons » qui est le cœur de métier de Pierre et Bastien. La qualité du site sera principalement définie par la pertinence des matchings, et donc par la qualité de l’algorithme. Voilà comment travaille l’algorithme : En fait, ce n’est pas seulement l’individu qui est analysé, mais tout son environnement, ce qu’il est mais également ce qu’il a vécu, ses parents, ses conjoints, ses enfants. Pierre nomme cela une empreinte. Dans un premier temps, il faut extraire toutes les empreintes de chaque arbre en ligne, puis l’algorithme compare les empreintes une à une; enfin le site propose les empreintes similaires à l’utilisateur concerné et les soumet à la validation de l’humanae intelligentiae, car c’est bien l’utilisateur qui a le dernier mot et décide si « son » Jean Martin est le même que celui proposé par l’algorithme.

Un algorithme très puissant donc, qui intégrera de nombreuses variables, simulant l’intelligence et la réflexion du généalogiste quand il travaille sur son arbre. Et cet algorithme sera affiné tous les jours par les actions de la communauté.

L'algorithme, difficile à mettre en place, mais indispensable au succès de gennus.org
L’algorithme, difficile à mettre en place, mais indispensable au succès de gennus.org

2) La qualité des données mises en ligne sur le site : en effet, si les données mises en ligne sont fausses, on me proposera des données fausses pour enrichir ma généalogie qui deviendra… fausse également. Bref ce point est crucial et j’avoue qu’une longue discussion récemment avec Pierre sur ce sujet m’a largement rassuré. En effet, le service proposera un système d’authority rank, c’est-à-dire que les arbres et les généalogistes se verront attribuer une « note » de qualité. Par exemple, je m’inscris sur le site avec une généalogie petite, mais complète, bien sourcée, et dont les informations sont fiables : ma généalogie sera bien notée, mon arbre fera autorité parmi les autres. Ainsi si une généalogie X similaire de mon arbre voit le jour sur le site comprenant des erreurs (un cousin moins assidu dans ses recherches, un co-pilleur d’arbre comme sur geneanet) , gennus.org comprendra grâce à mon autorité élevée que mon arbre est plus fiable que celui de M. X. Et les matchings que proposera le site se feront principalement à partir de mes données plutôt que celles de X.

En sera-t-il alors fini des erreurs de généalogie qu’on voit se propager sur tous les arbres geneanet, dont on ne sait plus trier le bon grain de l’ivraie ? Pas si sur, mais nous le verrons à l’usage.

3) La qualité de l’import gedcom : le généalogiste est un passionné, qui aime parfois le labeur des listes et des relevés exhaustifs. Mais le généalogiste n’aime pas devoir faire plusieurs fois la même chose. Ainsi l’import gedcom devra être propre et exhaustif quel que soit le logiciel qui a généré le gedcom. Vu que la norme gedcom est ancienne, vu qu’aucun logiciel ne respecte parfaitement la norme gedcom, vu que les calendriers utilisés peuvent varier, ce travail d’import propre devra être prédominant. C’est d’ailleurs cela qui est principalement analysé dans cette première version bêta.

La communauté, ciment de l'algorithme pour faire marcher gennus.org
La communauté, ciment de l’algorithme pour faire marcher gennus.org

4) La qualité de la communauté : il semble évident à ce stade que gennus.org sera un site communautaire, et nécessitera de nombreuses actions des utilisateurs pour s’affiner, progresser et devenir une référence. Sans une communauté active, efficace et nombreuse, l’algorithme ne s’affinera pas, le nombre de données sera faible et le service rendu inutile. Gennus revendique dans sa version bêta1.0  35 testeurs pour 25.000 fiches créées qui éprouvent chaque jour la plateforme. 250 généalogistes seraient en attente d’un accès pour la prochaine version d’essai.

L’ambition des créateurs de ce site va plus loin : pourquoi ne pas créer un arbre universel de qualité en intégrant les données des meilleures généalogies du site ? Plusieurs grands acteurs se sont déjà cassés les dents sur un tel projet, mais le système d’autorité avec des arbres de grande qualité et des généalogistes fiables pourrait surmonter les problématiques que rencontrent actuellement les grands sites participatifs.

Enfin, je dois signaler que la philosophie du site me plait : une interface qui promet d’être lisible, claire, rapide et simple (« à la google » dira Pierre Ammeloot) le tout propulsé par un site gratuit, sans publicité, sans but lucratif et sans réutilisation commerciale des données (qui a dit wikipédia ?).

Le financement du site devrait se faire via le fundraisings : les utilisateurs de ce service gratuit pourront effectuer des dons à gennus. Mais la participation au site ne sera pas uniquement financière : tous les utilisateurs pourront s’impliquer activement si le coeur leur en dit (traduction, aide, …) et participer à l’amélioration de gennus.org.

Pour en savoir plus :

  1. Demander des informations à pierre@gennus.org 
  2. S’inscrire à la bêta 2 sur gennus.org et espérer être sélectionner pour tester le service
  3. lire une interview de Pierre Ammeloot sur le blog ami rhit-genealogie.blogspot.fr

15 réflexions sur “ Deux start-ups françaises de généalogie prometteuses : #1 Gennus.org ”

  1. Que de bruits pour pas grand chose. Tout ce qui passe par le web peut atterrir n’importe où,et être copié à loisir.Geneanet est et doit rester participatif, cela peut ne pas plaire mais tout un chacun peut retirer son Arbre et se faire éditer à compte d’auteur. Quant à se moquer de la qualité du français employé, c’est petit et méchant. Mon arbre en ligne a été visité 345 fois, j’ai reçu un mel. Aucun jaunisse ne s’est déclaré. Si je retire mon arbre aujourd’hui c’est pour le remplacer par un autre,corrigé, et plus complet. et si on profite de mes données, tant mieux elles sont là pour ça. Ciceron disait » L’esprit des morts consiste à survivre dans l’esprit des vivants ». C’est presque une définition de la généalogie. Bien à vous et bonnes recherches.

  2. J’utilise les arbres d’Ancestry pour ma branche québécoise, les smartmatches permettent de trouver les sources rapidement, si l’on regarde de près Ancestry se repose sur les sources internes à elle, alors c’est assez simple pour Ancestry de trouver les bonnes correspondances.

    J’utilise maintenant à 80% MyHeritage où là aussi les smartmatches sont assez puissants, la gestion des doublons pas mal efficace et la gestion des médias qui me plait aussi, on peut identifier les individus aisément, création d’arbre papier aisée, etc. J’abandonne doucement Heredis (les 20% restants) qui pour moi ne va pas dans la bonne direction, à chaque nouvelle version on voit apparaître des modules bancals, une gestion minimale des médias, gestion des doublons catastrophique, un changement de gestion des lieux qui ne me convient plus, etc. la liste est longue.

    Je suis curieux de voir Gennus, je l’ai dit ailleurs, difficile de connaître exactement le contenu à part de se faire dirigé vers le blog de Rhit, curieuse méthode de la part du concepteur. Je m’attendais à ce qu’il y ai des informations (en français) sur le site lui-même, non ? Je me méfie toujours des annonces externes à grande pompe  »chat échaudé … » Apparemment le site est passé en phase bêta 3, ce qui laisse présager une version  »release » avant la fin d’année ?

    Une chose que j’aimerai voir dont peu de logiciels utilisent ou soit peu efficaces (je n’en connais qu’un seul qui le fait très bien) : c’est la mise à jour des données par importation du fichier gedcom mis à jour.

    Verra-t-on un jour une liste des possibilités avant l’ouverture du site ?

    1. Salut Hervé,

      Je crois que la communication de gennus est calme car le projet est de longue haleine. Il serait dérangeant de leur part de promettre la lune et de ne pas pouvoir l’assumer. Ils restent probablement un peu dans l’ombre afin de ne décevoir personne. Pour avoir longuement discuté avec Pierre par téléphone hier, je pense que je résume assez bien les fonctions qu’ils vont proposer sous peu. Certes la page d’accueil du site laisse perplexe (comme celle de brozer.fr par ailleurs, que j’essaye actuellement) mais les idées et l’envie sont bien réelles.

      Peut-être auront nous droit à une ouverture privée sur modèle d’invitation à l’automne ? Peut-être serez-vous candidat à la prochaine bêta ? Je l’espère.

    2. Je suis assez d’accord avec toi, mais publiciser son offre sur Twitter des mois à l’avance devant une telle communauté généalogique, il faut s’attendre avec beaucoup de questions.

      Si tu connais l’adresse courriel de l’auteur, propose-lui une correction du texte de la page d’accueil ;-)

      … a new unique service which consistS …

    3. Bonjour Hervé,

      Merci pour la coquille c’est maintenant corrigé.

      Le lancement d’un nouveau service est délicat.
      Il faut communiquer pour commencer à se faire connaitre alors que le service n’est pas encore terminé (nous avons démarré le développement en janvier 2011, c’est à dire il y a 2 ans 1/2 ce qui est long à l’échelle du Web).
      En même temps nous ne pouvons pas trop en dire afin d’éviter les effets d’annonce qui ne serait pas suivi d’acte concret.

      Je comprend votre frustration mais soyez sûr que nous travaillons main dans la main avec les généalogistes qui accompagnent le projet afin que ce soit un outil adapté aux besoins des généalogistes.

      Si vous le souhaitez nous pouvons discuter ensemble de vos attentes par email, Skype ou téléphone. Je vous écouterais avec grand plaisir car j’aime avoir des retours sur les usages de chacun.

      Une fois que nous aurons fait un peu plus connaissance je pourrais vous donner un accès à la version bêta.

      Je ne souhaite pas le faire avant pour plusieurs raisons :
      – la version actuellement en ligne à des défauts de jeunesse que nous connaissons déjà (ils ont déjà été remonté par nos 30 testeurs) et nous avons besoin de temps pour corriger cela. Inutile d’avoir 100 testeurs de plus qui vont nous remonter la même chose.
      – la version actuellement en ligne n’est pas encore fonctionnelle à 100%, par exemple les algorithmes de « matching » n’ont pas encore été activé. Car nous concentrons actuellement nos efforts sur la simplification de l’interface et la correction des bugs de la bêta 1. Je vous rassure ils seront activé prochainement quand le reste seras stable.

      Nous préférons avancer pas à pas afin de faire les choses correctement.

      Je reste joignable par email à pierre@gennus.org ou par téléphone (voir le DM que je vient de vous envoyer).

      A bientôt,
      Pierre

    4. Bonjour Pierre,

      merci pour votre réponse, je vais regarder votre message en détail plus tard cette fin de semaine, long congé de 3 jours !

      Aucun souci pour la coquille, mais si vous voulez respecter la langue de Shakespeare, revoyez aussi la ponctuation : jamais d’espace avant la double ponctuation ;) et pour la dernière phrase, j’aurai vu une interrogation, toujours sans espace avec le point d’interrogation :

      Building our common genealogy!
      (do you) Want to be the first one to use Gennus?

  3. Il y a en effet eu de nombreux essais d’arbre universel, de la base roglo à l’arbre « pierfit » sur Geneanet (truffé d’erreurs soit dit en passant), et de nombreux soucis demeurent. Comment choisir entre Marguerite de Bavière et Margarete von Bayern ? Comment choisir entre Faivre, Fèvre, Feivre, etc… Quel sera l’orthographe du patronyme qui sera choisie ?

    En revanche, le côté joli arbre clean « à la Google » me plaît vraiment. Je vais surveiller l’évolution de pèrs.

    1. Salut François,
      toute la complexité et le travail à fournir sera là : comprendre que Marguerite de Bavière est Margarete von Bayern. Je sais qu’ils ont déjà étudier le problème, en allant même plus loin : les alphabets différents (cyrillique en premier lieu). C’est beaucoup de travail, j’espère qu’ils arriveront à leur fin car c’est très prometteur. Leur réalisation sera-t-elle à la hauteur de leur ambition et de notre espérance ?

    2. Bonjour,

      Comme je l’ai expliqué hier au téléphone à Clément nous avons bien sur pris en compte ces éléments et notre algorithme gère ce genre de cas de figure. Même si le nom et le prénom sont différents nous sommes capable d’effectuer des rapprochements entre les personnes car nous nous appuyons sur un ensemble de critère permettant de créer une empreinte fiable.
      Notre algorithme est dit « auto-apprenant » c’est à dire que plus vous lui donner d’information plus il sera capable de vous ressortir des « match » pertinent.

      Pour le côté « joli arbre clean « à la Google » » c’est le but, pour le moment nous avons encore un petit peu de travail de ce côté là. ;-)

      Au plaisir d’échanger avec vous,
      Pierre

  4. Merci Clément pour cet article de qualité sur notre service. Cela nous motive encore plus à continuer le développement de la plateforme.

    Au plaisir d’échanger avec tes lecteurs et de répondre à toutes les questions.

    Pierre

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée.

Vous pouvez utiliser ces balises et attributs HTML : <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>