Introduction

Les logiciels de généalogie sont au cœur de notre pratique généalogique. Ils permettent de centraliser les informations généalogiques trouvées et d’élaborer de nouvelles pistes de recherche. Ils sont si importants que notre façon de travailler est parfois modelée par l’ergonomie du logiciel de généalogie1.

En 2015, Heredis équipait la moitié des généalogistes francophones2. Deux autres acteurs sortaient du lot : Généatique (qui semblait perdre des parts de marché entre 2012 et 2015) et Geneweb (logiciel de Geneanet) semblant lui, au contraire, progresser sur la même période3.

J’ai pensé en début d’année qu’il était désormais temps de réactualiser cette étude, et d’ajouter des éléments permettant d’améliorer sa qualité et de mieux comprendre les habitudes des généalogistes.

Cette nouvelle étude vise donc à répondre aux deux questions suivantes :

  1. Quels sont les logiciels de généalogie les plus utilisés en 2017 ?
  2. Quels sont les sites sur lesquels les généalogistes publient le plus les résultats de leurs recherches en 2017 ?

Pour comprendre

Une étude donne toujours des résultats, et des résultats qui sont toujours vrais. Cependant, une étude s’interprète et on ne peut pas tout faire dire aux statistiques. Dans ce paragraphe, j’essaye de façon la plus simple et la plus claire possible (merci d’ailleurs à François Frémeau pour sa relecture bienveillante) de vous donner les clefs pour mieux interpréter et donc mieux comprendre cette étude.

Cela dit, cette partie reste quand même un petit peu technique, et je comprendrais bien que vous souhaitiez plutôt aller directement aux résultats.

Aller directement aux résultats

Revenons donc à nos moutons, et présentons un peu le type d’étude et les difficultés qu’elle génère pour que vous puissiez bien interpréter les résultats. L’étude présentée dans cet article est une photographie prise à un moment donné. Les paragraphes ci-dessous tenteront de vous éclairer sur les sujets suivants :

Une photographie ?

La méthodologie de cette étude est celle d’une étude descriptive transversale, c’est-à-dire qu’il s’agit d’une “photographie” à un instant t des usages généalogiques d’une population définie. C’est la façon même de mener l’étude qui contraint cela. On recueille des données à un instant t et puis on ne réalise pas de suivi pour savoir si vous avez modifié vos habitudes.

Par contre, de la même façon que l’on peut comparer deux photographies séparées de plusieurs années pour mettre en évidence une évolution de l’individu photographié, il est également possible de comparer plusieurs études descriptives transversales menées sur plusieurs années pour dégager une tendance de l’évolution des usages au fil du temps. La seule condition, c’est que le “Qui ?”, donc la population étudiée (ou photographiée), soit la même (ou une population ayant des caractéristiques comparables).

Le plus facile : Quand ?

Cette étude descriptive transversale a été menée entre les mois de février et de mars 2017.  Au sens strict, elle n’est donc déjà plus valable au moment de la publication des résultats, certains généalogistes ayant peut-être changé de logiciel entre temps. Cela dit, on peut se dire que cet arrêt sur image sera valable pour l’année 2017.

Comment ?

Les données ont été recueillies à l’aide d’un sondage disponible en ligne entre le 6 février 2017 et le 31 mars 2017. Les données ont été analysées à l’aide d’un logiciel dédié aux statistiques, IBM SPSS Software, début avril 2017 par un seul intervenant, qui n’est pas un spécialiste des statistiques.

Cela doit vous alerter sur plusieurs choses : d’abord l’étude ne peut répondre qu’aux questions présentes dans le sondage, cela parait évident mais parfois on a envie de faire des déductions logiques qui, d’un point de vue purement statistique, seront fausses. Ensuite, je ne suis pas un expert des statistiques, ni des sondages d’opinions, ni de rien de tout ça. Du coup, tout ce qui est dit ici est forcément sujet à caution, rien n’ayant été validé par un véritable expert. Si je me trompe dans l’interprétation, personne ne me dira que je me suis trompé…

Le plus dur : Qui ?

On annonce des résultats, OK, mais pour qui sont-ils valables ?

C’est la question la plus difficile dans ce type d’étude. On le voit tous les jours en période électorale : des sondages annoncent des “résultats”, mais sont-ils réellement représentatifs des électeurs ? Et s’ils sont représentatifs des inscrits sur les listes électorales, comment être sur qu’ils vont être représentatifs de ceux qui vont effectivement se déplacer pour voter le Jour-J ? Un casse-tête sans fin.

Pour aborder la problématique dans notre contexte, et pour que vous ayez une idée précise de la population pour qui nous pourrons effectivement extrapoler les résultats, il faut que je vous présente trois populations différentes, mais liées : La population “cible” , la population “source” et l’ “échantillon” analysé.

population cible source echantillon

On rappelle également notre question principale : “Quels sont les logiciels de généalogie les plus utilisés en 2017 ?” Sous entendu par “les généalogistes” . “Les généalogistes” est donc la population “cible” à laquelle on aimerait pouvoir extrapoler les résultats. Tous les généalogistes de la planète, et même au-delà.

Le meilleur moyen pour y arriver serait d’interroger tous les généalogistes de la planète, mais, évidemment, c’est impossible.

La seule alternative est donc d’étudier un échantillon de cette population “cible”. Mais un échantillon, ça se prend quelque part, ça se prend dans ce que l’on appelle une population “source” (c’est la “source” qui fournit l’échantillon).

Idéalement, il faudrait que la population source soit la même que la population cible. C’est possible quand on connait précisément la population cible, par exemple tous les inscrits sur les listes électorales d’une commune. Si je veux faire un échantillon représentatif de la liste, il suffit de tirer au hasard un certains nombre d’individus de la liste. Cette liste est alors la cible (on veut un échantillon représentatif de cette liste) et la source (on constitue l’échantillon depuis cette liste).

Dans notre cas, c’est impossible, il n’existe pas de fichier international de tous les généalogistes. Donc population cible et population source sont deux populations forcément différentes et ainsi notre échantillon ne pourra pas être représentatif de la population “cible” , mais ne sera représentatif que de la population “source” .

Les résultats ne peuvent donc pas s’appliquer à tous les généalogistes.

D’autant plus que le “Comment ?” (un sondage en français, publié en ligne, dont l’adresse URL était diffusée sur les réseaux sociaux puis relayée à partir d’un seul compte twitter ou facebook, le mien) sélectionne énormément la population source qui peut prétendre répondre au sondage :

  • Une population Francophone (sondage en français)
  • Une population connectée (sondage en ligne)
  • Une population en contact (de près ou de loin) avec moi

Les résultats ne peuvent donc s’appliquer qu’à cette population source, qui ne possède pas de caractéristiques connues. On ne sait pas qui compose cette population source de façon certaine.

Et c’est pourquoi j’ai demandé dans le questionnaire que l’on renseigne des informations démographiques pour pouvoir définir les contours de cette population source étudiée : âge, sexe, lieu de résidence, pour avoir une idée globale du “Qui ?” est sur la photographie.

J’ai donc pris le problème en sens inverse : j’ai défini les caractéristiques de mon échantillon, et je ne peux parler que pour cet échantillon-là. Éventuellement, maintenant que les caractéristiques de cet échantillon sont connus, on pourrait extrapoler les résultats à toute population qui partage exactement ces caractéristiques. Et encore, ce serait pas forcément juste d’un point de vu mathématique.

Pour résumer :

Je sais que la façon de poser la question sélectionne la population que j’étudie : la population que j’étudie n’est pas la communauté de tous les généalogistes, et je ne peux pas extrapoler mes résultats à tous les généalogistes.

J’ai défini les caractéristiques des généalogistes de l’étude pour savoir quel est le profil du généalogiste qui a répondu au sondage, pour avoir une idée du “Qui ?”.

Cet échantillon de généalogistes qui a répondu au sondage est, par sa taille, représentatif des généalogistes qui sont susceptibles, de lire cet article. Ainsi, ces résultats vous correspondent. C’est une évidence statistique. Et c’est la seule chose dont on soit sûr.

Le Quoi ?

Ce que je cherche à évaluer principalement est très simple :

  1. Le logiciel principal utilisé par chaque répondeur
  2. les sites sur lesquels chaque répondeur dépose le fruit de ses recherches

L’analyse statistique permet d’étudier des usages secondaires (si vous utilisez Heredis, quelle version est utilisée ? Le profil des généalogistes utilisant Heredis est-il différent de celui des généalogistes utilisant Geneanet ?). En gardant toujours à l’esprit que les analyses secondaires sont fait sur un échantillon d’un échantillon : ils sont donc forcément moins fiables que les questions principales !

Ainsi, cette étude permet de savoir quels sont les logiciels de généalogie les plus utilisés entre février et mars 2017 par les généalogistes qui sont susceptibles de lire ce blog (francophones, connectés, et dans “mon” réseau de généalogistes étendus).

Les Résultats

Les caractéristiques des généalogistes répondeurs

Nous venons de voir précédemment que la seule chose dont on soit sûr concernant les répondeurs, c’est qu’ils correspondent aux lecteurs du blog (donc qu’ils vous correspondent). Entre février et mars 2017, 1039 généalogistes ont répondu à notre sondage. Parmi ces généalogistes :

  • 55,7% sont des hommes
  • 91,1% résident en France
  • et l’âge moyen est de 55 ans

Le plus jeune généalogiste a 13 ans et le plus expérimenté, 88. Les dames sont discrètement plus jeunes que les messieurs. Le groupe “France” partage exactement les mêmes caractéristiques que le “Total”, ce qui fait que tous les chiffres mentionnés dans cette étude sont également valables pour le groupe “France” (Infographie 1). A l’inverse, les résultats ne sont pas extrapolables aux autres pays mentionnés, car le nombre d’individus de ces groupes est trop faibles pour en tirer des conclusions.

Infographie 1 : Les caractéristiques des Généalogistes

Les logiciels de généalogie les plus utilisés en 2017

Sans surprise, c’est de nouveau le logiciel Heredis qui est le logiciel le plus utilisé par les généalogistes en 2017 : il équipe la moitié (49,9%) des généalogistes. Suivent ensuite Généatique très loin derrière (13,8%) et Geneanet (13,3%) (Tableau 1 et Infographie 2).

Infographie 2 : Les logiciels de Généalogie les plus utilisés en 2017

Tableau 1 : Tous les Logiciels Utilisés par les Généalogistes
Logiciels Fréquence Pourcentage
Ages! 1 0,1%
Ahnenblatt 1 0,1%
Ancestris 84 8,1%
Ancestrologie 11 1,1%
Ancestromania 2 0,2%
Ancestry online 4 0,4%
BasGen 1 0,1%
Brother’s Keeper 5 0,5%
ELIE 14 1,3%
Family Tree Builder 20 1,9%
Family Tree Maker 3 0,3%
Familysearch.org 3 0,3%
Filae 8 0,8%
GAOPerso 4 0,4%
GEDitCOM 1 0,1%
Geneanet 138 13,3%
Geneatique 143 13,8%
Geneweb (local) 4 0,4%
Geni.com 2 0,2%
GenoPro 2 0,2%
Gramps 17 1,6%
Heredis 518 49,9%
Le Genealogiste Deluxe – Micro Application 6 0,6%
Legacy Family Tree 2 0,2%
Logiciel Maison 1 0,1%
MacFamilyTree 3 0,3%
MacGenealogie 1 0,1%
Microsoft Excel 3 0,3%
MyHeritage online 3 0,3%
ohmiGene 3 0,3%
PAF 5 0,5%
Pas de Logiciel 4 0,4%
Reunion for Mac 3 0,3%
The Next Generation of Genealogy Sitebuilding 1 0,1%
Visual Genealogie 1 0,1%
Webtrees 14 1,3%
Win Genealogic 2 0,2%
Winfamily 1 0,1%
Total 1039 100%

L’évolution entre 2012 et 2017 (Tableau 2 et Infographie 2) est marquée par :

  • Une parfaite stabilité de la part de marché d’Heredis
  • Une baisse constante et progressive de la part de marché de Généatique
  • Une égalité quasi parfaite entre Geneanet et Généatique
  • L’arrivée d’un quatrième acteur significatif : Ancestris. En effet, quasi inexistant il y a cinq ans, il représente actuellement 8% du parc logiciel généalogique (il est néanmoins possible d’une surestimation de leur part de marché au vu d’une anomalie statistique un peu complexe à détailler ici).
Tableau 2 : Évolution de la part de marché des principaux logiciels de généalogie entre 2012 et 2017
Logiciels 2017 2015 2012
Heredis 49,9% 51,3% 48,2%
Geneatique 13,8% 17,9% 20,0%
Geneanet 13,3% 15,7% 11,8%
Ancestris 8,1% 0,5% NC
Autres 15,0% 14,6% 20,0%

D’un point de vue démographique, les utilisateurs d’Heredis sont parfaitement dans la moyenne de l’étude (Tableau 3 et Infographie 2). Ce sont donc majoritairement des hommes (54%) de 55 ans. Ils sont très fidèles à leur logiciel car 83% disposent d’une version récente, c’est-à-dire de moins de deux ans (Tableau 4A). Les utilisateurs de Généatique sont un peu plus âgés peut-être, et sont eux aussi particulièrement fidèles (76%) à leur logiciel (Tableau 4B). Les utilisateurs de Geneanet, par contre, sont plus jeunes (51 ans) et majoritairement des femmes (60%) quand les utilisateurs d’Ancestris sont des hommes (88%) d’environ 60 ans (Tableau 3 et Infographie 2).

Tableau 3 : Caractéristiques Démographiques selon les logiciels
Nombre Hommes Femmes Âge Moyen
Heredis 518 280 238 55,1
49,9% 54,1% 45,9%
Geneatique 143 70 73 58,2
13,8% 49,0% 51,0%
Geneanet 138 55 83 51,6
13,3% 39,9% 60,1%
Ancestris 84 74 10 59,7
8,1% 88,1% 11,9%
Autres 156 100 56
15,0% 64,1% 35,9%
Total 100,0% 55,7% 44,3% 55,0

Tableau 4 : Version utilisés des logiciels Heredis (A) et Geneatique (B)

A

Version N %
Heredis 2017 Windows 235 45%
Heredis 2015 142 27%
Heredis 2017 pour Mac 55 11%
Heredis 2014 34 7%
Heredis 11 15 3%
Heredis 12 8 2%
Heredis 13 8 2%
HEREDIS v.10 7 1%
non communiqué 7 1%
Heredis 9 3 1%
Heredis 2001 1 0%
Heredis 7 1 0%
Heredis 98 1 0%
Heredis Mac X.3 1 0%
Heredis 2016 0 0%

B

Version N %
Généatique 2017 64 45%
Généatique 2016 44 31%
Généatique 2014 12 8%
Généatique 2015 12 8%
Généatique 2013 5 3%
Généatique 2011 2 1%
non communiqué 2 1%
Généatique 2010 1 1%
Généatique 2012 1 1%

Les sites de généalogie sur lesquels les généalogistes publient le plus leurs résultats de recherches en 2017

Geneanet est le site le plus utilisé pour le partage de son arbre généalogique. En effet, 78% des généalogistes l’utilisent (Tableau 5 et Infographie 3). Suivent ensuite Heredis Online (23%), Filae (7.8%) et Généatique (7,4%).

Mais ce qui est surtout intéressant à analyser, c’est que les utilisateurs d’Heredis Online et de Généatique sont quasiment exclusivement des utilisateurs des logiciel Heredis (93%) et Généatique (81%) respectivement et que l’importance de ces sites est donc essentiellement due à la popularité de leurs logiciels. En réalité, ils ne fédèrent pas au-delà du cercle des utilisateurs du logiciel (Infographie 3).

Notons également que plus de 11% des généalogistes ne partagent par leurs arbres généalogiques créés (ce que je trouve dommage personnellement) et 3,3% des généalogistes ont décidé de créer leur propre site internet de partage (Infographie 3).

Infographie3 : Les sites de généalogie sur lesquels les généalogistes publient le plus leurs résultats de recherches en 2017

Entre le moment de l’étude et la publication des résultats, Laurent Monpouet a réalisé une étude similaire sur son blog de généalogie4. La méthodologie était un peu différente, mais les résultats sont globalement corroborés. On retrouvait Geneanet large leader (91%) suivi d’Heredis Online (13%) et de Filae (9%). Les principales différences viennent de la part d’utilisateurs utilisant MyHeritage (10% dans son étude contre 2.1% dans la mienne) et FamilySearch (5% dans son étude contre 0,8% dans la mienne) qui sont probablement liées à des différences de nos groupes initiaux. Mais la tendance reste tout de même équivalente, avec un Geneanet hégémonique.

Tableau 5 : Les sites sur lesquels vous partagez votre généalogie
 Site N %
Geneanet 811 78,1%
Heredis Online 242 23,3%
Aucun 117 11,3%
Filae 81 7,8%
Geneatique 77 7,4%
Site personnel 34 3,3%
Ancestry 19 1,8%
MyHeritage 22 2,1%
Autres 11 1,1%
FamilySearch 8 0,8%
Ancestris 6 0,6%
Geni 5 0,5%
WikiTree 4 0,4%
Brother’s Keeper 2 0,2%
Geneachtimi 2 0,2%

Conclusion

Heredis reste le logiciel principal de la moitié des généalogistes, stable sur 5 ans. Geneatique continue sa baisse de part de marché et est rejoint par Geneanet à un peu plus de 13%. En ce qui concerne le partage généalogique, c’est sur Geneanet (septième plus gros site de généalogie mondial5 ) que près de 80% des généalogistes partagent leurs généalogies. Les autres sites internet sont très loin derrière.

Remerciements

Merci aux 1039 généalogistes qui ont répondu au sondage, c’est super cool de votre part.
Une mention spéciale à François Frémeau qui a relu la partie “Pour Comprendre” et qui m’a aidé à être compréhensible. J’espère que c’est réussi.
Une mention spéciale à Claire Roubey qui a relu et corrigé à de très nombreuses reprises toutes mes infographies et qui m’a poussé à faire ce que je pouvais faire de mieux. J’espère que c’est réussi.

Références

  1. De la science des cases, publié le 22 janvier 2015 par C.Bècle sur genbecle.org []
  2. Logiciels de généalogie les plus utilisés en France en 2015, publié le 9 février 2015 par C.Bècle sur genbecle.org []
  3. Logiciels de Généalogie les plus utilisés en 2012, publié le 18 mars 2012 par C.Bècle sur genbecle.org []
  4. Sur quel(s) site(s) publiez-vous votre arbre généalogique ?, publié le 16 mars 2017 par L.Monpouet sur genealogiepratique.fr []
  5. Top 100 Genealogy Websites of 2016, publié sur GenealogyInTime Magazine []