De la plume d'oie au Deep learning

Nous avons parcouru un sacré chemin depuis l'époque où les griots africains mémorisaient des généalogies entières ou que les moines copistes retraçaient laborieusement les lignées royales. Aujourd'hui, l'Intelligence Artificielle s'invite dans nos recherches généalogiques, apportant avec elle une révolution comparable à l'invention de l'imprimerie pour la diffusion du savoir.

Mais comment l'IA transforme-t-elle concrètement la pratique de la généalogie ? Attachez vos ceintures, nous partons pour un voyage dans le futur de la recherche généalogique !

Tout d'abord, il faut dire que c'est grâce à (ou à cause de, c'est selon) la numérisation des ressources que l'IA peut opérer. En effet, L'intelligence Artificielle est la capacité d'un ordinateur ou d'un robot à effectuer des tâches associées à l'intelligence humaine, telles que le raisonnement, la prise de décision, et l'apprentissage à partir de données. Elle fonctionne par définition à partir de ressources numériques.

Le deep learning est une sous-catégorie de l'IA qui utilise des réseaux de neurones artificiels pour reconnaître des motifs dans les données, similaires à la manière dont le cerveau humain fonctionne.

 

La reconnaissance d'écriture : déchiffrer l'indéchiffrable

Nous connaissons ces moments de frustration intense devant un acte de mariage du XVIIIe siècle, écrit par un curé dont la calligraphie ressemble plus à des pattes de mouche qu'à des lettres ? L'IA vient à notre rescousse ! Grâce à des algorithmes de reconnaissance d'écriture manuscrite de plus en plus performants, comme ceux développés par des entreprises telles que Google ou Microsoft, il devient possible de transcrire automatiquement ces documents anciens. Un des premiers exemples est le projet Transkribus, lancé par l'Université d'Innsbruck, qui utilise l'IA pour transcrire des documents historiques, mais qui est un peu dépassé actuellement.

Comment en est-on arrivé déjà si loin ? Plusieurs projets en France ont déjà exploré l’utilisation de l’IA dans la généalogie. Ils mettent en œuvre l’IA pour la reconnaissance de l’écriture manuscrite, la transcription automatique, la rétro-conversion des inventaires et l’analyse des évolutions démographiques. Le principe est bien sûr d'apprendre à l'ordinateur ce qu'il doit utiliser, à l'aide d'exemples. Un grand nombre d'exemples. Les Archives nationales avaient choisi par exemple de cibler leurs efforts en la matière sur les répertoires de notaires, les Archives départementales de la Côte d’Or avaient privilégié les registres des décrets des États de Bourgogne et le projet Socface se consacrait exclusivement aux listes nominatives de population de 1836 à 1936. L'un des plus récents est celui des Archives de Belfort, en collaboration avec l'entreprise Teklia, qui consistaient à travailler sur des délibérations du Conseil Municipal entre 1790 et 1946. Ces projets sont animés par des femmes et des hommes qualifiés et volontaires pour entrer face aux images des registres concernés le texte (numérique) transcrit grâce à leur expérience paléographique.

Et s'il n'y avait plus besoin de nous arracher les cheveux devant le nom de notre arrière-arrière-grand-mère écrit à la va-vite par un officier d'état civil pressé, quand l'IA le déchiffrerait pour nous en un clin d'œil ?

Le logiciel Généatique 2025, pionnier dans ce domaine, intègre déjà des fonctionnalités d'aide à la transcription basées sur l'IA : la pré-transcription par l'IA de tout document visuel (Voir le tuto ici). L'IA analyse l'image du document ou une partie précise de l'image d'un document avec l'OCR (reconnaissance des caractères) et propose une pré-transcription complète, permettant de découvrir des détails inédits sur la vie de nos aïeux. Pourquoi « pré » transcription ? Si vous avez testé la fonction, vous aurez constaté que cela marche très bien pour les actes facilement lisibles, mais moins bien pour les écritures moins lisibles. En conséquence, un généalogiste sérieux ne peut pas encore accepter ce résultat comme valable, sans vérifier lui-même et effectuer à la main les corrections nécessaires. Et oui, la correction humaine est encore nécessaire. Dans quelques années, elle le sera peut-être moins, mais je pense que mon contrôle sur ces résultats sera toujours intéressant. L'idée n'est pas de déléguer complètement à l'IA cette tâche difficile et un peu longue mais de lui faire faire la partie « bête » du travail, puis de faire le plus intéressant ensuite.

L'IA pourra sans doute bientôt aussi reconstituer des mots manquants ou illisibles, grâce à des techniques de traitement d'image avancées. 

Et l'étape suivante est l'analyse de contenu, quand l'IA peut extraire automatiquement des noms, des dates et des lieux à partir de documents numérisés...

 

 

La traduction automatique : briser la barrière de la langue

Notre ancêtre était un avocat polonais qui a fini par s'installer en France ? Pas de panique ! Les outils de traduction basés sur l'IA, comme DeepL ou Google Translate, peuvent nous aider à comprendre ces documents en langues étrangères. Ces systèmes, qui utilisent des réseaux de neurones profonds, sont capables de traduire des textes entiers en conservant le contexte et les subtilités linguistiques. Fini le temps où nous devions jongler entre un dictionnaire polonais-français et un cours de grammaire russe pour comprendre l'acte de naissance de notre aïeul ! Enfin presque... Parce que l'IA propose et je dispose, pour les langues que je connais bien. Quant à celles que je connais mal ou pas du tout, je suis bien obligée d'accepter directement la proposition de DeepL....

 

Analyse et production de contenu 

Déjà aujourd'hui, une simple requête sur un moteur génératif d'IA (comme Le Chat, ChatGPT, Perplexity, ou Gemini) vous permettra d'obtenir du contenu exclusif, dont nous avons aussi l'utilité en généalogie. L’IA peut fournir des informations sur le contexte historique, social et économique dans lequel vivaient nos ancêtres. Cette analyse contextuelle est intéressante, et l'obtenir directement sans avoir à consulter le moindre livre d'histoire contribuera certainement à diffuser ces connaissances.

Une autre des nouveautés de l'IA dans Généatique 2025 est la création de contenu pour les notices de prénoms, lieux, régions et métiers que vous pourriez avoir envie de faire pour ajouter un peu d'épaisseur à vos travaux de généalogie. L'IA opère alors à votre demande, sur une notice spécifique, pour proposer une première version de contenu correspondant à la notice. (Voir le tuto ici). Là encore, il convient de vérifier de près le texte produit, et de l'arranger selon vos goûts. De toute façon, je vous conseille de prendre quelques minutes pour y ajouter des images. L'IA vous fait gagner du temps, surtout pour ceux qui souffrent un peu du syndrome de la page blanche...

Enfin, l'IA peut aider sérieusement en matière de Visualisation de données, notamment avec la création de cartes interactives et de chronologies pour mieux comprendre notre histoire familiale.

 

 

L'analyse prédictive : l'IA devient détective

L'IA ne se contente pas de lire et traduire, elle peut aussi faire des déductions dignes de Sherlock Holmes ! Grâce à l'analyse prédictive, les algorithmes peuvent suggérer des pistes de recherche en se basant sur les données existantes. Par exemple, si nous cherchons la trace d'un ancêtre disparu, l'IA pourrait analyser les tendances migratoires de l'époque, les registres de recensement et d'autres données historiques pour suggérer des lieux où il aurait pu s'installer. C'est comme avoir un détective privé virtuel à notre service !

De plus, l'IA rend la généalogie accessible à tous, même à ceux qui n'ont pas de formation en histoire ou en archivistique. Avec des outils conviviaux et intuitifs, n'importe qui peut se lancer dans l'aventure généalogique. Votre cousin, qui n'a jamais touché à un registre de sa vie, décide de s'intéresser à la généalogie. Grâce à une application alimentée par l'IA, il peut commencer à construire son arbre généalogique en quelques clics, sans se sentir dépassé par la complexité de la tâche.

Généatique a déjà un onglet qui donne des pistes de recherches intelligentes en fonction de ce que l'on sait déjà sur un ancêtre. Qui sait, peut-être que dans quelques années, il pourra prédire l'emplacement exact de la ferme où cet ancêtre a vécu !

 

Le Big Data généalogique : quand l'IA jongle avec les ancêtres

Avec des millions de généalogistes partageant leurs arbres en ligne, nous sommes face à un véritable déluge de données généalogiques. C'est là que le Big Data entre en jeu, main dans la main avec l'IA. Des sites comme MyHeritage ou Ancestry utilisent déjà des algorithmes d'apprentissage automatique pour analyser ces vastes ensembles de données et suggérer des connexions entre les arbres généalogiques. Ancestry annonce utiliser l'IA pour traiter environ 10 pétaoctets de données, incluant 30 milliards d'enregistrements. C'est comme si l'IA jouait à un gigantesque puzzle familial à l'échelle mondiale !

En effet, l'IA peut analyser des montagnes de données en un clin d'œil. Pensez à tous ces registres de naissance, de mariage et de décès qui prennent la poussière dans les archives. L'IA peut parcourir les versions numérisées de ces documents à la vitesse de l'éclair, repérant des noms, des dates et des lieux qui correspondent à votre arbre généalogique. C'est comme avoir une armée de petits lutins qui travaillent sans relâche pour nous. L'IA peut scanner des milliers de pages de registres et vous sortir toutes les occurrences du nom que vous recherchez en quelques secondes. Plus besoin de passer des heures à plisser les yeux devant les registres numérisés !

Imaginons que nous entrions le nom de notre grand-père dans le système, et en quelques secondes, l'IA nous proposerait ensuite une liste de cousins potentiels basée sur l'analyse de millions d'arbres généalogiques. C'est la promesse d'une généalogie collaborative à grande échelle !

 

La colorisation et la restauration d'images : donner vie au passé

Et pour une vieille photo en noir et blanc de notre arrière-grand-mère, tellement abîmée que nous pouvons à peine distinguer ses traits ? L'IA vient encore une fois à votre secours ! Des outils comme Pica.AI ou Colorize CC ou les fonctionnalités de colorisation de Palette.fm ou de MyHeritage utilisent des réseaux antagonistes génératifs (GAN) pour coloriser et restaurer les vieilles photos. L’IA peut améliorer la qualité des photos anciennes, restaurer les couleurs et même « compléter » des parties abîmées ou manquantes. Le résultat ? Des images du passé qui semblent avoir été prises hier ! Quelle émotion de voir pour la première fois la couleur des yeux de notre aïeule ou la teinte exacte de sa robe de mariée. C'est comme ouvrir une fenêtre sur le passé et le voir en technicolor !

Mon astuce pour utiliser des sites de restauration gratuits sur Internet : procéder par itérations successives. Envoyer votre photo de départ sur le site, télécharger la première amélioration, renvoyer ce premier résultat pour une nouvelle amélioration et télécharger la seconde amélioration. Etc... Si vous n'avez besoin de ce type de service qu'occasionnellement, cela vous permettra d'économiser quelques euros.

 

 

 

L'IA et les tests ADN : le mariage de la génétique et de l'algorithmique

Les tests ADN généalogiques ont déjà révolutionné la façon dont nous explorons nos origines. Mais l'IA pousse cette révolution encore plus loin. Des entreprises comme 23andMe utilisent des algorithmes d'apprentissage automatique pour analyser les données génétiques et fournir des informations de plus en plus précises sur nos origines ethniques et nos liens de parenté. L'IA intervient à la fois sur l'interprétation des résultats de tests ADN pour identifier des liens familiaux et des origines ethniques, et sur la prédiction de relations familiales potentielles basées sur des correspondances génétiques.

Il parait aussi que l'IA peut prédire l'apparence de vos ancêtres basée sur notre ADN ! C'est fou de pouvoir « voir » à quoi ressemblait notre ancêtre du XVIe siècle. C'est presque de la science-fiction, non ?

 

Les chatbots généalogiques : des assistants personnels pour la recherche d'ancêtres

Et si nous avions un assistant virtuel spécialisé en généalogie, disponible 24/7 pour répondre à nos questions et nous guider dans nos recherches. C'est ce que promettent les chatbots basés sur l'IA, comme AI Record Finder de MyHeritage. Ces assistants virtuels pourraient nous aider à planifier nos recherches, nous rappeler les dates importantes, et même nous suggérer des ressources pertinentes en fonction de nos centres d'intérêt généalogiques. « Hé, Assistant Généalogique ! Quelles sont les archives à consulter pour trouver la trace de mon ancêtre boulanger à Lyon au XIXe siècle ? ». Et hop, en quelques secondes, nous avons une liste détaillée des ressources à explorer !

 

La réalité virtuelle et augmentée : voyager dans le temps depuis notre salon

Et si nous pouvions littéralement marcher dans les pas de nos ancêtres ? Avec la réalité virtuelle et l'IA, ce rêve pourrait devenir réalité. On enfile un casque VR et on se retrouve à Aubers, un des villages de mes ancêtres, reconstruit en 3D grâce à l'analyse de cartes et documents historiques par l'IA, devant le très ancien et très vénéré Tilleul du Joncquoy près du hameau du Pommereau. Ou bien je pourrais utiliser la réalité augmentée sur mon smartphone pour superposer des informations historiques sur le monde réel lors de mes visites généalogiques. « Tiens, c'est ici que mon arrière-grand-père tenait son magasin de couleurs ! » pourrions-nous nous exclamer en pointant notre téléphone vers un bâtiment moderne qui a remplacé l'ancienne échoppe.

 

 

Les défis éthiques et les limites de l'IA en généalogie

Bien sûr, comme toute technologie puissante, l'IA en généalogie soulève aussi des questions éthiques. La généalogie implique la manipulation de données personnelles sensibles. A l'heure où la protection de la vie privée n'est pas si facile, il faut d'abord pouvoir balancer le partage d’informations généalogiques et le respect de la vie privée des individus. A qui passe la propriété des données généalogiques entrées sur les sites ? Pour certains d'entre nous, c'est important, et d'autres généalogistes ne s'en préoccupent pas du tout. Avec l'IA, il y a un risque que ces données soient collectées et utilisées à des fins commerciales ou même malveillantes. Vous utilisez un service de généalogie en ligne qui propose des fonctionnalités basées sur l'IA. Mais avez-vous lu les petites lignes du contrat ? Savez-vous comment vos données seront stockées et utilisées ? Il est crucial de choisir des services qui respectent la confidentialité des informations personnelles.

Ensuite, comment faire pour s’assurer que les prédictions et analyses de l’IA sont fiables ? Mettre une autre IA pour vérifier les résultats de la première ? C'est une blague, bien sûr, mais vous avez bien compris qu'il n'y a pas de réponse simple à la question. L'IA n'est pas infaillible. Elle peut faire des erreurs, surtout si elle est mal programmée ou si elle travaille à partir de données incomplètes ou biaisées. Et ça, vous ne pouvez pas le savoir... L'IA vous propose une correspondance pour un ancêtre, mais en vérifiant manuellement, vous vous rendez compte qu'il s'agit d'un homonyme. Il est toujours important de vérifier les résultats obtenus par l'IA avec un œil critique.

 

Il faut également veiller à l'accessibilité de ces technologies de pointe. Comment éviter que ces technologies ne creusent un fossé entre ceux qui y ont accès et ceux qui n’y ont pas accès ? N'est-ce pas déjà trop tard, quand on sait qu'une partie de la population française, 13% si je ne me trompe pas en 2023, est en situation d'illectronisme, c'est à dire n'a pas accès ou ne comprend pas les nouvelles technologies et équipements de communication ?

La généalogie, c'est aussi le plaisir de la chasse aux trésors, la satisfaction de découvrir par soi-même un indice caché dans un vieux document. Avec l'IA, il y a un risque de perdre cette dimension humaine et émotionnelle de la recherche. Vous avez toujours aimé passer des heures à déchiffrer des écritures anciennes, à sentir le poids de l'histoire entre vos mains. Mais avec l'IA, tout va plus vite, et vous avez l'impression de perdre ce lien tangible avec le passé. Aussi impressionnante soit-elle, l'IA ne remplacera jamais complètement l'expertise humaine en généalogie, et ailleurs. Elle reste un outil, certes puissant, mais qui nécessite toujours l'interprétation et le jugement d'un généalogiste expérimenté. Il faut trouver des moyens de maintenir l’aspect personnel et émotionnel de la recherche généalogique face à l’automatisation.

Tous ces sujets méritent notre attention. Faut-il réguler tout de suite, parce que l'on a peur des dérapages, ou développer des solutions, qu'on régulera, peut-être, après ? Ecole française, ou école américaine ?

 

 

En conclusion, l'Intelligence Artificielle est en train de transformer la généalogie, la rendant plus accessible, plus précise et plus passionnante que jamais. De la transcription automatique des documents anciens à la reconstruction virtuelle du monde de nos ancêtres, l'IA ouvre des possibilités fascinantes pour les généalogistes du XXIe siècle. Alors, prêt à embarquer pour cette aventure généalogique high-tech ? Qui sait, peut-être que notre prochain compagnon de recherche sera une IA nommée « GeneBot » ou « AncestorAI » !

N'oublions pas cependant que derrière chaque ligne de code et chaque algorithme, c'est toujours la passion pour l'histoire familiale qui guide nos recherches. L'IA est là pour nous aider, pas pour remplacer la joie de la découverte et l'émotion de renouer avec nos racines. Alors, que nous soyons généalogiste chevronné ou débutant curieux, n'hésitons pas à explorer ces nouveaux outils. L'aventure généalogique n'a jamais été aussi excitante !