Bonjour
Ayant récemment migré sur la version 10 d'Ancestris, je découvre avec plaisir la fusion de doublons. Cependant, j'ai quelques difficultés à bien comprendre le fonctionnement précis de la recherche : pourquoi me trouve t il plus de 200 doublons possibles (fichier de 6000 individus) qui d'ailleurs ne sont pas des doublons, mais pas celui que je veux ? Je ne trouve pas dans la documentation d'éléménts consacrés à cet utilitaire.
J'ai essayé pas mal de combinaisons dans les options, j'ai l'impression que certaines options ne changent pas les résultats et peut etre serait il possible de rajouter des filtres ? Pour expliquer, voila quelques exemples :
- pour le doublon que je ne trouvais pas : nom et prénom strictement identique, date de naissance identique, aucun élément différent (javais d'une part une fiche avec sa naissance, d'autre part une fiche avec le mariage et les enfants). Pas moyen de la trouver avec la recherche... sauf quand j'ai rajouté le lieu de naissance dans les deux fiches. J'en conclus que l'utilitaire de recherche ne recherche que les données localisées et non les autres (même dans mon cas où les dates de naissance, nom et prénom étaient strictement identiques)
- pour les doublons "en trop", si je coche TOUTES les options et indique un délai de différence de date à 1 jour seulement, il me reste 204 doublons... Dont
1) des gens avec les mêmes noms et prénoms mais des dates de naissance renseignées différentes à 45 ans d'intervalle + des conjoints différents + des dates de décès différentes (80% de probabilité !)
2) des gens avec un prénom composé dont l'un des prénoms est commun, même nom, même sexe, mariage naissance et décès à plus de 100 ans d'intervalle, aucun autre élément commun (lieu de naissance proche car une subdivision en plus pour l'un des deux avec le nom du village dans la même commune) (60% de probabilité) -> toujours pas compris pourquoi il le détecte ?
En fait, à partir du moment où un prénom et le nom sont identiques, ainsi que le LIEU de naissance, le logiciel considère que c'est un doublon.
J'en conclus que le critère de recherche "tous les prénoms sont identiques" ne fonctionne pas comme il devrait (si décoché, plus de 1000 doublons)
Paradoxalement, si je DECOCHE "tous les éléments du nom doivent etre identique", il arrete de cherche les prénoms communs dans les prénoms composés, et je n'ai que 93 doublons... en gros, je suis plus strict en décochant la case qu'en la cochant
L'utilisation des options "dates non renseignées considérées comme différentes" ou "exclure les individus d'une même famille" modifient juste un peu les résultats.
Sur la page résultat, le systeme de fusion est plutot bien fait je trouve, mais je ne sais pas ce qu'il se passe en cas de données différentes pouvant être "empilées" : par exemple un mariage : il va s'ajouter au mariage déjà existant (et donc l'individu fusionné aura deux mariages?) ou supprimer le mariage de l'un des deux ?
L'option "retirer les doublons" permet d'enlever le doublon de la liste UNIQUEMENT pour la session en cours
Quelques idées d'améliorations si cela est possible :
- avoir la possibilité de filtrer sur une période donnée
- puisque le logiciel calcule une probabilité, pouvoir filtrer sur la probabilité (genre n'afficher que les proba à 80 et 100% et pas celles plus basses
- avoir une exclusion possible de doublon si les dates de naissance ou de décès sont éloignées de plus d'une certaine durée
Pour finir, c'est un super outil et je remercie les développeurs de l'avoir mis en place. Je pense qu'il nécessiterait des explications dans la documentation pour bien comprendre son fonctionnement, et que si cela est possible (techniquement et humainement), il gagnerait à être enrichi, par exemple avec des filtres supplémentaires comme ceux que j'ai indiqué au dessus.