Author Topic: information consernant la fusion d'individus (fusion de doublons)  (Read 9636 times)

0 Members and 1 Guest are viewing this topic.

Offline aldric

  • VIP
  • Full Member
  • *
  • Posts: 11
    • View Profile
Bonjour
Ayant récemment migré sur la version 10 d'Ancestris, je découvre avec plaisir la fusion de doublons. Cependant, j'ai quelques difficultés à bien comprendre le fonctionnement précis de la recherche : pourquoi me trouve t il plus de 200 doublons possibles (fichier de 6000 individus) qui d'ailleurs ne sont pas des doublons, mais pas celui que je veux ? Je ne trouve pas dans la documentation d'éléménts consacrés à cet utilitaire.
J'ai essayé pas mal de combinaisons dans les options, j'ai l'impression que certaines options ne changent pas les résultats et peut etre serait il possible de rajouter des filtres ? Pour expliquer, voila quelques exemples :

- pour le doublon que je ne trouvais pas : nom et prénom strictement identique, date de naissance identique, aucun élément différent (javais d'une part une fiche avec sa naissance, d'autre part une fiche avec le mariage et les enfants). Pas moyen de la trouver avec la recherche... sauf quand j'ai rajouté le lieu de naissance dans les deux fiches. J'en conclus que l'utilitaire de recherche ne recherche que les données localisées et non les autres (même dans mon cas où les dates de naissance, nom et prénom étaient strictement identiques)

- pour les doublons "en trop", si je coche TOUTES les options et indique un délai de différence de date à 1 jour seulement, il me reste 204 doublons... Dont
1) des gens avec les mêmes noms et prénoms mais des dates de naissance renseignées différentes à 45 ans d'intervalle + des conjoints différents + des dates de décès différentes (80% de probabilité !)
2) des gens avec un prénom composé dont l'un des prénoms est commun, même nom, même sexe, mariage naissance et décès à plus de 100 ans d'intervalle, aucun autre élément commun (lieu de naissance proche car une subdivision en plus pour l'un des deux avec le nom du village dans la même commune) (60% de probabilité) -> toujours pas compris pourquoi il le détecte ?

En fait, à partir du moment où un prénom et le nom sont identiques, ainsi que le LIEU de naissance, le logiciel considère que c'est un doublon.

J'en conclus que le critère de recherche "tous les prénoms sont identiques" ne fonctionne pas comme il devrait (si décoché, plus de 1000 doublons)
Paradoxalement, si je DECOCHE "tous les éléments du nom doivent etre identique", il arrete de cherche les prénoms communs dans les prénoms composés, et je n'ai que 93 doublons... en gros, je suis plus strict en décochant la case qu'en la cochant ???
L'utilisation des options "dates non renseignées considérées comme différentes" ou "exclure les individus d'une même famille" modifient juste un peu les résultats.

Sur la page résultat, le systeme de fusion est plutot bien fait je trouve, mais je ne sais pas ce qu'il se passe en cas de données différentes pouvant être "empilées" : par exemple un mariage : il va s'ajouter au mariage déjà existant (et donc l'individu fusionné aura deux mariages?) ou supprimer le mariage de l'un des deux ?
L'option "retirer les doublons" permet d'enlever le doublon de la liste UNIQUEMENT pour la session en cours

Quelques idées d'améliorations si cela est possible :
- avoir la possibilité de filtrer sur une période donnée
- puisque le logiciel calcule une probabilité, pouvoir filtrer sur la probabilité (genre n'afficher que les proba à 80 et 100% et pas celles plus basses
- avoir une exclusion possible de doublon si les dates de naissance ou de décès sont éloignées de plus d'une certaine durée

Pour finir, c'est un super outil et je remercie les développeurs de l'avoir mis en place. Je pense qu'il nécessiterait des explications dans la documentation pour bien comprendre son fonctionnement, et que si cela est possible (techniquement et humainement), il gagnerait à être enrichi, par exemple avec des filtres supplémentaires comme ceux que j'ai indiqué au dessus.

Offline FredericL

  • VIP
  • Hero Member
  • *
  • Posts: 890
    • View Profile
    • Généalogie personnelle et logiciel gratuit Ancestris
Re: information consernant la fusion d'individus (fusion de doublons)
« Reply #1 on: April 17, 2020, 17:35:06 »
Bonjour,

Oui vous avez raison, je suis d'ailleurs en cours de revoir toute la documentation d'Ancestris.

Pour la fusion, vous serait-il possible de m'envoyer votre fichier Gedcom en privé, c'est avec les vrais exemplse que l'on répond le mieux. Retirer les parties confidentielles si vous le faites (menu/fichier/enregistrer sous). Je le détruirai ensuite si vous voulez. (frederic à ancestris org). Dites-moi ensuite de quels individus doublon à tort et à raison vous lez que je regarde.

Les suggestions que vous faites sont de bonnes idées.  L'outil a été développé avant que l'on parle de toute l'intelligence artificielle actuelle mais cela y ressemble beaucoup et on peut toujours améliorer la justesse de la détection des doublons.

Bien cordialement,
Frederic

Offline kiadisa

  • VIP
  • Hero Member
  • *
  • Posts: 363
    • View Profile
Re: information consernant la fusion d'individus (fusion de doublons)
« Reply #2 on: April 20, 2020, 16:16:21 »
Tout à fait d'accord, j'ai déjà posté plusieurs fois sur le sujet et depuis je ne l'utilise plus pour les individus
En annexe style de doublons à100 %

Offline Humpfff

  • VIP
  • Newbie
  • *
  • Posts: 2
    • View Profile
Bonjour à tous, aujourd'hui j'ai utilisé la recherche/fusion de doublon pour la première fois. J'ai trouvé que les critères de recherche sont obscurs et déroutant. Les résultats de recherche aussi, par conséquent.
Pas moyen de la trouver avec la recherche... sauf quand j'ai rajouté le lieu de naissance dans les deux fiches.
Merci beaucoup Aldric ! Je confirme ce point et ton message m'a vraiment aidé à isoler deux individus explicitement doublons.

Quote from: aldric
je ne sais pas ce qu'il se passe en cas de données différentes pouvant être "empilées" :
Je viens de tester sur deux individus.
Pour les mariages :  je ne sais pas car un des deux individus n'en n'avait pas.
Dans le cas des Professions (Tag OCCU) : , chaque doublon avait une profession (même libellé, mais 3 ans d'écart entre les dates).  Et bien ... les professions n'ont pas été empilées. J'aurais voulu avoir la possibilité d'obtenir deux professions après la fusion, pourtant.

Je garde de côté un fichier gedcom en exemple, si un développeur est intéressé.

J'utilise la version en cours de développement, à jour.
Code: [Select]
Version d'Ancestris :  11.0.10192
Java :  1.8.0_251-b08 - C:\Program Files\Java\jre1.8.0_251
Système :  Windows 10

Offline Zurga

  • VIP
  • Supernatural Member
  • *
  • Posts: 4 470
    • View Profile
Dans le cas des Professions (Tag OCCU) : , chaque doublon avait une profession (même libellé, mais 3 ans d'écart entre les dates).  Et bien ... les professions n'ont pas été empilées. J'aurais voulu avoir la possibilité d'obtenir deux professions après la fusion, pourtant.
Aviez-vous bien sélectionné les professions des deux côtés ?

Si vous voulez que j'investigue, envoyez-moi les détails à zurga @ ancestris.org.

Zurga

Offline Humpfff

  • VIP
  • Newbie
  • *
  • Posts: 2
    • View Profile
Je ne peux sélectionner qu'une seule profession dans l'outil de fusion. Celle qui est dans la colonne de gauche.
Plus précisément, je ne peux pas cocher davantage que ce qui est visible sur la capture d'écran ci-dessous.