1
FRANÇAIS / Re: Utilisation de Fusion de doublons sur les sources
« on: Yesterday at 21:53:58 »
Bonjour,
Tout d'abord, bravo pour le travail réalisé. Beaucoup de sources très bien renseignées.
Il y a plusieurs possibilité de considérer une source: comme un registre, ou comme un acte. Il me semble que vous définissez une source comme un registre et l'info de l'acte est dans l'événement de l'individu.
L'un ou l'autre ne devrait pas poser de problème pour la recherche de doublons.
J'ai récemment changé la fonctionnalité des doublons, et cela a peut-être eu un impact sur la façon de détecter les doublons de source.
Avec 3980 sources, si on comparait toutes les sources avec elles-mêmes, on aurait presque 16 millions de tests comparatifs. Cela prendrait trop de temps donc on commence par sélectionner quelles sources devraient être comparées entre elles. On fait des paquets sur des critères identiques ou similaire.
Maintenant, difficile à dire sans comprendre où Ancestris passe son temps... Dans votre cas, les paquets semblent trop grands manifestement, sinon cela ne durerait pas si longtemps. Ou alors il y a un bug et cela boucle quelque part.
Bref, si vous aviez la possibilité de me prêter votre Gedcom en privé le temps d'un test, je pourrais analyser.
Sinon il faudra trouver un moyen pour que vous fassiez les tests.
Merci de me dire ce que vous préférez.
Cordialement,
Frédéric
Tout d'abord, bravo pour le travail réalisé. Beaucoup de sources très bien renseignées.
Il y a plusieurs possibilité de considérer une source: comme un registre, ou comme un acte. Il me semble que vous définissez une source comme un registre et l'info de l'acte est dans l'événement de l'individu.
L'un ou l'autre ne devrait pas poser de problème pour la recherche de doublons.
J'ai récemment changé la fonctionnalité des doublons, et cela a peut-être eu un impact sur la façon de détecter les doublons de source.
Avec 3980 sources, si on comparait toutes les sources avec elles-mêmes, on aurait presque 16 millions de tests comparatifs. Cela prendrait trop de temps donc on commence par sélectionner quelles sources devraient être comparées entre elles. On fait des paquets sur des critères identiques ou similaire.
Maintenant, difficile à dire sans comprendre où Ancestris passe son temps... Dans votre cas, les paquets semblent trop grands manifestement, sinon cela ne durerait pas si longtemps. Ou alors il y a un bug et cela boucle quelque part.
Bref, si vous aviez la possibilité de me prêter votre Gedcom en privé le temps d'un test, je pourrais analyser.
Sinon il faudra trouver un moyen pour que vous fassiez les tests.
Merci de me dire ce que vous préférez.
Cordialement,
Frédéric