Author Topic: Utilisation de Fusion de doublons sur les sources  (Read 1627 times)

0 Members and 1 Guest are viewing this topic.

Offline jcvp

  • VIP
  • Sr. Member
  • *
  • Posts: 53
    • View Profile
Utilisation de Fusion de doublons sur les sources
« on: May 29, 2024, 20:47:22 »
Bonjour,
Je suis un obsédé des sources, dans ma généalogie actuelle j'en dénombre actuellement 3980 avec 120 lieux de stockage (pour plus de 21 000 individus et 8400 familles)
Qui dit beaucoup de sources dit aussi gros risque de créer des doublons, j'ai donc essayé d'utiliser l'outil "Fusion de Doublons" pour les identifier et les éliminer.
Je lance donc la recherche uniquement sur les sources et voici mes constatations :
- la chenille orange en bas à droite de la fenêtre avance très très lentement
- Quand enfin elle arrive à 100% (au bout de 12min 45 sec lors de mon dernier essai)  rien ne se passe. La chenille reste affichée mais la fenêtre qui devrait s'ouvrir à la fin de la recherche ne s'ouvre pas (alors que cela fonctionne correctement lorsque j'effectue une recherche de doublons sur des individus qui ne dure que 6 sec pour trouver les 1000 premier doublons).
- Je dois finalement cliquer sur la petite croix pour annuler la recherche.

J'ai le souvenir que cette recherche de doublons sur les sources avait fonctionné.
Est-ce la manière dont j'établis mes sources ? Je suis dubitatif.
Si vous avez des tuyaux je suis preneur. Merci d'avance pour votre aide.
JCVP

Offline jcvp

  • VIP
  • Sr. Member
  • *
  • Posts: 53
    • View Profile
Re: Utilisation de Fusion de doublons sur les sources
« Reply #1 on: May 29, 2024, 21:18:06 »
Pour illustrer mon propos j'ai fait quelques saisies d'écran de l'éditeur GEDCOM (image ci-jointe)
dans l'ordre
- Définition du lieu de stockage
- Définition de la source faisant référence au lieu de stockage
- Utilisation de la source dans l'évènement d'un individu avec lien vers l'image de l'acte et permalien vers la page de la source.

C'est l'utilisation max des fois c'est plus léger!

Offline FredericL

  • VIP
  • Hero Member
  • *
  • Posts: 812
    • View Profile
    • Généalogie personnelle et logiciel gratuit Ancestris
Re: Utilisation de Fusion de doublons sur les sources
« Reply #2 on: May 29, 2024, 21:53:58 »
Bonjour,

Tout d'abord, bravo pour le travail réalisé. Beaucoup de sources très bien renseignées.
Il y a plusieurs possibilité de considérer une source: comme un registre, ou comme un acte. Il me semble que vous définissez une source comme un registre et l'info de l'acte est dans l'événement de l'individu.
L'un ou l'autre ne devrait pas poser de problème pour la recherche de doublons.

J'ai récemment changé la fonctionnalité des doublons, et cela a peut-être eu un impact sur la façon de détecter les doublons de source.
Avec 3980 sources, si on comparait toutes les sources avec elles-mêmes, on aurait presque 16 millions de tests comparatifs. Cela prendrait trop de temps donc on commence par sélectionner quelles sources devraient être comparées entre elles. On fait des paquets sur des critères identiques ou similaire.

Maintenant, difficile à dire sans comprendre où Ancestris passe son temps... Dans votre cas, les paquets semblent trop grands manifestement, sinon cela ne durerait pas si longtemps. Ou alors il y a un bug et cela boucle quelque part.

Bref, si vous aviez la possibilité de me prêter votre Gedcom en privé le temps d'un test, je pourrais analyser.
Sinon il faudra trouver un moyen pour que vous fassiez les tests.
Merci de me dire ce que vous préférez.

Cordialement,
Frédéric

Online remi0144

  • VIP
  • Hero Member
  • *
  • Posts: 386
    • View Profile
Re: Utilisation de Fusion de doublons sur les sources
« Reply #3 on: May 30, 2024, 04:57:38 »
Bonjour,

Sauf erreur de ma part :
- L'étiquette URL n'existe pas. Il faut mettre _URL pour l'utiliser. Perso je mets les liens ark sous un deuxième CALN, je me retrouve avec un bouton cliquable, ceci pour éviter de multiplier les étiquettes personnelles qui commencent par un underscore. Je le place en 2e position, après un premier CALN qui a 2Exxxx, pour un meilleur affichage dans certains rapports, comme le livre narratif. Mais j'utilise aussi les sources comme un acte et pas un registre, alors à voir pour votre cas du registre, bien qu'on puisse mettre autant de CALN voulu, _URL est probablement la meilleure option mais il faut rajouter "_".
- Vous devriez mettre CHR au lieu de BAPM pour le baptême lu sur un registre qui attribut un nom. BAPM est l'acte effectué plus tard, ou pendant l'enfance. Donc CHR sous EVEN, mais peut être CHR pour l'événement en lui même, à la place de BIRT, cela dépend comment s'est marqué sur l'acte, s'il est fait référence à la naissance ou au baptême (ou mettre les deux étiquettes BIRT et CHR si on a connaissance des deux événements).
- STAE est pour moi le nom d'un État dans un pays fédéré, comme l'Allemagne ou les États-Unis. Est-il juste en France de mettre la région sous STAE ? Je ne sais pas, mais je ne le mets pas chez moi en tout cas. Zurga, Frédéric et Yannick auront un avis plus sûr que le mien...

Rémi
« Last Edit: May 30, 2024, 06:25:35 by remi0144 »

Offline FredericL

  • VIP
  • Hero Member
  • *
  • Posts: 812
    • View Profile
    • Généalogie personnelle et logiciel gratuit Ancestris
Re: Utilisation de Fusion de doublons sur les sources
« Reply #4 on: May 30, 2024, 07:35:42 »
Bonjour,
Pour URL, si c'est pour mettre le lien vers l'image d'une source, il faut créer une entité OBJE avec un FILE qui contient l'url.
Bien cordialement.

Offline jcvp

  • VIP
  • Sr. Member
  • *
  • Posts: 53
    • View Profile
Re: Utilisation de Fusion de doublons sur les sources
« Reply #5 on: May 30, 2024, 08:40:34 »
Bonjour,
Merci pour vos réponses. Cela n'apparait pas sur l'image mais le _URL existe bien et avec cette méthode j'ai aussi un bouton cliquable qui me permet d'aller sur la page de la source.
J'utilise en plus OBJE avec les images des actes (seulement avec mes ascendants directs) pour transférer ces images vers Geneanet car j'ai remarqué que les liens "pérennes" vers les archives ne sont pas toujours pérennes ou ne fonctionnent pas ou n'existent pas (comme les archives municipales de Paris par exemple).
Les solutions proposées par Ancestris et l'utilisation que j'en fais conviennent parfaitement à mon besoin contrairement aux logiciels que j'utilisais auparavant. C'est juste ce problème de doublons mais qui n'est pas bien grave. J'arrive à les identifier manuellement, même avec la quantité c'est faisable, mais c'est pour les fusionner que cela pose problème.

Frederict, je vais vous envoyer mon ficher GEDCOM en message privé, mais c'est pas urgent, je peux faire avec les doublons c'était juste pour faire du nettoyage.

Bonne journée et @+
JCVP

Offline jcvp

  • VIP
  • Sr. Member
  • *
  • Posts: 53
    • View Profile
Re: Utilisation de Fusion de doublons sur les sources
« Reply #6 on: May 30, 2024, 09:44:15 »
 Pour remi0144 : Petite discussion philosophique !

1 - Cela n'apparait pas sur l'image mais le _URL existe bien et avec cette méthode j'ai aussi un bouton cliquable qui me permet d'aller sur la page de la source.
2 - Votre méthode de rajouter le permalien dans un 2ème CALN dans la définition de la source ne convient pas à l'utilisation que j'en fais. Pour moi une source est par exemple un registre complet tel qu'il est proposé à la consultation par les archives en ligne identifié par le premier CALN (2E .....). Ce permalien pointerait alors sur la première page du registre complet ce qui ne correspond pas à mon besoin.
Le lien que je place dans la définition de la source liée à l'acte d'un évènement pointe directement sur la page qui contient cet acte. Si j'utilisais votre méthode ce n'est pas 3980 sources que j'aurai (ce que je trouve déjà beaucoup) mais à raison d'une moyenne de 2,5 actes par individu (Naissance, Mariage, Décès) cela ferait dans mon cas plus de 52 500 sources (sans compter les sources multiples pour un même évènement)
3 - Pour le choix CHR vs BAPM j'essaie de choisir BAPM pour l'évènement mais quelques fois ma souris dérape, mais n'étant pas trop porté sur la chose religieuse je n'y attache pas beaucoup d'importance, par contre dans la définition de la source j'utilise BAPM (quand je ne mets pas par erreur BIRT) car dans les archives départementales, les registres de la période pré-révolutionnaire sont identifiés BMS (pour Baptême, Mariage, Sépulture) donc pour les actes, afin de rester homogène, j'utilise la même dénomination.
4 - Pour STAE j'utilise le très utile fichier "Base des dépots" fourni par Ancestris qui met bien la Région dans STAE (au passage qui n'est pas a jour pour la France avec le nouveau découpage régional). J'y suis d'autant plus sensible que mon épouse étant d'origine australienne, la notion d'état dans son pays natal à beaucoup d'importance, règle que j'applique également dans la définition des lieux.
 
Chacun fait comme il le pense mais ce petit débat peut-être utile à ceux qui débutent.

Très cordialement
JCVP