Author Topic: Stats implexes dans livre Web  (Read 238 times)

0 Members and 1 Guest are viewing this topic.

Offline bibert38

  • VIP
  • Jr. Member
  • *
  • Posts: 9
    • View Profile
Stats implexes dans livre Web
« on: February 04, 2022, 11:10:39 »
Hello,
  Une remarque concernant le calcul du taux d'implexe dans le livre Web: vu que ce taux est calculé sur le nombre d'ancêtres connus cumulés (facteur "A") et le nombre d'ancêtres connus différents (facteur "B"), on arrive, lorsqu'une seule ligne ancestrale se déploie sur de nombreuses générations (15-20 et au-delà), à des taux proches de 100%, voire négatifs du fait des erreurs de calcul sur les grands nombres... Ce qui est peu réaliste (voir exemples joint).
Une meilleure approximation consisterait à prendre, comme facteur "A", le nombre d’ancêtres cumulés "possibles" plutôt que "connus", et en ajoutant au facteur "B" le nombre d'ancêtres cumulés "inconnus", donc en considérant que les ancêtres inconnus sont à-priori différents (ce qui est forcément inexact dans l'absolu, mais plus proche de la réalité de recherche des ascendants à un instant donné).
Cordialement,
Gilbert

Offline Zurga

  • VIP
  • Supernatural Member
  • *
  • Posts: 2 639
    • View Profile
Re: Stats implexes dans livre Web
« Reply #1 on: February 04, 2022, 13:57:04 »
On va corriger le problème de nombre négatif.

Néanmoins, que le taux d'implexe soit proche de 100% n'est pas du tout irréaliste, bien au contraire.
Vous le montrez vous-même avec le nombre d'ancêtres théorique.
La génération 34 par rapport à nous correspond peu ou prou à l'an 1000 (Hugues Capet en gros).
Et il y a en théorie 8,5 milliards d'ancêtres différents. Si on considère que tous les ancêtres différents sont vivant sur la même période, cela voudrait dire que le nombre théorique est très, très largement supérieur à la population totale de la Terre à cette période (elle est estimée à 300 millions sur l'ensemble des continents).
Donc, oui, à une génération aussi importante, le taux d'implexe est proche de 100%.

Le choix a été fait de prendre les nombres cumulés, on pourrait prendre les différents de chaque génération.
Ce serait plus précis pour une génération donnée, même si dans les faits, cela ne change pas vraiment le calcul.
Par exemple, suivant votre tableau, le nombre d'ancêtres ajouté à la 37eme génération est supérieur à tous les ancêtres différents cumulés depuis la première génération. Et pourtant, il n'y a que 175 personnes différentes.
Si on prend votre calcul : 1 - anccetres_reel/ancetres_theorique = 1 - 175/11789 = 0,985 => 98,5% de taux d'implexe.

Considérer que les ancêtres inconnus sont différents est largement plus hasardeux.
Il est bien plus probable de considérer que le taux d'implexe est similaire sur toutes les branches.

Zurga

Offline Zurga

  • VIP
  • Supernatural Member
  • *
  • Posts: 2 639
    • View Profile
Re: Stats implexes dans livre Web
« Reply #2 on: February 05, 2022, 00:37:52 »
Le problème de calcul (nombres négatifs) sera corrigé demain.

Zurga

Offline bibert38

  • VIP
  • Jr. Member
  • *
  • Posts: 9
    • View Profile
Re: Stats implexes dans livre Web
« Reply #3 on: February 05, 2022, 16:38:34 »
Merci de votre réponse, et de la correction à venir sur les résultats négatifs.
Je me suis penché sur la littérature en ligne sur le sujet, pour comprendre ce que la communauté en disait, et j'y ai trouvé quelques info intéressantes:
- le taux d'implexe se calcule avec les ancêtres d'une génération n (et non pas en cumulé) (wikipedia explique pourquoi avec un exemple simple)
- avec la formule: taux d'implexe (génération_n) = 1 - nombre_d'ancêtres_distinct_à_la_génération_n / nombre_d'ancètres_théoriques_à_la_génération_n
- d'autres auteurs utilisent la même formule, mais avec les cumuls. Je vois que c'est aussi le choix d'Ancestris.
- Ce taux n'est plus pertinent lorsque moins de 100% des ancêtres sont connus. La formule donne alors un taux "à minima". L'erreur est d'autant plus grande que le taux d’ancêtres connus est faible.
- On diminue cette erreur en prenant ancêtres_connus plutôt qu'ancêtres_théoriques dans le rapport, même si cela donne des erreurs significatives dans certains cas.
Effectivement, et logiquement, le rapport ancêtres_distincts/ancêtres_connus est plus représentatif du taux d'implexe dans les individus manquants que de considérer que tous ces manquants sont soit distincts, soit, à l'opposé, tous en doublon.
Bref une évaluation de ce taux du simple au double selon que l'une ou l'autre de ces règles est appliquée, même avec 100% d'ancêtres connus pour une génération donnée, et une convergence vers 90%-100% plus ou moins rapide, donc assurément une information sans pertinence...

Offline Zurga

  • VIP
  • Supernatural Member
  • *
  • Posts: 2 639
    • View Profile
Re: Stats implexes dans livre Web
« Reply #4 on: February 05, 2022, 17:15:13 »
La correction doit être disponible dans la version 12 dès maintenant.

Pour le calcul, plus on avance dans les générations, moins on connait d'individus (pour des raisons évidentes de disponibilité de documentation).
De ce fait, si on calcule génération par génération, on va obtenir pour certaines génération des taux d'implexes à 0 car les seuls connus sont différents.
Le calcul avec le cumul en se basant sur les individus connus est plus pertinent, même si ce taux est globalement inutile au-dessus de la 10eme génération.

Zurga