Utilisateur:SIELA1915/Brouillon

Une page de Wikipédia, l'encyclopédie libre.


La généalogie génétique est l'application de la génétique à la généalogie. La généalogie génétique nécessite l'usage de tests ADN qui mesurent le niveau de rapports génétiques entre des individus. Les gènes se transmettent entre générations, des comparaisons génétiques permettent d'établir un degré de parenté plus ou moins proche entre individus.

Historique[modifier | modifier le code]

George Darwin, fils de Charles Darwin, fut le premier à estimer la fréquence des mariages entre cousins germains.

La première étude des patronymes en génétique fut celle de George Darwin, fils de Charles Darwin en 1875. Il trouva entre 2,25 % et 4,5 % de mariages entre cousins germains dans la population de la Grande-Bretagne suivant les classes sociales. Ce fut une innovation pour l'époque. Il fallut attendre les années 1990 pour avoir une nouvelle étude de l'histoire familiale, quand la carte génétique du chromosome Y permit de tracer sa transmission de père à fils à la suite des progrès de la génomique.

Dr Karl Skorecki, un urologue canadien d'origine juive ashkénaze s'étonna qu'un collègue juif sépharade, Cohen comme lui-même soit physiquement très différent. La tradition juive dit que tous les Cohen (avec les patronymes dérivés) descendent du prêtre Aaron, frère de Moïse. Karl Skorecki pensa que s'ils étaient vraiment les descendants d'un seul ancêtre, ils devraient avoir hérité du même lot de marqueurs génétiques et auraient peut-être gardé quelques caractères communs.

Pour tester cette idée, il contacta le professeur Michael Hammer de l'université de l'Arizona, chercheur en génétique moléculaire et pionnier de la recherche sur le chromosome Y. La relation de leurs découvertes dans la revue Nature en 1997 créa une vague de protestation dans les milieux scientifiques et religieux. Un marqueur déterminé aurait particulièrement une chance d'être plus présent chez les hommes juifs descendants de familles de prêtres que dans le reste de la population juive. Apparemment, une lignée commune s'était strictement conservée depuis des milliers d'années. En outre, les résultats montraient que les ruptures de la lignée masculine étaient rares ; ceci est nommé par le sigle anglais NPE, « Non-paternity event (en) », fréquent en généalogie génétique[1].

Le premier à tester cette nouvelle méthode de recherche concernant les noms de famille fut Bryan Sykes, un biologiste moléculaire de l'université d'Oxford. L'étude de son patronyme Sykes obtint des résultats positifs avec seulement quatre marqueurs du chromosome Y testés. Il montra ainsi que la génétique pouvait devenir un outil intéressant au service de la généalogie et de l'histoire.

En , la société Family Tree DNA (en) fit les premières propositions commerciales de tests génétiques pour la généalogie. C'était la première fois qu'une théorie portant sur les chromosomes Y d'individus était vérifiée en dehors d'une étude universitaire. De plus, le concept par Sykes d'une étude des patronymes, qui avait été adopté par plusieurs autres chercheurs universitaires en dehors d' Oxford, fut étendu à des projets par patronyme (une forme précoce de réseau social) et ces efforts aidèrent à répandre ces nouvelles connaissances auprès des généalogistes novateurs du monde entier.

En 2001, Sykes écrivit un livre Les sept filles d'Ève, qui définissait les sept haplogroupes majeurs des ancêtres des Européens. Le succès public du livre, couplé à l'accessibilité croissante des tests ADN pour la généalogie donna rapidement un succès croissant à la généalogie génétique, surtout dans les pays anglo-saxons, d'autres pays furent plus réticents et de rares hostiles. En 2003, le domaine des tests ADN pour les patronymes se trouva comme confirmé officiellement par un article de Jobling et Tyler-Smith dans Nature Reviews Genetics[2]. Le nombre de compagnies proposant des tests, et le nombre de leurs clients s'accrurent fortement.

Une autre étape dans la reconnaissance de la généalogie génétique fut le projet genographique. C'est un projet de recherche de 5 années lancé en 2005 par le National Geographic et IBM, en partenariat avec l'université de l'Arizona et Family Tree DNA. Bien que son but soit d'abord anthropologique et non généalogique, la vente par le projet en de plus de 350 000 kits de test dans le public, permettait de tester soit douze marqueurs STR sur le chromosome Y, soit des mutations sur la région HV1 (ou HVR1) de l'ADN mitochondrial, cela a augmenté la connaissance dans le public de la généalogie génétique[3].

En 2011, les laboratoires commerciaux recommandent de tester au moins 25 marqueurs STRs, puisque plus il y a de marqueurs testés, plus les résultats seront discriminants et performants. Un test de 12 marqueurs STRs n'est généralement pas assez discriminant pour fournir des conclusions pour un patronyme communément répandu. Les laboratoires génétiques comme Genebase et Family Tree DNA vendent l'option de tests 67 marqueurs du chromosome Y[4].

Les ventes annuelles de tests par toutes les compagnies et laboratoires sont estimées de l'ordre de 60 millions de dollars (2006)[5].

Les compagnies commerciales ont, pour chacune d'entre elles, un forum sur DNA-forums[6]. 1K Genomes et SGMF(Sorenson) ne sont pas des compagnies commerciales.1000 Genomes est un projet scientifique et SGMF un laboratoire scientifique qui ne vend pas des tests et n'en fait que pour de la recherche scientifique. La plupart des compagnies commerciales ont un article chacune dans le wikipedia anglais.

Interprétation[modifier | modifier le code]

Depuis 2000, des dizaines de papiers scientifiques concernant ce sujet ont été publiés, et des milliers de résultats de tests privés organisés pour des projets patronymiques sont disponibles sur internet. La comparaison des résultats peut être compliquée parce que les compagnies n'utilisent pas les mêmes méthodes. Mais Il y a des tables de conversion entre les résultats des compagnies, se renseigner sur les forums de généalogie génétique comme DNA-forums qui a une section française librement accessible[7], d'autres sections nécessitent d'être membre pour y accéder.

Liste d'autres forums : Worldfamilies[8] Anthrocivitas[9] Eupedia[10] RootsWeb[11].

Utilisation[modifier | modifier le code]

Lignages paternels et maternels à travers les tests ADN[modifier | modifier le code]

Les deux types les plus fréquents de tests de généalogie génétique sont les tests sur l'ADN-Y (ligne paternelle) et ceux sur l'ADN-mitochondrial (ligne maternelle). Notez que les termes chromosome Y et ADN-Y sont utilisés de manière interchangeable dans cet article.

Ces tests entraînent la comparaison de certaines séquences de l'ADN pour des paires d'individus afin d'estimer la probabilité dans chaque paire que les individus partagent un ancêtre commun dans une limite raisonnable de générations et, à l'intérieur d'un modèle bayesien publié par Bruce Walsh, pour estimer le nombre de générations séparant les deux individus de leur plus récent ancêtre commun souvent désigné par MRCA (most recent common ancestor).

Tester l'ADN-Y suppose tester les marqueurs STR et/ou SNP. Le chromosome Y est présent seulement chez les mâles et révèle strictement l'information de la ligne paternelle (qui va de père en fils). Ces tests peuvent fournir de l'information sur les ancêtres récents (via STR) et anciens (via SNP). Le test STR révèlera un haplotype défini par les nombres des répétitions pour chaque marqueur, qui seront similaires parmi tous les hommes descendants d'un même ancêtre. Les tests SNP sont destinés à assigner la personne à un haplogroupe paternel, qui définit une large population génétique avec certains marqueurs SNP communs.

Le test ADNmt suppose tester le séquençage de la région HVR-1, la région HVR-2 ou les deux. Un test ADNmt peut aussi inclure le test de SNP additionnels dans la région codante (non hypervariable mais beaucoup plus grande) pour assigner un haplogroupe maternel à la personne, on peut même séquencer tout l'ADNmt de la personne. C'est une question de prix du test.

Les résultats ADN-Y ou ADNmt pourront être comparés aux résultats d'autres ADN de même type à travers les bases de données privées ou publiques.

L'haplogroupe à la racine de l'arbre des haplogroupes-Y est Haplogroupe A (Y-ADN).

L'haplogroupe à la racine de l'arbre des haplogroupes mitochondriaux est Macrohaplogroupe L (ADNmt).

Origines géographiques et ethniques[modifier | modifier le code]

Des tests ADN additionnels existent pour déterminer l'origine géographique et ethnique, mais ces tests relèvent moins de la généalogie traditionnelle.

La généalogie génétique a révélé des liens surprenants entre les peuples. Par exemple on a montré que les anciens Phéniciens sont les ancêtres d'une importante partie de la population de l'île de Malte. Des résultats préliminaires d'une étude par Pierre Zalloua de l'université américaine de Beyrouth que Spencer Wells fit financer par une allocation du comité pour la recherche et l'exploration du National Geographic, furent publiés dans la revue d' du National Geographic. Une des conclusions est que plus de la moitié des lignages chromosomiques de l'actuelle population maltaise pourrait être venue avec les Phéniciens[12].

Tout ceci est lié à la génétique des populations (L'étude de la distribution et des changements dans les fréquences des allèles) et aussi les recherches sur l'origine africaine de l'homme moderne.

Migrations humaines[modifier | modifier le code]

Les tests ADN de la généalogie génétique sont aussi utilisés sur une plus grande échelle de temps pour tracer des modèles de migration humaine. Par exemple, on les utilise pour déterminer quand les premiers humains vinrent en Amérique du Nord et quel chemin ils suivirent pour y parvenir.

Pendant plusieurs années, de nombreux chercheurs et laboratoires de par le monde ont prélevé des échantillons de populations indigènes tout autour du globe pour faire des cartes de modèles historique de migrations humaines. Récemment, plusieurs projets furent créés avec le but de faire connaître cette science par le public. Un exemple mentionné au-dessus est le Projet génographique du National Geographic, qui vise à créer des cartes de migrations humaines repérées en collectant et analysant les échantillons ADN de plus de 100 000 personnes sur les cinq continents. Un autre exemple est l'analyse génétique pour trouver des ancêtres de « clans ADN », qui mesure des relations génétiques entre une personne précise et les groupes ethniques indigènes de par le monde[13].

Clients typiques et groupes d'intérêt[modifier | modifier le code]

Les clients masculins démarrent le plus souvent avec un test du chromosome Y pour déterminer leur ancêtre direct par les pères. Les femmes généralement commencent un test mitochondrial pour tracer leur ancien lignage par les mères, pour lequel les hommes se font souvent tester dans le même but. Il est fréquent que des femmes intéressées par leur lignage paternel demandent à leur père ou frère de leur donner un échantillon.

Le but commun aux clients en achetant des tests ADN est d'obtenir un lien scientifiquement quantifié à un groupe ancestral spécifié. On trouve un fort exemple de ce motif dans les désirs exprimés de certains clients d'avoir une preuve de leur lointaine origine paternelle viking. Le groupe de discussion internet RootsWeb de généalogie génétique[14] a 750 membres dans le monde. Quelques inscrits ont fait différents tests ADN et cherchent conseils et guide pour comprendre leurs résultats. Les inscrits comprennent aussi des administrateurs de projets qui étudient des patronymes, des régions géographiques, ou des groupes ethniques. L'expérience des inscrits va de l'expert confirmé au novice. Dans quelques cas, on peut reconnaître à des inscrits d'avoir fait des contributions très utiles et inédites à la connaissance dans le domaine de la généalogie génétique, ainsi dans l'exploitation des résultats bruts du projet 1000 Genomes, avec des programmes informatiques spécialisés, ainsi des inscrits de DNA-forums ont découvert des centaines de nouveaux SNP du chromosome Y en 2011 et probablement cela ira à plus de 10 000 découverts, affinant considérablement les définitions des haplogroupes. Déjà des dizaines (ceux commençant par DF et Z) sont au catalogue de compagnies commerciales et commencent à apparaître sur l'arbre normalisé officiel des haplogroupes[15].

Lignages ADN paternelles et maternelles[modifier | modifier le code]

  • Haplogroupe ancestral
  • Haplogroupe A (Hg A)
  • Haplogroupe B (Hg B)
Toutes ces molécules font partie de l'haplogroupe ancestral, mais à quelque moment dans le passé, une mutation se produisit dans la molécule ancestrale, la mutation A qui créa un nouveau lignage; c'est l'haplogroupe A et il est défini par la mutation A. À un moment plus récent dans le passé, une nouvelle mutation, la mutation B se produisit chez une personne de l'haplogroupe A; la mutation B définissant l'haplogroupe B. Celui-ci est un sous-groupe, ou « subclade » de l'haplogroupe A ; les deux haplogroupes A et B sont des « subclades » de l'haplogroupe ancestral.

Le génome mitochondrial humain est dans les mitochondries qui sont de petits organites dans le cytoplasme des cellules des Eucaryotes, comme celles des humains. Leur utilité principale est de fournir l'énergie à la cellule. On pense que les mitochondries sont les vestiges d'une bactérie endosymbiotique qui à une époque vivait indépendamment. Un indice que les mitochondries furent indépendantes est qu'elles contiennent un petit segment circulaire d'ADN, appelé ADN mitochondrial (ADNmt). L'immense majorité de l'ADN humain est contenu dans les chromosomes dans le noyau de la cellule, mais l'ADNmt est une exception. Les individus héritent leur cytoplasme et les organites qui y sont contenus, exclusivement par leurs mères, comme ils viennent de l'ovule seulement, non du sperme[16].

Quand une mutation se produit dans la molécule ADNmt, la mutation est transmise en ligne directe féminine à la descendance. Ces mutations rares viennent d'erreurs de copie—quand l'ADN est copié, il arrive qu'une erreur isolée se produise dans la séquence ADN, le résultat est appelé polymorphisme nucléotidique.

Le chromosome Y humain est spécifique aux hommes (chromosomes sexuels) ; presque tous les humains qui possèdent un chromosome Y seront de morphologie masculine. Les chromosomes Y sont donc transmis de père à fils ; bien que les chromosomes Y soient situés dans le noyau (dit aussi nucleus) de la cellule, ils se recombinent seulement avec le chromosome X aux extrémités du chromosome Y ; la vaste majorité du chromosome Y (95 %) ne se recombine pas. Quand les mutations (SNP, et erreurs de copie STR) se produisent dans le chromosome Y, elles sont transmises directement de père à fils en ligne directe masculine. Les ADN-Y et ADNmt partagent donc un certain trait : tous deux se transmettent inchangés excepté de rares mutations qui se produisent à chaque génération.

Les autres chromosomes, autosomes, et chromosome X chez la femme, partagent leur matériel génétique (on appelle ceci les enjambements qui conduisent aux recombinaisons durant la méiose, un type spécial de division cellulaire qui se produit dans le cours de la reproduction sexuée. En effet, ceci signifie que le matériel génétique de ces chromosomes sera mélangé en quelques générations, et donc toute nouvelle mutation est transmise par hasard des parents à leur progéniture.

Ce trait spécial qu'ensemble ADN-Y et ADNmt partagent, préserve un exemplaire « écrit » de leurs mutations parce que les ADN ne sont ni mélangés, ni transmis au hasard. Les mutations restent à une place fixe dans les deux types d'ADN. De plus la séquence historique de leurs mutations peut être ainsi déduites. Par exemple, si un ensemble de dix chromosomes Y (de dix hommes différents) contient une mutation A, mais seulement cinq de ces chromosomes contiennent une seconde mutation, B, on peut en déduire que la mutation B s'est produite après la mutation A.

En outre les dix hommes qui portent le chromosome avec la mutation A sont les descendants directs en ligne masculine du même homme qui fut le premier à porter la mutation. Le premier homme qui porta la mutation B fut aussi un descendant direct en ligne masculine de cet homme, mais est aussi ancêtre direct masculin de tous les hommes portant la mutation B. Des séries de mutations forment des lignages moléculaires. En plus chaque mutation SNP peut définir un ensemble de chromosomes Y spécifiques qu'on appelle haplogroupe.

Tous les hommes portant la mutation SNP A forme un haplogroupe, et tous les hommes portant la mutation B font partie de l'haplogroupe B, mais la mutation B (si c'est un SNP) définit ainsi un haplogroupe plus récent par lui-même (qui est un sous-groupe ou « subclade »), les hommes portant seulement la mutation A n'appartiennent pas à l'haplogroupe B. Les ADNmt, et les chromosomes Y ou ADN-Y se regroupent dans 2 systèmes différents de lignages et haplogroupes ; ils sont souvent représentés par des diagrammes en arbre.

Gestion des données[modifier | modifier le code]

Avec le développement de la technologie dans le domaine de la récolte de données génétiques, qui a amené à une baisse de prix des test ADN et une accessibilité augmentée de ces derniers, de plus en plus de personnes ont décidé de faire un test ADN. L'augmentation des données génétiques disponibles a permis le développement de différentes utilisations de ces informations ; l'une d'entre elles est la recherche en généalogie génétique. La généalogie génétique à son tour a amené plus de personnes à faire un test ADN, étant curieux d'en apprendre plus sur leur généalogie et en conséquent augmentant les données disponibles.

L'utilisation de ces données dans la généalogie génétique a deux axes principales, l'identification de l'appartenance à une certaine population et l'identification de personnes avec un lien de parenté d'un certain degrés. Dans le premier cas, il faut donc des grandes quantités de données pour identifier des traits génétiques typiques des populations. Dans le deuxième cas, il faut des données génétiques de beaucoup d'individu pour avoir une probabilité raisonnable de pouvoir trouver des personnes avec un certain degrés de parenté. Pour ces deux cas, il est donc nécessaire de pouvoir stocker les données efficacement et de les regrouper dans des bases de données pouvant être facilement cherchées.

Traitement des données[modifier | modifier le code]

Les données génétiques d’un humain sont généralement acquises grâce à une puce à ADN. Les données sortantes de ce procédé sont stockées dans un tableau en format de polymorphisme d'un seul nucléotide (PSN). Le polymorphisme d'un seul nucléotide signifie une différence dans une seule paire de bases nucléiques, qui est présent dans au moins 1% de la population. Environ 90% de toutes les variations génétiques chez les humains sont des PSN. Ces tableaux sont utilisés car une grande partie de l'ADN des humains est pareil entre tous les individus et le polymorphisme d'un seul nucléotide permet de stocker que les bases nucléique qui forment effectivement une différence avec l'ADN référence de la majorité des humains. Vu que le génotype d’une personne est un mélange de deux haplotypes de ses parents, les bases nucléiques à chaque emplacement ne sont pas ordonnés et l’information de quelles bases sont héritées de quel parent n’est pas disponible. Pour la généalogie cette information est cependant essentielle pour trouver des concordances de segments des PSN. La technique de la transformation du génotype en deux haplotypes est appelé « haplotype phasing » ou « haplotype resolution » en anglais.

Si les données génétiques des parents sont disponibles, cette résolution est assez simple en comparant les segments de PSN avec ceux des parents pour déterminer quels segments ont été hérités ensemble. Si les données génétiques des parents ne sont pas disponibles, la résolution est plus compliquée, mais peut être estimée grâce à la similarité d’une grande partie de l’ADN de tous les humains. Différents algorithmes et programmes proposant des solutions pour ces estimations existent, comme PHASE[17], BEAGLE [18], IMPUTE [19], MaCH [20], SHAPEIT2 [21], Eagle [22] ou Eagle2 [23]. La plupart de ces algorithmes sont basés sur des Modèles de Markov cachés. Certains offrent, en plus du phasing aussi une fonctionnalité d’imputation, c’est-à-dire le remplissage de données manquantes à partir de la population référence.[24]

Pour trouver l'appartenance d'un individu à une certaine population, il faut un certain nombre d'échantillons de données génétiques qui sont déjà confirmé d'appartenir à cette population. Il existe plusieurs approches pour faire ce traitement des données de la population référence qui doit être fait préalablement à tout classification concrète. Une possibilité est de le faire manuellement, en demandant par exemple aux personnes de donner eux-même à quelle population ils appartiennent. Cette possibilité a néanmoins le désavantage d'être très susceptible à des erreurs d'attribution de personnes qui se trompent sur leur propre appartenance à une population et de se baser sur les concepts de race établi dans la société. Cela peut ensuite résulter en un biais des résultats obtenus dû à la société qui n'est non voulu. Une autre possibilité est d'utiliser des moyens statistiques pour extraire des groupes d'individu avec de grandes similarités génétiques, et d'ensuite identifier lesquels de ces groupes correspondent à quelles populations. Cela a l'avantage de grouper les individus totalement indépendamment de la notion de race et de population dans la société, et l'attribution d'une étiquette est faite par un petit groupe de personnes à la fin, qui peut être plus attentifs à ne pas être biaisés par ces notions dans la société. Cette méthode est par ailleurs particulièrement utile en médecine, où certains biais liés à la population doivent être réduits, mais où toute notion de race ne fait pas de sens.[25]

Bases de données[modifier | modifier le code]

Que ce soit pour le traitement des données ou pour la recherche généalogique en elle-même, des bases de données de référence sont nécessaires. Suite à la fin du Projet génome humain, des bases de données accessibles publiquement ont été construites pour permettre le partage plus facile des données génomiques. Peu après la construction de ces bases de données génétiques publiques, des préoccupations pour la vie privée ont commencé à apparaître. Il a par exemple été prouvé par des chercheurs qu’il était possible d’identifier des personnes dans les bases de données censées être anonymisées. Plus concrètement des « mélanges » des PSN tirées d'une base de données ont été crée, et la présence d'un individu donné dans ce mélange pouvait être identifié statistiquement. Cela est possible grâce à la comparaison de la distance entre les PSN de l'individu et le mélange à la distance entre les PSN de l'individu et la population référence.[26] Il existe plusieurs solutions pour remédier à ces soucis, comme le contrôle d’accès (déjà utilisé par certaines bases de données), la confidentialité différentielle (visant à rendre impossible l'identification d'un individu en particulier en ajoutant de l'aléatoire, mais qui n'a pas d'influence sur la statistique entière) ou des solutions cryptographiques (où la personne ne partage que des données cryptées avec des tiers, mais qui peuvent être traité sans être décrypté grâce à certaines propriétés mathématiques).[27]

La méthode de constitution et les règles à l’égard de l’utilisation de ces bases de données ont aussi une influence sur la vision et l’acceptation de ces dernières dans la société. Une étude a été menée en Australie par exemple, pour comprendre la réaction de la population à la commercialisation de bases de données génétiques et à différentes utilisation des données provenant de ces dernières. Celle-ci a trouvé que notamment l’utilisation à but lucratif des bases de données génétiques réduisait la confiance dans la base de données de la part des participants. Cependant l'acceptation de l'implication d'entreprises à but lucratif sous certaines conditions semble pouvoir être augmenté par des discussions en profondeur.[28] La plupart des services de généalogie génétique étant proposés par des entreprises privées à but lucratif, ces questions de confidentialité des bases de données et de la vision de la société sont importantes.

Investigation avec la généalogie génétique dans les Etats Unis[modifier | modifier le code]

Les données obtenues grâce aux tests ADN ont permis de résoudre certaines affaires non résolues et récentes. Cette utilisation de la généalogie génétique est très récente et a reçu une importance et une attention croissantes depuis 2018, quand avec l'utilisation de la généalogie génétique, la comparaison des échantillons d'ADN avec la base de données d'une grande entreprise DTC Joseph DaAngelo, également connu sous le nom de Golden State Killer[29], coupable de multiples meurtres et agressions sexuelles a été arrêté.[30]

Les acteurs pour obtenir des données[modifier | modifier le code]

Bien que l'ICC ait permis de résoudre plusieurs cas, il ne s'agit pas d'une méthode facilement applicable. En fait, les agences d'investigation n'ont pas la possibilité d'accéder facilement aux données en raison de l'éthique et des politiques de confidentialité des sociétés dtc. De plus, étant donné qu'il s'agit d'un nouveau champ d'investigation, il existe de nombreuses lacunes dans le système juridique. Les sociétés de CPT n'autorisent normalement l'accès qu'à leurs utilisateurs et à des fins liées à la construction d'un arbre généalogique, à la recherche d'ancêtres et/ou à la recherche de parents pour les personnes adoptées. Les sociétés de DTC ne sont pas les seules à posséder des bases de données, il existe des tiers tels que GEDmatch ou DNASolves.

Les principales compagnies DTCs[31][modifier | modifier le code]

AncesrtyDNA :

Il s'agit de la plus grande entreprise de DTC et elle possède environ 20 millions de profils SNP. Sa politique n'autorise pas l'accès à la base de données à des fins d'enquête ou d'identification de restes humains. Toutefois, une grande partie de ses données ADN et de ses arbres généalogiques sont utilisés dans le cadre d'enquêtes.

23andME :

En janvier 2021, cette société comptait environ 12 millions d'utilisateurs. Elle n'autorise pas non plus l'accès à sa base de données à des fins d'enquête, car elle affirme que cette utilisation est contraire à ses principes et à son objectif principal.

MyHeritage :

Cette société dispose d'environ 4,5 millions de profils SNP et, contrairement aux autres sociétés, permet le transfert gratuit des données provenant de 23andMe, AncestryDNA, FTDNA et Living DNA. Leur politique de confidentialité a radicalement changé depuis que leur base de données a involontairement permis l'arrestation du Golden State Killer. Ils interdisent désormais l'utilisation à des fins légales sans une ordonnance du tribunal.

FamilyTreeDNA (FTDNA)

Il s'agit de la première entreprise de DTC aux États-Unis, fondée au début des années 2000. Aujourd'hui, elle compte environ 1,4 million de profils SNP. Depuis 2019, il permet l'accès au FBI, cependant les utilisateurs qui ne voulaient pas partager leurs données à des fins légales ont la possibilité de bloquer l'accès à des tiers.

GEDmatch[modifier | modifier le code]

GEDmatch a été fondé en 2010 par Curtis Roger et John Olson. Il ne s'agit pas d'une société de DTC car elle ne vend pas de kits de test ADN.[32] GEDmatch est un site Web et dispose d'une base de données publique composée de données ADN provenant d'utilisateurs de diverses sociétés de CPT qui ont décidé de télécharger et de partager leurs informations. La base de données GEDmatch est la base de données la plus utilisée dans le domaine de la généalogie génétique. Depuis 2018, toujours après la capture du Golden State Killer, ils ont modifié leurs conditions en insistant sur la possibilité d'utiliser leurs données dans les enquêtes.

Déroulement de l'investigation avec la généalogie génetique[modifier | modifier le code]

Les États-Unis d'Amérique sont le pays où la pratique de l'enquête généalogique génétique est la plus répandue. En général, si vous n'avez pas suffisamment de preuves et/ou pas de correspondance positive dans le codis au cours d'une enquête, vous pouvez rechercher une correspondance dans les bases de données GedMatch ou Dnasolves. S'il y a une ou plusieurs correspondances positives, un arbre généalogique est construit pour chaque individu possible. Pour construire un arbre généalogique, toutes les informations possibles sont utilisées, comme les archives des journaux, les médias sociaux, les arbres généalogiques publics. Les arbres généalogiques permettent de vérifier s'il existe des corrélations entre la victime et les personnes figurant dans l'un des arbres construits. La précision d'une correspondance positive avec un utilisateur de bases de données génétiques n'est pas seulement déterminée par la proximité de l'échantillon d'ADN du suspect, mais aussi par la qualité et la quantité d'informations accessibles.

En 2019, le DoJ (département américain de la justice) a mis à jour ses conditions concernant cette pratique. L'utilisation de l'ADN dans les enquêtes doit être fondée sur le principe : "Codis first and last". Ce principe signifie qu'avant d'utiliser la généalogie génétique, il faut vérifier qu'une personne ne présente pas de concordance avec le codis, mais pas seulement, une personne ne peut pas être arrêtée uniquement après une concordance positive avec la base de données d'une société de DTC. En cas de concordance positive, le suspect doit subir un test ADN et ce résultat doit présenter une concordance positive avec l'échantillon précédemment introduit dans le codis. [33]

Bénéfices[modifier | modifier le code]

La généalogie génétique donne aux généalogistes un moyen de contrôler et d'étendre leurs résultats pour la généalogie avec de l'information obtenue par les tests ADN. Un résultat très similaire à celui d'un autre individu peut :

  • fournir des endroits pour de futures recherches généalogiques
  • aider à déterminer la région ancestrale
  • découvrir des parents vivants
  • valider une recherche en cours
  • confirmer ou rejeter des liens suspectés entre des familles
  • prouver ou rejeter des théories concernant l'origine de population
  • un sujet commun d'intérêt à travers les cultures

Inconvénients[modifier | modifier le code]

Les personnes qui redoutent les tests ADN citent une des inquiétudes suivantes :

  • Coût des tests
  • Qualité des tests
  • Inquiétudes concernant la vie privée et les libertés

Finalement, les tests ADN-Y et l'ADNmt tracent seulement un seul lignage (le lignage du père du père du père, etc., .. de la personne et le lignage de la mère de la mère de la mère, etc., .. de la personne). 10 générations plus tôt, un individu a jusqu'à 1024 ancêtres possibles (moins si parmi les ancêtres, des cousins se sont mariés) et les tests ADN-Y ou ADNmt étudient seulement un de ses ancêtres, aussi bien que leurs descendants et leurs frères et sœurs (frères pour l'ADN-Y, frères et sœurs pour l'ADNmt). Cependant beaucoup de généalogistes conservent les références de beaucoup de cousins de différents degrés (1er ou germain, 2e, 3e, etc., avec des noms de famille différents) dont les ADN-Y et ADNmt sont différents, et ainsi seront encouragés de demander des tests pour trouver des lignages ADN supplémentaires. Malgré les difficultés d'analyse et le plus grand coût, les tests ADN sur les autosomes et le chromosome X s'accroissent pour compenser ces limites.

Croissance attendue[modifier | modifier le code]

La généalogie génétique est un domaine en croissance rapide (dans certains pays, moins dans d'autres). Comme le coût des tests continue de décroître, le nombre de personnes en test continue de s'accroître. La probabilité de trouver un appariement génétique parmi des bases de données ADN devrait continuer à s'améliorer. Laboratoires et compagnies de test sont engagés dans des recherches et développements actifs qui permettront un plus haut degré de confiance et une meilleure interprétation, comprenant des rapports d'explication historique et des recherches adaptées aux clients. Les entreprises pratiquent de plus en plus de tests sur les chromosomes autosomes et X portant sur des millions marqueurs pour les nouvelles puces à ADN. Les entreprises de test achètent et adaptent les puces auprès d'entreprises du génie génétique aux chiffres d'affaires croissants tels qu'Affimetrix, Illumina, etc. Il y a des témoignages sur les forums (tel celui sur les autosomes de DNA-forums de personnes que ces tests plus chers et plus difficiles à interpréter ont pu trouver ou confirmer de nouveaux cousinages sur des lignées non directes.

Distance génétique entre individus[modifier | modifier le code]

Quand l'arbre généalogique des individus est connu, on détermine l'identité génétique entre individus et on décrit souvent un pourcentage d'identité génétique, comme fraction du génome hérité d'ancêtres communs, au génome total, qui donne toujours approximativement 99,9 % d'identité entre deux humains[34].

Notes et références[modifier | modifier le code]

  1. (en) Steve Olson, « Who’s Your Daddy? », The Atlantic, Jul-Aug 2007, Consulté le 19 février 2009.
  2. Guido Deboeck, « Genetic Genealogy Becomes Mainstream », BellaOnline, accessed 19 Feb 2009
  3. « The Genographic Project: A Landmark Study of the Human Journey », National Geographic, accessed 19 Feb 2009
  4. Genebase, Genetic Genealogy, consulté le 19 février 2009.
  5. « How Big Is the Genetic Genealogy Market? », The Genetic Genealogist, accessed 19 Feb 2009
  6. « https://dna-forums.org/index.php?/forum/40-genetic-dna-companies/ »(Archive.orgWikiwixArchive.isGoogleQue faire ?)
  7. DNA-forums
  8. [1], Worldfamilies
  9. [2], Anthrocivitas
  10. [3],
  11. [4], « RootsWeb is funded and supported by Ancestry.com and our loyal RootsWeb community. »
  12. Cassandra Franklin-Barbajosa, « In the Wake of the Phoenicians: DNA study reveals a Phoenician-Maltese link », National Geographic Online, Oct 2004, accessed 19 Feb 2009
  13. « DNA Clans (Y-Clan) », DNA Ancestry Analysis, Genebase, accessed 19 Feb 2009
  14. http://lists.rootsweb.com/index/other/DNA/GENEALOGY-DNA.html
  15. [5]
  16. Voir transmission mitochondriale pour en savoir plus.
  17. (en) Matthew Stephens, Nicholas J. Smith et Peter Donnelly, « A New Statistical Method for Haplotype Reconstruction from Population Data », The American Journal of Human Genetics, vol. 68, no 4,‎ , p. 978–989 (ISSN 0002-9297, DOI 10.1086/319501, lire en ligne, consulté le )
  18. (en) Sharon R. Browning et Brian L. Browning, « Rapid and Accurate Haplotype Phasing and Missing-Data Inference for Whole-Genome Association Studies By Use of Localized Haplotype Clustering », The American Journal of Human Genetics, vol. 81, no 5,‎ , p. 1084–1097 (ISSN 0002-9297, DOI 10.1086/521987, lire en ligne, consulté le )
  19. (en) Bryan N. Howie, Peter Donnelly et Jonathan Marchini, « A Flexible and Accurate Genotype Imputation Method for the Next Generation of Genome-Wide Association Studies », PLOS Genetics, vol. 5, no 6,‎ , e1000529 (ISSN 1553-7404, PMID 19543373, PMCID PMC2689936, DOI 10.1371/journal.pgen.1000529, lire en ligne, consulté le )
  20. (en) Yun Li, Cristen J. Willer, Jun Ding et Paul Scheet, « MaCH: using sequence and genotype data to estimate haplotypes and unobserved genotypes », Genetic Epidemiology, vol. 34, no 8,‎ , p. 816–834 (PMID 21058334, PMCID PMC3175618, DOI 10.1002/gepi.20533, lire en ligne, consulté le )
  21. (en) Olivier Delaneau, Jean-Francois Zagury et Jonathan Marchini, « Improved whole-chromosome phasing for disease and population genetic studies », Nature Methods, vol. 10, no 1,‎ , p. 5–6 (ISSN 1548-7105, DOI 10.1038/nmeth.2307, lire en ligne, consulté le )
  22. (en) Po-Ru Loh, Pier Francesco Palamara et Alkes L. Price, « Fast and accurate long-range phasing in a UK Biobank cohort », Nature Genetics, vol. 48, no 7,‎ , p. 811–816 (ISSN 1546-1718, PMID 27270109, PMCID PMC4925291, DOI 10.1038/ng.3571, lire en ligne, consulté le )
  23. (en) Po-Ru Loh, Petr Danecek, Pier Francesco Palamara et Christian Fuchsberger, « Reference-based phasing using the Haplotype Reference Consortium panel », Nature Genetics, vol. 48, no 11,‎ , p. 1443–1448 (ISSN 1546-1718, PMID 27694958, PMCID PMC5096458, DOI 10.1038/ng.3679, lire en ligne, consulté le )
  24. (en) Yuan Wei, Ryan Lewis, Ardalan Naseri et Shaojie Zhang, « Chapter 4 - Genealogical search using whole-genome genotype profiles », dans Responsible Genomic Data Sharing, Academic Press, (ISBN 978-0-12-816197-5, DOI 10.1016/b978-0-12-816197-5.00004-8, lire en ligne), p. 51–94
  25. Joan H. Fujimura et Ramya Rajagopalan, « Different differences: The use of 'genetic ancestry' versus race in biomedical human genetic research », Social Studies of Science, vol. 41, no 1,‎ , p. 5–30 (ISSN 0306-3127, lire en ligne, consulté le )
  26. (en) Nils Homer, Szabolcs Szelinger, Margot Redman et David Duggan, « Resolving Individuals Contributing Trace Amounts of DNA to Highly Complex Mixtures Using High-Density SNP Genotyping Microarrays », PLOS Genetics, vol. 4, no 8,‎ , e1000167 (ISSN 1553-7404, PMID 18769715, PMCID PMC2516199, DOI 10.1371/journal.pgen.1000167, lire en ligne, consulté le )
  27. (en) Xinghua Shi et Xintao Wu, « An overview of human genetic privacy », Annals of the New York Academy of Sciences, vol. 1387, no 1,‎ , p. 61–72 (ISSN 0077-8923 et 1749-6632, PMID 27626905, PMCID PMC5697154, DOI 10.1111/nyas.13211, lire en ligne, consulté le )
  28. (en) Dianne Nicol, Christine Critchley, Rebekah McWhirter et Tess Whitton, « Understanding public reactions to commercialization of biobanks and use of biobank resources », Social Science & Medicine, vol. 162,‎ , p. 79–87 (ISSN 0277-9536, DOI 10.1016/j.socscimed.2016.06.028, lire en ligne, consulté le )
  29. Daniel Kling, Christopher Phillips, Debbie Kennett et Andreas Tillmar, « Investigative genetic genealogy: Current methods, knowledge and practice », Forensic Science International: Genetics, vol. 52,‎ , p. 102474 (ISSN 1872-4973, DOI 10.1016/j.fsigen.2021.102474, lire en ligne, consulté le )
  30. Ellen M. Greytak, CeCe Moore et Steven L. Armentrout, « Genetic genealogy for cold case and active investigations », Forensic Science International, vol. 299,‎ , p. 103–113 (ISSN 0379-0738, DOI 10.1016/j.forsciint.2019.03.039, lire en ligne, consulté le )
  31. Daniel Kling, Christopher Phillips, Debbie Kennett et Andreas Tillmar, « Investigative genetic genealogy: Current methods, knowledge and practice », Forensic Science International: Genetics, vol. 52,‎ , p. 102474 (ISSN 1872-4973, DOI 10.1016/j.fsigen.2021.102474, lire en ligne, consulté le )
  32. Daniel Kling, Christopher Phillips, Debbie Kennett et Andreas Tillmar, « Investigative genetic genealogy: Current methods, knowledge and practice », Forensic Science International: Genetics, vol. 52,‎ , p. 102474 (ISSN 1872-4973, DOI 10.1016/j.fsigen.2021.102474, lire en ligne, consulté le )
  33. Daniel Kling, Christopher Phillips, Debbie Kennett et Andreas Tillmar, « Investigative genetic genealogy: Current methods, knowledge and practice », Forensic Science International: Genetics, vol. 52,‎ , p. 102474 (ISSN 1872-4973, DOI 10.1016/j.fsigen.2021.102474, lire en ligne, consulté le )
  34. AMNH > Our genetic identity. Consulté le 21 mars 2009.

Lectures recommandées[modifier | modifier le code]

  • Terrence Carmichael and Alexander Kuklin (2000). How to DNA Test Our Family Relationships. DNA Press. Livre précoce (et encore unique) sur les paternités et autres tests de cousinages. Carmichael est un fondateur de GeneTree.
  • L. Cavalli-Sforza et al. (1994). The History and Geography of Human Genes. Princeton: Princeton University Press. Dense mais aisé à comprendre.
  • Luigi-Luca and Francesco Cavalli-Sforza (1998). The Great Human Diasporas, translated from the Italian by Sarah Thorne. Reading, Mass. : Perseus Books. Plus facile à lire que les autres livres de ce professeur de Stanford.
  • Colleen Fitzpatrick and Andrew Yeiser (2005). DNA and Genealogy. Rice Book Press. Très estimé dans les revues de génétique pour la manière de la présenter auprès des non-professionnels.
  • Clive Gamble (1993). Timewalkers: The Prehistory of Global Colonization. Stroud: Sutton. Compte-rendu populaire de la Préhistoire humaine par un anthropologue/archéologue britannique. Article d'American Scientist.
  • Cyndi Howells (n.d.). Netting Your Ancestors – Genealogical Research on the Internet. Baltimore: Genealogical Publishing Company. Guide des sources électroniques par l'auteur du site web Cyndi’s List.
  • M. Jobling (2003). Human Evolutionary Genetics.: Textes du niveau standard college et graduate school par un spécialiste reconnu.
  • Steve Olson (2002). Mapping Human History. Boston: Houghton Mifflin Company. Atlas des populations importantes.
  • Stephen Oppenheimer (2003). The Real Eve. Modern Man’s Journey out of Africa. Carroll & Graf. Champions de la théorie de la « route des ramasseurs des plages » sur les premières propagations de l'homme anatomiquement moderne avec beaucoup de détails.
  • PBS (2003). The Journey of Man DVD. Broadcast aired in January 2003, Spencer Wells, host.
  • Donald Panther-Yates and Elizabeth Caldwell Hirschman (2006). « DNA Haplotyping and Diversity: An Anthropogenealogical Method for Researching Lineages and Family Ethnicity », International Journal of the Humanities 2:2043-55. Guide pour trouver des paréages dans les banques de sonnées mondiales et interpréter l'information génétique en termes d'histoire et des récentes études de migrations.
  • Chris Pomery (2004) DNA and Family History: How Genetic Testing Can Advance Your Genealogical Research. London: National Archives. Guide précoce des généalogistes amateurs. Maintenant mis à jour (2007) dans Family History in the Genes: Trace Your DNA and Grow Your Family Tree.
  • Alan Savin (2003). DNA for Family Historians. Maidenhead: Genetic Genealogy Guides. Papier d'abord publié en 2000, maintenant disponible aussi en allemand.
  • Thomas H. Shawker (2004). Unlocking Your Genetic History: A Step-by-Step Guide to Discovering Your Family's Medical and Genetic Heritage (National Genealogical Society Guide, 6). Guide sur le difficile sujet de l'histoire familiale médicale et des maladies génétiques.
  • Megan Smolenyak and Ann Turner (2004). Trace Your Roots with DNA: Using Genetic Tests to Explore Your Family Tree. Rodale Books, (ISBN 978-1594860065). Outil pour des généalogistes amateurs par une conférencière de séminaire et une modératrice de forums généalogiques.
  • Linda Tagliaferro (1999). The Complete Idiot’s Guide to Decoding Your Genes. Alpha Books. En langage de chaque jour, une explication du rôle que les gènes jouent dans la formation de ce que nous sommes.
  • Spencer Wells (2004). The Journey of Man. New York: Random House.

Voir aussi[modifier | modifier le code]

Liens externes[modifier | modifier le code]

Organisation et instituts de recherche[modifier | modifier le code]

Sites web d'information[modifier | modifier le code]

Projets haplogroupes et patronymes[modifier | modifier le code]

Bases de données ADN[modifier | modifier le code]

Tests chromosome Y (ADN-Y)[modifier | modifier le code]

Tests ADN mitochondrial ADNmt)[modifier | modifier le code]

  • Mitosearch — Une des plus grandes bases ADNmt accessible au public
  • MtDNA Test Results Log – Premier log/blog public pour poster, partager, et comparer les résultats de tests ADN
  • base mitochondriale SGMF – 51.000 séquences de recherche (de np 15841 à np 720) liés à environ six millions d'ancêtres enregistrés