Panel HGDP-CEPH
Mars 2020, le panel des ADN HGDP-CEPH distribué par le CRB du CEPH a été séquencé par le Wellcome Sanger Institute sur l'ensemble du génome donnant lieu à une publication majeure : Global human genomes reveal rich genetic diversity shaped by complex evolutionary history. Les résultats ont été publiés dans le journal Science le 18 mars 2020.
Présentation du panel HGDP-CEPH
Au début des années 2000, avec le soutien des Professeurs Jean Dausset et Gilles Thomas, le Professeur Howard Cann, membre de la Fondation Jean Dausset, a collaboré avec le Professeur Cavalli-Sforza (Université de Stanford, USA) pour mettre en place le panel d'étude de la diversité génétique mondiale du génome humain HGDP-CEPH.
Ce panel HGDP-CEPH est constitué de 1063 lignées cellulaires lymphoblastoïdes correspondant à 1048 individus issus de 52 populations réparties dans le monde entier qui sont conservées dans le Centre de Ressources Biologiques de la Fondation Jean Dausset-CEPH. Il est utilisé dans le cadre de recherches internationales menées par plus d'une centaine de collaborateurs, pour mieux appréhender de nombreuses questions relatives à la génétique des populations, l'histoire des populations humaines modernes ainsi que celle de la diversité de leur génome.
Ces lignées lymphoblastoïdes permettent de préparer de l'ADN, de l'ARN et des culots cellulaires en quantité illimitée pour les distribuer aux laboratoires collaborateurs. Elles ont été établies par diverses équipes de par le monde à partir de prélèvements sanguins, réalisés après l'obtention du consentement des volontaires et la garantie du maintien de leur anonymat. Chaque lignée lymphoblastoïde est identifiée par un code numérique appelé identifiant HGDP. Les informations associées à chacune d'entre-elles sont limitées au sexe, à l'origine géographique et au nom de la population à laquelle elle se réfère.
Les ADN du panel ont été distribués à près de 200 collaborateurs, répartis principalement en Amérique du Nord, en Europe et en Asie, en vue de projets de génotypage ou de séquençage. Chacun de ces collaborateurs s'est engagé à transmettre les données générées sur le panel au CEPH qui maintient une base de données publique.
Le panel H1063 comprend 13 paires de lignées en duplicat, 2 individus dits génétiquement atypiques et des individus apparentés aux 1er ou 2nd degré. Le panel H952 comprend la sélection des individus non apparentés (au 1er et 2nd degré) sans les 13 paires de lignées en duplicat. Ces 2 panels sont distribués en rack comprenant 96 tubes étiquetés avec un code à barres 2D.
Depuis 2002, date à laquelle la distribution du panel a débuté, les recherches réalisées sur celui-ci ont permis près de 200 publications dans des journaux à comité de lecture et d'impact élevé.
Si vous souhaitez davantage d'information, envoyez un e-mail au Coordinateur du programme HGDP-CEPH.
Soumission de génotypes
Les utilisateurs du panel qui souhaitent soumettre des données pour la 1ère fois doivent prendre contact avec le gestionnaire de la base de données pour obtenir un login/mot de passe. Ils pourront ensuite soumettre directement des données sous forme de fichier informatique.
Les données soumises doivent inclure les informations génétiques et génomiques relatives aux marqueurs et aux séquences en suivant :
la nomenclature officielle (HUGO/NCBI)
l'identifiant genbank
l'identifiant dbSNP (rs ou ss number)
l'identifiant local
le type de marqueur (SNP, CNV, STRP)
le changement nucléotidique pour les SNP et les indels
les séquences répétées pour les STRP
les allèles ancestraux
la position du marqueur sur le chromosome (numéro du build NCBI)
la méthode de génotypage/séquençage
les génotypes de chaque ADN HGDP-CEPH (nucléotide ou format 1,2)
le nombre de répétitions pour les STRPs
les nstd, nsv et nssv number pour les CNV
Soumission de séquences
Les séquences de type Sanger doivent être soumises en format FASTA, Genbank ou FASTQ avec les indications de qualité et de taux d'erreur.
Les séquences de type Illumina, Solid, 454 doivent être soumises à un des centres d'archivage de séquences suivants :
Lorsque vous soumettez des données, un titre d'étude vous est demandé. Merci d'inclure le nom de la ressource dans ce titre “ HGDP-CEPH Human Genome Diversity Panel ”. Le nom de l'étude peut être par exemple : “ whole genome resequencing 10x of HGDP-CEPH Human Genome Diversity Panel samples ”.
Les séquences doivent être identifiées en utilisant l'identifiant anonyme HGDP par exemple : HGDP00989.
Pour chaque soumission, merci d'ajouter au fichier XML un lien à la base de données HGDP-CEPH en format XML. Pour le SRA du NCBI :
<SAMPLE_LINKS>
<SAMPLE_LINK>https://www.cephb.fr/common/HGDPid_populations.xls
</SAMPLE_LINK>
</SAMPLE_LINKS>
Pour le SRA de l'EBI:
<SAMPLE_ATTRIBUTE>
<TAG>HGDP-CEPH Database Link</TAG>
<VALUE>https://www.cephb.fr/common/HGDPid_populations.xls</VALUE>
</SAMPLE_ATTRIBUTE>
Ces liens nous permettront d'identifier les soumissions de données pour les individus du panel HGDP-CEPH et de les inclure dans la section dédiée à la base de données du panel.
Conditions d'accès au panel HGDP-CEPH
Les ADN du panel HGDP-CEPH sont accessibles à la communauté scientifique sur une base collaborative dans le cadre exclusif de programmes de recherche académique. Les collaborateurs s'engagent à génotyper tous les ADN du panel avec au minimum 50 marqueurs génétiques et à communiquer les résultats au CEPH moins de 6 mois après la fin du génotypage ou de la publication des résultats en citant la Fondation Jean Dausset - CEPH dans les remerciements.
Les données sont intégrées dans une base centralisée au CEPH accessible aux collaborateurs mais aussi à la communauté scientifique internationale. Un panel de référence pour des projets de séquençage est également mis à la disposition des collaborateurs. Les données de séquençage, de type Sanger, générées sur les ADN HGDP-CEPH sont communiquées au CEPH dans les mêmes délais que les données de génotypage pour être intégrées dans la base de données.
Les projets de séquençage de nouvelle génération sont discutés avec le Coordinateur du programme HGDP-CEPH . Les données relatives au séquençage de l'ensemble du génome sont disponibles par un lien avec un site hébergeur (SRA au NCBI ou au DDBJ, ENA à l'EBI). Les collaborateurs s'engagent à ne pas transférer les ADN à d'autres laboratoires sans l'autorisation du Coordinateur du programme HGDP-CEPH.
Pour tout nouveau projet, un résumé du projet de recherche ainsi qu'un accord écrit de collaboration selon les termes mentionnés ci-dessus doivent être transmis au Coordinateur du programme HGDP-CEPH.
Des ARN peuvent également être mis à disposition des collaborateurs pour des études d'expression après acceptation du projet collaboratif.
La Fondation Jean Dausset n'a pas de budget dédié pour réaliser les expansions cellulaires, l'extraction d'ADN ou d'ARN, les quantifications et les contrôles de qualité, la distribution des ADN et ARN. Les matériels biologiques mis à disposition de la communauté scientifique internationale sont ainsi facturés à prix coûtant.
Les demandes de matériels biologiques, validées par le coordinateur de l'étude, sont traitées après réception d'un bon de commande, comprenant les informations suivantes transmises par l'institution du laboratoire demandeur :
date d'édition du bon de commande
numéro du bon de commande
adresse de facturation
numéro de TVA intracommunautaire
identifiant du panel (H1063 ou H952) ou des ADN commandés (ex. : HGDP01340.) sous un format excel
quantité en μg requise (multiple de 5μg)
numéro de compte du transporteur
Ce bon de commande est transmis par email au Responsable du CRB.
Téléchargez les caractéristiques du panel et les conditions d'accès détaillées :