encyclopedie

ENCODE : gigantesque encyclopédie de l’ADN qui décrypte les séquences non-codantes

Le consortium de recherche international ENCODE confirme que l’ADN poubelle a bel et bien une fonction, et une fonction essentielle même, soit la régulation des gènes.

Une équipe internationale révèle que la plus grande partie de ce qui était appelé ADN poubelle dans le génome humain serait en fait une sorte de poste de contrôle gigantesque, avec des millions d’interrupteurs régulant l’activité de nos gènes. Sans ces interrupteurs les gènes ne fonctionneraient pas et des mutations dans ces régions pourraient induire des maladies. Ces nouvelles données, découvertes par environ 400 scientifiques impliqués dans le projet ENCODE, sont si complexes et détaillées qu’elles ont nécessité la mise en place d’un nouveau modèle de publication qui relie une multitude de documents électroniques et d’ensembles de données. Ces résultats sont publiés dans trente articles interconnectés et en libre d’accès, dans trois revues scientifiques : Nature, Genome Biology, et Genome Research.

Tout comme le projet Génome Humain avait révolutionné la recherche biomédicale, ENCODE va approfondir notre compréhension et ouvrir de nouvelles voies de recherche en biomédecine. Sous la houlette du National Genome Research Institute (NHGRI) aux Etats-Unis et du LEBM-Institut Européen de Bioinformatique (LEBM-IEB) au Royaume- Uni, ENCODE a créé une carte détaillée des fonctions du génome identifiant plus de 4 millions d’interrupteurs génétiques. Cette ressource essentielle aidera les chercheurs à cibler plus précisément les zones importantes pour la recherche sur les maladies humaines.

«Cela est d’autant plus vrai que ces interrupteurs sont pour la plupart spécifiques à l’homme ou aux primates, suggérant que les réglages génétiques fins qu’ils permettent sont à la base de certaines différences fondamentales entre les espèces»,

explique Alexandre Reymond, professeur au Centre intégratif de génomique de l’université de Lausanne (UNIL) qui a participé a projet.

Près de 80% du génome est actif

«Notre génome est en vie grâce à ces interrupteurs: des millions de places qui déterminent si un gène doit être «allumé» ou «éteint»,

explique Ewan Birney, du EBM-IEB, coordonnateur en chef de l’analyse pour ENCODE.

«Le projet Génome Humain a montré que seuls 2% du génome contenaient des gènes, les instructions pour fabriquer des protéines. Grâce à ENCODE nous savons maintenant qu’environ 80% du génome ont une fonction active.»

En clair, la proportion du génome qui est responsable du contrôle de la production des protéines est beaucoup plus importante que la part du génome qui fabrique simplement ces protéines.

«L’analyse de cette nouvelle encyclopédie va sans doute nous occuper pendant plusieurs années,

confirme Stylianos Antonarakis, directeur du Département de médecine génétique et développement de la Faculté de médecine de l’université de Genève (UNIGE) également membre du consortium.

Mais comme toute encyclopédie, elle est incomplète et toujours en chantier. Il nous reste en effet du travail pour comprendre le génome de chaque individu et ainsi de contribuer des avancées majeures dans le domaine de la médecine personnalisée.»

Alexandre Reymond de l’UNIL rebondit:

«Il faut en effet se souvenir que 20% de notre génome restent à ce jour sans annotation. Autrement dit, nous ne savons quel est leur rôle.»

Iam Dunham, chercheur au LEBMIEB et acteur clé pour ce qui concerne la coordination de l’analayse insiste également sur cet aspect médical.

«Les données d’ENCODE peuvent être utiles pour tous les chercheurs en biomédecine, quelque soit la pathologie sur laquelle ils travaillent. Dans la plupart des cas on sait quels gènes jouent un rôle dans une maladie, mais pas quels interrupteurs sont impliqués. Or ces interrupteurs peuvent se révéler surprenants car, dans certains cas, leur localisation pourrait logiquement pointer vers un rôle dans une toute autre maladie.»

ENCODE fournit ainsi des pistes très prometteuses pour la découverte de mécanismes-clés dans les maladies, et pour le maintien de la santé. Celles-ci pourraient être exploitées pour créer de nouveaux médicaments, ou pour mieux définir la cible de traitements actuels.

ENCODE permet en effet de regarder au-delà de la structure linéaire du génome et de comprendre comment le réseau est connecté.

«Nous commençons à comprendre les données générées par les études d’association pangénomiques,

commente le Dr Michael Snyder, professeur à l’université de Stanford et chercheur principal d’ENCODE.

En allant au-delà de la localisation de certains gènes, vers les séquences qui les contrôlent.»

Comme le génome a une forme tridimensionnelle très complexe, ces contrôles peuvent en effet être linéairement très éloignés des gènes qu’ils régulent et se rapprocher par des courbures et des repliements. Sans ENCODE peut-être ces régions na’uraient-elles jamais été regardées. Dès lors, il s’agit d’un pas en avant très important pour la compréhension du fonctionnement de l’être humain.

Donner du sens aux données génomiques

Jusqu’à récemment la production et le stockage de volumes importants de données représentaient un défi pour la recherche biomédicale. Actuellement, grâce à la baisse des coûts et à l’augmentation de la productivité du séquençage génomique, ce défi s’est déplacé vers l’analyse: donner du sens aux données produites par les études d’association pangénomiques. Les partenaires d’ENCODE ont exploré tout le génome de façon systématique, en utilisant les mêmes méthodes informatiques et expérimentale, et les mêmes réactifs, que l’ont trouve dans tous les laboratoires de la planète.

L’échelle du projet ENCODE est impressionnante: il a fédéré les efforts de 442 scientifiques dans 32 laboratoires en Suisse (UNIGE et UNIL), au Royaume-Uni, aux Etats-Unis, en Espagne, à Singapour, et au Japon. Ensemble, ils ont généré et analysé plus de 15 térabytes (15 milliards de bytes) de données brutes, qui sont maintenant intégralement dans le domaine public. Le projet a consommé l’équivalent de 300 ans de temps d’analyse informatique pour étudier 147 types de tissus et déterminer ce qui «allume» ou «éteint» certains gènes et comment ces interrupteurs diffèrent d’un type cellulaire à l’autre.

Les articles publiés représentent plusieurs centaines de pages de recherche. Mais le groupe de publication électronique de Nature reconnait que les «pages» appartiennent maintenant au passé. L’intégralité du contenu ENCODE publié, dans les trois revues, est connecté par l’intermédiaire de fils pour que les lecteurs puissent suivre leurs sujets d’intérêt parmi les articles, et ce jusqu’aux données originales.

«Fournir la meilleure expertise aux meilleures personnes, c’est notre objectif ultime»,

explique Ewan Birney.

«ENCODE a prouvé que les plus grands chercheurs en sciences de la vie sont très bons pour collaborer étroitement sur de grands projets et produire d’excellentes ressources de bases pour toute la communauté.»

Vers une encyclopédie interactive

«Jusqu’à présent, chacun produisait et publiait ses propres données, ce qui avait pour effet, non intentionnel, d’en limiter l’accès à une certaine communauté de niche, par des publications statiques. Comment quelqu’un à l’extérieur de cette communauté aurait pu utiliser ces données, alors qu’il ne savait pas qu’elles existaient?
Nous disposons maintenant d’une encyclopédie interactive que tout le monde peut utiliser et qui fera une énorme différence.»

commente Roderic Guigo du Centre de Regulació Genómica (CRG) de Barcelone, Espagne1.

Notes et références

  1. Source : Unil []

Commentaires Clos.

Note aux utilisateurs concernant la publication d'informations médicales :
Publiez uniquement des informations que vous jugez véridiques à la lumière de vos connaissances.
Si les données médicales diffusées ne proviennent pas de votre expérience personnelle, vous devez indiquer les sources (références, liens, etc.).