Synthèse Ann Biol Clin 2014 ; 72 (1) : 25-48

La médecine génomique, une réalité en pleine évolution Deuxième partie*

Copyright © 2017 John Libbey Eurotext. Downloaded by an anonymous user on 18/01/2017.

Genomic medicine: the new way of thinking medicine Present and future – Part two** Jérôme Lamoril1 Marc Bogard2

Résumé. Les nouvelles techniques de séquenc¸age constituent une révolution médicale dont les applications en médecine sont considérables. Nous sommes à une période technologique charnière majeure. En effet, le saut technologique réalisé par ces nouvelles machines permet désormais d’analyser notre génome de manière élargie, voire en totalité. Les applications sont considérables dans tous les domaines de la médecine d’autant plus qu’en parallèle de cette révolution, de nouvelles molécules ciblant les protéines codées par certains gènes permettent d’espérer des survies prolongées, voire des guérisons dans certains cancers ou de viser des traitements dans d’autres pathologies. La génétique alors réservée aux généticiens arrive progressivement dans la médecine quotidienne. Une nouvelle fac¸on de penser la médecine est en train de germer. Cet article expose dans ses principales lignes les applications actuelles, mais aussi les défis et les problèmes portés par ces nouvelles technologies dans le monde médical tant pour les professionnels de la génétique que pour les médecins non généticiens qui seront de plus en plus confrontés à ces nouvelles analyses.

1 Département de génétique moléculaire, Hôpital Bichat, Hôpitaux Universitaires Paris Nord Val de Seine, Paris, France 2 Laboratoire de biologie, Centre hospitalier d’Argenteuil, France

Mots clés : génome humain, technique de Sanger, génomique, séquen¸cage Abstract. New sequencing techniques are revolutionizing medical practice as its applications are numerous and considerable. We are living a technological turning point in molecular medicine. Indeed, thanks to these new machines, this technological leap allowed us to analyse the human genome with an elarged or even a total view. Genome analysis has applications in all medical fields from now on. Gene analysis in parallel with personalized therapy help in prolonged survival or even cures in some cancers or other diseases. Genetics is progressively arriving in every field of clinical practice. A new way of thinking clinics is born. This publication describes in its main lines these new applications, their problems and their challenges for geneticists as much as for other practitioners in the medical fields.

doi:10.1684/abc.2013.0930

Key words: human genome, Sanger, genomics, sequencing L’année 2013 marque le dixième anniversaire de l’achèvement officiel du séquenc¸age du premier génome humain (Human genome project). Cette date historique marque le début de la médecine génomique en permettant d’établir les fondations d’une nouvelle médecine à

*

Tirés à part : J. Lamoril

l’échelle moléculaire (même si la génétique moléculaire existe depuis les années 1980) et en stimulant l’arrivée de nouvelles technologies d’analyse moléculaire (les séquenceurs de nouvelle génération, les nouveaux outils de bio-informatique, le développement de la biologie des

La première partie de ce travail a été publiée dans Immunoanal Biol Spec 2013 ; 28 (2-3) : 93-108. First part has been published in Immunoanal Biol Spec 2013; 28(2-3): 93-108.

**

Pour citer cet article : Lamoril J, Bogard M. La médecine génomique, une réalité en pleine évolution Deuxième partie. Ann Biol Clin 2014 ; 72(1) : 25-48 doi:10.1684/abc.2013.0930

25

Synthèse

Copyright © 2017 John Libbey Eurotext. Downloaded by an anonymous user on 18/01/2017.

systèmes, l’établissement de nouvelles bases de données, etc.). La médecine génomique prend progressivement pied dans les laboratoires et son apport dans le diagnostic, le traitement et le suivi du patient devient indispensable. Dans cette deuxième partie, nous allons présenter les aspects actuels de cette médecine génomique. Nous évoquerons aussi l’avenir dans ce domaine. Il est conseillé au lecteur de relire la première partie de cet article pour comprendre certaines notions reprises dans ce document [1].

Les succès de la médecine génomique en 2013 Les technologies de séquenc¸age Les nouvelles techniques de séquenc¸age appelées encore séquenc¸age de nouvelle génération (NGS, next-generation sequencing) ont été décrites à la fin des années 1990. Leur utilisation dans les laboratoires de recherche a débuté dès l’année 2005. Grâce aux nouveaux séquenceurs, le coût du séquenc¸age a considérablement diminué passant de 100 millions de dollars au début des années 2000 à environ 3 000 dollars actuellement pour un génome entier (et environ 700 D pour un exome, qui représente 1,5 % du génome entier) [2] (figure 1). À ce jour, un nombre croissant de laboratoires de génétique constitutionnelle (laboratoires étudiant les maladies héréditaires) analyse les pathologies par séquenc¸age d’exome et/ou par séquenc¸age de plusieurs zones géniques (analyse d’amplicons obtenues par PCR multiplex, appelée aussi

séquenc¸age ciblé). Le but de ces analyses est de rechercher des mutations sur un nombre potentiellement important de gènes candidats ou sur des gènes de grande taille (contenant de nombreux exons). Le séquenc¸age d’exome (analyse des parties codantes des gènes, souvent associée à l’analyse de parties non codantes des exons, des jonctions exons/introns, et éventuellement des promoteurs) est une stratégie de plus en plus utilisée pour les maladies mendéliennes, maladies héréditaires rares. Les premières utilisations du séquenc¸age d’exome réalisées avec succès pour des maladies mendéliennes ont été rapportées en 2009 pour le syndrome de Freeman-Sheldon, le syndrome de Miller, la diarrhée congénitale au chlore [3-6]. En parallèle de cette technologie, les études d’association tout génome (GWAS, Genome wide association studies) ont permis de trouver de nouveaux variants associés à de nombreuses pathologies et de découvrir de nouvelles voies métaboliques insoupc¸onnées et impliquées dans ces dernières (notamment dans les maladies inflammatoires, les cancers et les maladies infectieuses), ainsi que dans les maladies dites communes (comme les diabètes, l’hypertension artérielle, les maladies cardiovasculaires). Le séquenc¸age ciblé de pathologies : un tournant en médecine génomique Jusqu’à aujourd’hui, le séquenc¸age selon la technique de Sanger décrite il y a 30 ans est considérée comme la technique de séquenc¸age de référence (gold standard comme disent les Anglo-Saxons). Elle est encore utilisée dans l’analyse de nombreuses maladies héréditaires comme

$100M

$10M

Moore’s Law

$1M

$100K

$10K

NIH

National Human Genome Research In stitute

genome.gov/sequencingcosts

$1K 2001 2002

2003

2004

2005

2006

2007

2008

2009

2010

2011

2012

2013

Figure 1. Évolution du coût du séquenc¸age du génome humain de 2001 à 2013.

26

Ann Biol Clin, vol. 72, n◦ 1, janvier-février 2014

Copyright © 2017 John Libbey Eurotext. Downloaded by an anonymous user on 18/01/2017.

La médecine génomique, une réalité en pleine évolution

par exemple la mucoviscidose (dont le gène muté est CFTR). Cependant, de nombreuses maladies présentent une grande hétérogénéité génétique. C’est le cas par exemple de la rétinite pigmentaire (dégénérescence de la rétine aboutissant à une perte progressive de la vue et la cécité) dans laquelle au moins 60 gènes sont impliqués. Dans ce dernier exemple, l’identification des mutations par la technique de Sanger est non seulement longue, fastidieuse et coûteuse mais aussi aléatoire, le phénotype clinique n’orientant pas vers un gène en particulier (absence de corrélation génotype/phénotype). A l’aide des nouveaux séquenceurs, l’analyse d’une telle pathologie est désormais possible avec un laps de temps d’analyse réduit, un coût bien moindre et une probabilité de découvrir le gène causal important. L’évolution des laboratoires cliniques de génétique moléculaire vers l’utilisation des séquenceurs de nouvelle génération Depuis environ 1 à 2 ans, on assiste à une transition des laboratoires vers ces nouvelles machines. Cette transition s’applique progressivement non seulement vers les laboratoires cliniques de génétique constitutionnelle, mais aussi vers ceux de génétique somatique et de microbiologie. On passe donc progressivement et schématiquement de l’analyse d’un gène (technique de Sanger) vers l’analyse multi-gènes (nouveaux séquenceurs) (tableau 1). Même les analyses par CGH (Comparative genomic hybridization ou puces génomiques d’hybridation comparative) dont l’objectif est la mise en évidence de réarrangements géniques (duplication ou délétion de régions génomiques par exemple) sont progressivement remplacées par ces technologies [7]. Néanmoins, à ce jour, la technique de Sanger reste d’actualité lorsque l’analyse concerne un petit gène ou quelques exons (par exemple, séquenc¸age d’un exon dans le cadre d’une enquête familiale pour laquelle la mutation est connue) ou encore pour confirmer une mutation découverte par les nouveaux séquenceurs. À ce jour, le coût de ces séquenceurs (en 2013 entre 75 et 100 kD selon la machine) et des réactifs justifie leur utilisation dans le cadre de l’analyse de nombreux patients et de plusieurs cibles simultanément. Actuellement, ces séquenceurs sont utilisés tant en génétique constitutionnelle pour les maladies présentant une grande hétérogénéité génétique (comme la rétinite pigmentaire évoquée ci-dessus) que pour les gènes de grande taille (par exemple, analyse du gène de la fibrilline, FBN1 dans la maladie de Marfan qui contient 65 exons) qu’en génétique somatique (cancers, cf. infra). Avec la baisse des coûts, l’apprentissage et la familiarisation des nouveaux modes opératoires et d’analyse bio-informatique de ces séquenceurs, il est fort probable que dans les années à venir, la technique de Sanger disparaîtra complètement. Ann Biol Clin, vol. 72, n◦ 1, janvier-février 2014

Non seulement l’identification des mutations peut-elle être faite, mais une intervention thérapeutique ciblée plus rapide peut être réalisée si le gène muté est rapidement identifié. Par exemple, le gène de l’alpha-galactosidase (GLA) dont les mutations sont responsables de la maladie de Fabry, peut dans certains cas être la cause d’une cardiomyopathie hypertrophique (CMH) isolée (elle représente 2 % des causes de CMH). Or, si ce gène est muté, une thérapie enzymatique spécifique permet de la traiter. Intégrée dans le panel d’analyse des nouveaux séquenceurs dans le cadre des recherches de mutations, l’identification de mutations dans ce gène est rapide et permet une intervention thérapeutique (qui n’existe pas si d’autres gènes dans cette maladie sont mutés). Cette technologie permet aussi d’aider le clinicien à établir un diagnostic. Si on reprend l’exemple des cardiomyopathies, bien qu’un cardiologue expert à l’aide de nombreux tests peut souvent établir le diagnostic précis, il existe parfois des difficultés à distinguer les différents phénotypes possibles (cardiomyopathie dilatée, hypertrophique et ventriculaire droite arythmogène par exemple). L’analyse simultanée de plusieurs gènes impliqués dans les cardiomyopathies permet alors d’identifier le gène causal et de le relier à la pathologie suspectée. On peut aussi citer l’analyse de la surdité chez un enfant. De nombreuses causes peuvent provoquer une hypoacousie/surdité et de nombreux tests sont entrepris pour trouver la cause (tests infectieux, imagerie de l’oreille interne, électrocardiogramme, échographie rénale, dosage des hormones thyroïdiennes par exemple). Actuellement, devant une perte d’audition d’un enfant sans explication évidente, une analyse génétique est d’emblée entreprise. Elle permet de retrouver 50 % des causes d’hypoacousie/surdité. Dans tous les cas, le délai moyen de rendu du résultat est d’environ 2 mois, bien plus rapide que les autres tests sans compter l’errance diagnostique de plusieurs années souvent observées avant d’arriver au diagnostic. Que détectent les séquenceurs nouvelles génération ? Les mutations ponctuelles Dans le cadre de l’oncogénétique somatique (génétique des cancers non héréditaires), ces mutations peuvent être activatrices (d’un oncogène) ou inactivatrices (d’un gène suppresseur de tumeur). Ainsi, les mutations du gène KIT observées dans les GIST (gastrointestinal stromal tumors, tumeurs stromales gastro-intestinales) sont activatrices et répondent au traitement par des inhibiteurs de tyrosine kinase tels que l’imatinib ou le nilotinib. Les patients ayant un mélanome et la mutation activatrice p.Val600Glu dans le gène BRAF répondent au traitement par le vémurafénib (anti-Braf). La détection de certaines mutations dans des gènes ciblés permet donc une action thérapeutique. 27

Synthèse Tableau 1. Exemples d’applications dans lesquelles de nombreux gènes sont impliqués et pour lesquelles l’utilisation de séquenceurs nouvelles génération est réalisée [16]. Type de pathologies

Exemples de pathologies

Cancers

Cancers héréditaires (cancer du sein, syndrome de Lynch [HNPCC, hereditary non polyposis colorectal cancer] Cardiomyopathies Arrythmies (par exemple, syndrome du long QT) Aortopathies (par exemple, syndrome de Marfan) Déficits immunitaires combinés sévères Les fièvres périodiques Ataxies Troubles du métabolisme énergétique cellulaire Anomalies congénitales de la glycosylation Démences et maladies dégénératives (exemple : maladie d’Alzheimer) Autisme, retards intellectuels et du développement Epilepsies Neuropathies héréditaires Microcéphalies Maladies mitochondriales Dystrophies musculaires Maladies oculaires (par exemple, rétinite pigmentaire) Surdités et syndromes associés RASopathies (par exemple, syndrome de Noonan) Maladies avec atteinte pulmonaire (par exemple, mucoviscidose) Troubles de la croissance osseuse

Maladies cardiaques

Copyright © 2017 John Libbey Eurotext. Downloaded by an anonymous user on 18/01/2017.

Les dysfonctionnements immunitaires

Les maladies neurologiques, neuromusculaires et métaboliques

Troubles sensoriels Divers

Nombre de gènes analysables 2-50 50-70 10-30 2-10 18 7 40 656 23-28 32 30-150 53-130 14 11 37-450 12-45 66-140 23-72 10 12-40 12

Cependant, dans la majorité des cancers, de multiples mutations sur de nombreux gènes sont présentes. Il existe une grande hétérogénéité génétique des mutations. Une étude récente a ainsi identifié 750 mutations ponctuelles chez un patient atteint de leucémie aiguë myéloblastique (dont 64 dans les régions codantes ou régulatrices). Seulement 4 des 64 mutations identifiées étaient retrouvées chez d’autres patients atteints de la même pathologie [8]. Cependant, l’analyse des mutations permet d’observer que les voies métaboliques pour lesquelles des gènes sont mutés sont similaires dans un grand nombre de cas. Ainsi, une étude portant sur l’analyse de mutations dans des cancers de la tête et du cou a montré que 30 % des mutations se trouvaient dans des gènes impliqués dans la régulation de la différenciation épidermoïde (par exemple Notch1, IRF6 et TP63) [9]. Ces études permettent de rechercher des traitements visant non seulement des cibles spécifiques mais aussi des voies métaboliques impliquées directement ou non.

régions est possible et permet une approche plus facile et nécessitant moins de matériel que l’utilisation de CGH (Comparative genomic hybridization ou puces génomiques d’hybridation comparative) ou de technique alternative équivalente, techniques actuellement utilisées. Les translocations chromosomiques peuvent également être étudiées telles que le transcrit ABL-BCR ou t(9 ;22)(q34 ;q11) dans la leucémie myéloïde chronique, le transcrit EML-ALK dans les cancers du poumon ou encore le transcrit TMPRSS2-ERG dans le cancer de la prostate.

Les anomalies chromosomiques En continuant notre exemple avec l’oncogénétique somatique, de nombreuses régions du génome sont soit amplifiées soit délétées. C’est le cas par exemple, de la région du chromosome 17q12 contenant le gène HER2 amplifié dans certains cancers du sein. Cette amplification traduit un cancer du sein plus agressif. Ce dernier peut alors être traité par un anti-HER2, le trastuzumab (Herceptin®). À l’aide des nouveaux séquenceurs, l’analyse de telles

L’analyse bio-informatique L’analyse des séquences obtenues par ces appareils est évaluée à l’aide d’outils informatiques puissants. Afin de s’assurer de la qualité des échantillons, quelques contrôles de base sont indispensables. Nous n’en citerons que quelques-uns. Le score de qualité de la séquence appelée Phred : à l’origine, ce score a été développé pour les séquenceurs capillaires (méthode de Sanger) et estimait la probabilité

28

Le transcriptome L’analyse du transcriptome (appelé aussi RNA-seq) permet d’analyser l’expression des ARN et leurs anomalies (par exemple transcrits anormaux comme ceux décrits dans le paragraphe ci-dessus). Certains tests comme MammaPrint® et Oncotype DX® ont été développés dans ces indications (voir infra).

Ann Biol Clin, vol. 72, n◦ 1, janvier-février 2014

Copyright © 2017 John Libbey Eurotext. Downloaded by an anonymous user on 18/01/2017.

La médecine génomique, une réalité en pleine évolution

que la base lue par la machine soit la bonne [10, 11]. Ce score Phred est donné pour toutes les bases de la séquence lues par la machine. Par exemple, si le séquenceur lit la séquence 5’-ACGTGGA.... et que le A souligné a un score Phred de 20, cela signifie que la base allouée à la séquence présente 1/100 d’être fausse (99 % de chance d’être correcte). S’il est de 30, la probabilité d’être fausse est de 1/1 000 (99,9 % de chances d’être correcte). Le score minimum d’un Phred doit être de 20. Certains estiment qu’il est souhaitable d’obtenir un score de 30 au minimum. À noter que pour les séquenceurs capillaires (méthode de Sanger) les utilisateurs jugent qu’une séquence est bonne si le Phred est de 20 au minimum. Le taux de couverture : il représente le nombre de fois qu’une séquence est lue (par exemple, un taux de couverture de 10 fois se dit 10X). Ainsi, lorsqu’il s’agit d’un échantillon de sang, pour qu’une base d’une séquence ait une exactitude de 1/1 million, le taux de couverture doit être de 50X au minimum. Certains fixent ce taux à 100X [12]. Bien qu’aucun consensus officiel n’existe, il semble que dans le cas de la génétique constitutionnelle (génome diploïde), un taux moyen de couverture de 50X permette de génotyper correctement le génome avec 95 % d’exactitude. Dans le cas de la génétique somatique où le tissu cancéreux se trouve au sein de tissu normal, ce taux de couverture est largement insuffisant. La détection de mutations somatiques est ainsi plus ardue. Par ailleurs, pour complexifier un peu plus, on sait qu’il existe une hétérogénéité génétique des différents clones tumoraux dans un grand nombre de cancers. Il n’existe pas de consensus pour le taux de couverture. On estime qu’au minimum il faut 500X (et pour certains, 1 000X) pour éviter un taux d’erreurs important dans le séquenc¸age des tumeurs. Le taux de détection : classiquement, la technique de Sanger permet de détecter des variants présents à un taux faible (par exemple, mélange d’un tissu muté et d’un tissu sain) avec un seuil de détection supérieur à 15-20 % alors que les séquenceurs nouvelles génération descendent à un seuil de 1-2 % [13]. Différencier un polymorphisme d’une mutation somatique (en oncogénétique) : chacun d’entre nous possédant 34 millions de SNP, il est nécessaire de les différencier des mutations somatiques. Ainsi, dans une analyse génome entier, il est nécessaire d’avoir du tissu normal (par exemple salive ou sang) pour comparer l’ADN normal de l’ADN tumoral. La complexité de l’analyse est encore accrue par la présence de variation du nombre de copies de gènes dont certaines sont normales. L’analyse des résultats : il n’existe pas un mais plusieurs logiciels d’analyse des résultats du séquenc¸age. Ces nombreux logiciels ont été développés pour la recherche essentiellement. Cependant, un certain nombre d’entre eux ont été adaptés pour l’analyse clinique bien qu’aucun Ann Biol Clin, vol. 72, n◦ 1, janvier-février 2014

à notre connaissance n’ait fait l’objet d’une évaluation. Il n’existe d’ailleurs pas à ce jour de consensus sur la méthodologie d’analyse dans le cadre du domaine clinique. La standardisation tant de l’analyse bio-informatique que dans l’interprétation est un manque majeur. Par ailleurs, il n’existe pas une base de données unique permettant l’interprétation des résultats (mutations, polymorphismes, variant du nombre de copies) (exemples : 1 000 génomes, Exome Variant Server, HGMD). Plusieurs bases de données doivent être interrogées afin de connaître la pathogénicité ou la bénignité d’un variant (exemples : Alamut, SIFT, PolyPhen2). Le problème du stockage des données : selon le type de séquenc¸age (tout génome, exome, séquenc¸age ciblé), la quantité de données par patient varie de quelques gigaoctets à plusieurs téraoctets de données informatiques. Les ressources informatiques non seulement d’analyse des données mais aussi de stockage vont rapidement devenir un réel problème. Le stockage « dans les nuages » (Cloud) est une solution. Mais, elle constitue un risque en cas de fermeture, de piratage ou de panne du site « dans les nuages ». Par ailleurs, les problèmes de l’archivage, de l’accession aux données, de la sécurité des données, de leur sauvegarde, de leur destruction éventuelle ne sont pas résolus (pas de loi tant nationale qu’internationale claires sur ce sujet). Enfin, l’analyse des données d’un patient tant pour le diagnostic que le pronostic, la surveillance thérapeutique (entre autres) doit pouvoir être interopérable d’un système informatique à l’autre et accessible pour le médecin. Le génome individuel doit donc être accessible (et compréhensible) pour le médecin soignant et le patient. De nombreux logiciels d’analyse et d’aide à l’interprétation sont disponibles. Dans la jungle des logiciels, comme il a été écrit ci-dessus, il est parfois difficile de s’y retrouver d’autant plus que les formations en bio-informatique pour les médecins sont quasi inexistantes. Une revue récente résume les principaux logiciels utilisables [14]. Considérations analytiques des séquenceurs de nouvelle génération [15] Outre les problèmes informatiques exposés ci-dessus, les problèmes d’ordre analytique ne doivent pas être oubliés. On peut en citer quelques exemples : – il n’existe pas de protocole consensuel de validation technique des appareils. Celui-ci doit porter entre autres sur l’exactitude, la précision, la sensibilité, la spécificité, les limites de détection, les régions analysées, la technique de référence actuelle étant toujours la méthode de Sanger ; – des contrôles de qualité sont actuellement mis en place tant sur le plan national qu’international. L’établissement d’un matériel ADN de référence est indispensable ; – la nécessité de guides de bonne pratique de ces machines, en cours de rédaction. 29

Synthèse

Copyright © 2017 John Libbey Eurotext. Downloaded by an anonymous user on 18/01/2017.

L’American college of medical genetics (ACMC) a publié récemment des recommandations pour la bonne pratique de laboratoire concernant les séquenceurs de nouvelle génération [16]. La technologie d’analyse : approche génomique, exomique globale ou ciblée Plusieurs options s’offrent aux cliniciens et aux biologistes pour l’analyse génétique actuellement (figure 2). Il peut s’agir de l’analyse génome entier, l’analyse d’exome (analyse de la partie codant des gènes, les exons incluant aussi les parties 3’ non codantes, les jonctions exon/intron et parfois la partie promotrice), l’analyse gène ciblée (analyse d’exons choisis après amplification par PCR multiplex ou après capture ciblée d’exons). Les choix stratégiques dépendent de plusieurs facteurs : – des raisons économiques : bien qu’approximatif et évoluant de mois en mois vers la baisse, un génome entier coûte environ 4 kD , un exome entier, environ 700 D . L’approche amplicons est fonction du nombre d’exons amplifiés. Le coût des appareils est important. Une machine pour réaliser un exome coûte environ 150 kD . Une machine pour analyser des cibles multiples (PCR multiplex) coûte entre 70 et 100 kD et une machine pour l’analyse d’un génome entier 600 kD (chiffres approximatifs). À noter que ces prix évoluent progressivement à la baisse, leur évolution technologique étant rapide. Par ailleurs, les réactifs nécessaires à l’utilisation de ces machines sont coûteux ainsi que le matériel informatique nécessaire tant au stockage du nombre important de données à conserver qu’à l’analyse bio-informatique par des logiciels eux-mêmes coûteux (les logiciels fournis par les fabricants de séquenceurs étant souvent insuffisant). Des évaluations économiques sont en cours pour évaluer dans la pratique clinique le coût réel du séquenc¸age dans ces conditions ; – des problèmes d’analyse bio-informatique : beaucoup de généticiens moléculaires se posent la question de réaliser soit un exome d’emblée soit un génome complet. Passer de l’analyse d’un exome (1,5 % du génome environ) à l’analyse d’un génome est un défi énorme tant la quantité d’informations à analyser est considérable et les outils bioinformatiques difficiles à maîtriser [17]. Certains auteurs ont estimé que le séquenc¸age tout génome était d’ores et déjà la technique de choix dans l’analyse de nombreux gènes en génétique constitutionnelle. Une stratégie d’analyse a été récemment rapportée : elle consiste dans les suspicions de pancréatite héréditaire, à réaliser un séquenc¸age tout génome chez les patients suspects et à filtrer les résultats de manière à n’analyser que les gènes impliqués à savoir dans ce cas PRSS1, SPÏNK1, CFTR, CTRC et CASR. Les autres données de séquence sont alors utilisées à des fins de recherche. Avec l’évolution des connaissances, il ne devient alors plus nécessaire de préle30

ver les patients de nouveau. L’analyse peut être reprise à partir des données collectées [18]. Cependant actuellement, en dehors de raisons de coûts, le séquenc¸age ciblé reste la technique retenue par la majorité des laboratoires cliniques de génétique moléculaire probablement pour au moins les 2-5 ans à venir et cela, pour plusieurs raisons. La couverture d’analyse : l’analyse d’exome est censée analyser tous les exons du génome. Malheureusement, quelle que soit la technique de capture d’exons actuellement utilisée, aucune ne les capture tous (en moyenne, 90-95 % des exons) et de ce fait, l’analyse d’exome n’est pas complète et présente « des trous ». Néanmoins, dans certains cas, si le ciblage d’exons à analyser est plus réduit (ce n’est plus alors un exome mais une analyse ciblée), la couverture d’analyse des exons peut être cependant inférieure à 90 %. Par exemple, dans le cadre de l’analyse de gènes impliqués dans les pertes d’acuité auditive non syndromique, certains services de séquenc¸age annoncent une couverture de 92 % des 73 gènes analysés. Certains gènes tels que la stéréociline (STRC, responsable en cas de mutation d’une surdité non syndromique), le gène codant pour le récepteur type Q tyrosine phosphatase (PTPRQ), les gènes de miARN mir-138 et mir-96 ont une faible couverture de 0 à 44 %. Les raisons techniques peuvent être liées à la présence de nombreuses séquences répétées, à la présence de pseudogènes de séquence très similaire ou à la richesse en GC des séquences à analyser [16]. En cas d’impossibilité d’analyse par cette modalité technique, celle-ci peut être palliée par l’analyse classique des zones non étudiées par la technique de Sanger (et éventuellement d’autres techniques complémentaires). Par exemple, une longue PCR peut être réalisée pour l’analyse du gène STRC évoqué ci-dessus et qui possède un pseudogène de séquence très proche. De plus, un des grands problèmes posés par le séquenc¸age ciblé est lié à l’évolution des connaissances et la nécessité régulière d’ajouter de nouveaux gènes imposant alors de nouvelles mises au point et de nouvelles validations. Il s’agit là d’un problème important justifiant pour certains l’abandon de cette approche stratégique et le passage au minimum à l’exome systématique. Par ailleurs, actuellement, les laboratoires analysant les mutations par l’approche ciblée recherchent également dans certains cas, la présence de réarrangements géniques (variants du nombre de copies de gènes) par des techniques complémentaires (MLPA ou la CGH), les nouveaux séquenceurs ne les détectant pas encore tous (bien qu’une évolution dans ce sens soit en développement et commence à être proposée sur les machines récentes). Ainsi, l’ACMG (American college of medical genetics and genomics) suggère-t-elle de réserver l’analyse par exome ou par tout génome aux cas où l’analyse ciblée à l’aide Ann Biol Clin, vol. 72, n◦ 1, janvier-février 2014

La médecine génomique, une réalité en pleine évolution

VERS 1985

Séquençage Sanger Analyse exon par exon

Copyright © 2017 John Libbey Eurotext. Downloaded by an anonymous user on 18/01/2017.

2005 Exome

Séguençage ciblé

• (20-25,000 gènes codant) • 1,5 % du génome • 30,000-60,000 variants/sujet

Plusieurs centaines d’exons et/ou nombreux gènes

Exome

Analyse ciblée de l’exome

Transcriptome

Analyse de tout l’exome

Selon l’orientation : • Clinique • Biologique • d’imagerie

(RNAseq) Analyse des ARN

2017 ?

Méthylome Analyse des méthylatlons de I’ADN Génome entier • 3-4 millions de variants/sujet • Environ 400 mutations possiblement pathogène/individu • Environ 2 mutations responsables de maladie/individu

Figure 2. Évolution des stratégies de séquenc¸age.

des nouveaux séquenceurs est négative ou ne permet pas d’obtenir un résultat positif dans un délai et pour un coût raisonnable [19]. Cette recommandation aux contours flous démontre bien les difficultés de prise de décision stratégique dans cette période charnière où l’évolution technologique est rapide (les machines actuelles seront dépassées d’ici 2 ans), les coûts en baisse régulière et l’évolution rapide des connaissances. Une étude récente a cependant démontré largement la supériorité de l’analyse d’exome sur le séquenc¸age ciblé (et bien entendu le séquenc¸age classique de Sanger) et considère que le séquenc¸age d’exome dans le cadre des maladies génétiques hétérogènes doit être la technique de première intention [20]. L’analyse de génome entier constitue un défi majeur, la quantité d’information obtenue étant considérable. Par ailleurs, en sus de cela, son coût actuel ne permet pas de l’utiliser « en routine ». Néanmoins, inéluctablement nous arriverons à sa réalisation dans les années à venir. Dans le cas des cancers par exemple, l’analyse d’un génome entier permettrait d’établir de manière précise les voies métaboliques anormales en fonction des mutations observées et d’orienter un traitement ciblé pour le patient en fonction des voies anormalement activées ou inhibées. Par ailleurs, la recherche ciblée actuelle pour tel ou tel tissu atteint limite la recherche de certaines mutations dans d’autres cancers. Par exemple, le gène Braf dont la mutation activatrice p.Val600Glu répond à un traitement, n’est analysé que dans certains cancers (mélanome, côlon, pouAnn Biol Clin, vol. 72, n◦ 1, janvier-février 2014

mon, thyroïde). Une analyse tout génome permettrait de l’identifier à coup sûr dans tous les cancers quelle que soit sa nature. Exemples de problèmes liés à l’analyse d’exome L’analyse d’exome a permis d’identifier un certain nombre de maladies rares de transmission mendélienne [4]. Il s’agit donc à ce jour d’un puissant outil d’analyse. Néanmoins, de nombreux obstacles persistent du fait de notre connaissance encore insuffisante du génome humain, mais aussi pour des raisons analytiques. Sans être exhaustifs, nous pouvons citer quelques difficultés. L’analyse peut manquer un variant responsable de la maladie comme cela a déjà été évoqué ci-dessus. L’analyse d’exome n’a pas une couverture complète de tous les exons codants. En général, avec les techniques de capture d’exome actuelles, environ 5 % des parties codantes ne sont pas analysables (couverture insuffisante pour la détection d’une mutation). Par ailleurs, malgré une couverture suffisante, certaines mutations constituent encore un réel problème d’analyse pour les machines (par exemple, les inversions, les duplications). Certaines mutations peuvent se trouver dans des régions non explorées par l’exome. Par exemple, une étude dans une population finlandaise a montré que plus de la moitié des mutations d’un gène, C9orf72 (Omim 614260, responsable d’une forme de sclérose amyotrophique) était une expansion d’hexanucléotides dans un intron et non dans un exon. 31

Copyright © 2017 John Libbey Eurotext. Downloaded by an anonymous user on 18/01/2017.

Synthèse L’hypothèse de départ pour une analyse d’exome peut être fausse. Par exemple, certaines maladies présentent plusieurs modes de transmission selon le gène en cause (une maladie, plusieurs gènes). Ainsi, dans les rétinites pigmentaires, pathologies dans lesquelles de nombreux gènes sont en cause, une étude a montré que 8,5 % des familles malades avaient été par erreur considérées comme atteintes avec un mode de transmission autosomique dominant alors qu’en réalité, il s’agissait de familles avec transmission liée à l’X [21]. Le nombre de variants connus a augmenté de manière considérable ces dernières années (exemple, dbSNP, base de données américaine de variants simple base, http://www.ncbi.nlm.nih.gov/SNP). Un grand nombre de ces variants sont des polymorphismes (au moins 12,5 millions connus) et de plus en plus de ces variants sont rares. Ils peuvent être spécifiques d’une population ou d’une ethnie voire même spécifiques d’un sujet sans pour autant être pathologiques. Par ailleurs, certains de ces variants sont importés d’autres bases de données (comme Cosmic, base de données de mutations somatiques dans les cancers ou d’Omim, base de données de maladies de transmission mendélienne). Ainsi, lors d’une analyse d’exome, la qualité du filtre des données pour récupérer les candidats « mutation » est importante à considérer et difficile à établir pouvant amener soit à des faux positifs soit à des faux négatifs. L’analyse de néo-mutations : chaque individu possède environ 74 néo-mutations d’origine germinale [22]. Ces mutations sont potentiellement pathogènes car elles n’ont pas été sujettes à la sélection naturelle. Elles ont donc un impact important dans les maladies sporadiques. C’est le cas par exemple, dans le développement des maladies neurodégénératives et du développement ou dans certaines maladies psychiatriques (schizophrénie, par exemple). En effet, dans ces pathologies présentant par ailleurs une grande hétérogénéité génétique, on retrouve de nombreux cas de mutation de novo (néo-mutations). Une étude récente a démontré l’intérêt du séquenc¸age d’exome dans les maladies héréditaires [23] ; 250 patients recrutés sur une année ont été étudiés au Baylor college of medicine à Houston (USA). Les patients ont été sélectionnés selon des critères cliniques stricts ; 80 % de ces patients (nouveau-nés ou enfants essentiellement) présentaient un phénotype de maladie neurologique d’origine indéterminée. Entre 200 000 et 400 000 variants ont été identifiés pour chaque patient (en les comparant au génome de référence). À l’aide d’outils bio-informatiques, des filtres ont permis d’éliminer les variants non pathologiques. Il ne restait plus que 400 à 700 variants potentiellement pathogènes à analyser chez chaque patient (86 % confirmés par la technique de Sanger, les 14 % restants étant des faux positifs). Après analyse de ces variants, 62 des 250 patients possédaient 85 allèles mutés responsables de maladies héréditaires, soit un 32

taux de détection moléculaire de 25 % (62/250) ; 33 avaient une maladie de transmission autosomique dominante, 16 autosomique récessive et 9 liée à l’X ; 4 patients avaient 2 maladies héréditaires différentes (associant une maladie autosomique dominante et récessive dans 3 cas et 1 autosomique récessive et liée à l’X dans un cas). Les 86 mutations incluaient tous les types de mutations (faux sens, non-sens, petites délétions ou insertions, mutation d’épissage) ; 29 mutations étaient des mutations de novo ; 30/250 patients avaient des mutations découvertes par hasard (incidental findings) dans 16 gènes, pour lesquelles une action médicale pouvait être décidée. Selon l’expérience de ces auteurs, le taux de résultats positifs (25 %) est supérieur à celui obtenu par analyse du caryotype (5-15 %), de puces CGH (15-20 %) et du séquenc¸age de gènes ciblés par la technique de Sanger (3-15 %). Cette analyse a par ailleurs permis d’identifier des cas atypiques de pathologies étudiées dans leur laboratoire et qui n’avaient pas été initialement évoquées lors de la prescription d’analyse génétique. Et comme indiqué plus haut, elle a permis de détecter des patients ayant plusieurs maladies héréditaires, observation inattendue selon les auteurs. Ces derniers rapportent qu’après la clôture de leur analyse, 500 exomes de plus ont été étudiés avec un taux similaire de résultats positifs de 26 %. L’analyse financière a démontré que l’analyse d’exomes dans cette étude était 3 fois moins chère que l’analyse classique (caryotype, CGH, Sanger) selon les stratégies habituelles « non exomiques » du laboratoire. Comment expliquer la négativité des autres cas ? La mutation est peutêtre située dans une zone non analysée par le séquenc¸age d’exome (zones de régulation du gène, introns). Il peut aussi s’agir de problèmes techniques. Comme déjà indiqué, certaines zones des exons sont non ou mal couvertes par le séquenc¸age (environ 5 % des régions). Comment y remédier ? Le séquenc¸age tout génome permettrait de résoudre la majorité de ces problèmes. Mais il a cependant aussi des limites. La profondeur d’analyse est moindre et le problème des séquences répétées ou des pseudogènes n’est pas complètement résolu. En conclusion, cette étude démontre la nécessité de passer rapidement à l’analyse d’exomes dans l’étude des maladies héréditaires en attendant la baisse des coûts pour l’analyse tout génome. Le séquenc¸age tout génome Qu’en retenir à ce jour ? L’analyse tout génome quoi qu’encore prématurée est inéluctable à moyen terme (5-10 ans ?) [24]. Bien que les obstacles soient encore nombreux tant sur le plan technique que financier, éducationnel, éthique, juridique entre autres, son implantation se fera [24]. La communauté médicale est encore partagée sur son utilisation et la standardisation des moyens à utiliser. Ann Biol Clin, vol. 72, n◦ 1, janvier-février 2014

Copyright © 2017 John Libbey Eurotext. Downloaded by an anonymous user on 18/01/2017.

La médecine génomique, une réalité en pleine évolution

Le bénéfice : en cas de maladie présumée héréditaire et pour laquelle aucun diagnostic n’a pu être établi, le séquenc¸age tout génome permet d’identifier la base moléculaire de la maladie. Le coût : à ce jour, le coût d’un séquenc¸age tout génome est encore élevé (environ 4 500 D , figure 1). Il n’est pas possible à ce jour de l’utiliser dans un but diagnostique en laboratoire en routine. Ce type d’analyse est encore réservé à la recherche ou à titre exceptionnel dans des pathologies inexpliquées d’origine génétique. Il est fort probable que dans les 2-3 ans qui viennent, le coût du séquenc¸age tout génome descende en dessous de la barre des 1 000 D et aura un coût semblable à celui d’une IRM (imagerie par résonance magnétique) d’ici quelques années. Les analyses bio-informatiques complexes ne sont pas standardisées. Les bases de données sont encore hétérogènes et trop nombreuses. L’expertise technique et médicale nécessite un personnel compétent. À ce jour, très peu de formations spécialisées dans ce domaine existent. La mise en place d’une standardisation des techniques et de contrôles de qualité est encore embryonnaire et largement insuffisante. La qualité des données obtenues par le séquenc¸age tout génome n’est pas encore au niveau de celui des séquenceurs dits à moyen débit dans un grand nombre de cas. Les problèmes éthiques et juridiques sont encore peu discutés et ne font pas l’objet de consensus. Que dire à un patient dont on découvre un risque génétique découvert par hasard alors qu’il vient pour une autre raison ? Notre connaissance du génome croît, mais beaucoup d’inconnues demeurent. Le problème des variants de signification inconnue est exposé plus bas. Comment rendre des résultats au patient ? Sachant qu’en moyenne, on peut trouver 50 variants dans un génome dont les conséquences peuvent être potentiellement pathologiques pour le patient, en émettant l’hypothèse qu’il faut 10 minutes d’explication par variant, il faudrait plus de 8 heures pour les lui expliquer ! Une réflexion de la communauté des généticiens sur le conseil génomique est indispensable afin de voir comment informer un patient. La Société européenne de génétique humaine a établi en 2013 des recommandations que nous résumons ici [25] : – établir un ensemble de protocoles et de conduites à tenir pour l’analyse tant sur le plan national qu’international. Dans le cadre de l’analyse diagnostique, il est préférable de réaliser une analyse ciblée afin d’éviter de découvrir des variants de signification inconnue ou des variants à risques autres que ceux recherchés. Le filtrage des données au cours de l’analyse bio-informatique doit se limiter aux gènes à analyser ; Ann Biol Clin, vol. 72, n◦ 1, janvier-février 2014

– une analyse tout génome doit être justifiée par la nécessité (problème clinique à résoudre) et la balance bénéfices/risques pour le patient. Lors d’une analyse tout génome, un protocole doit être rédigé afin de servir de guide pour le rendu de variants significatifs retrouvés mais non recherchés dans l’indication initiale. Dans l’hypothèse où ce(s) variant(s) constituent un réel risque de santé pour le patient ou pour sa famille et que cette découverte permet des actions préventives et/ou thérapeutiques, le professionnel de santé doit les rapporter et l’information transmise au patient et/ou à la famille ; – l’information du patient est fondamentale. Elle n’est pas simple. L’aide des associations de patients dans ce cas est primordiale afin de trouver le meilleur moyen d’information. La génétique est à l’intersection entre la clinique et la recherche. Il est encore une fois indispensable d’en informer le patient. Le prélèvement de celui-ci pourra être conservé pour d’autres analyses à venir (banque d’ADN ou DNAthèque). Dans le cas des mineurs, il est nécessaire de rédiger des guides de bonnes pratiques afin de déterminer quelles informations doivent être transmises aux parents (notamment celles découvertes par hasard) pour l’intérêt du mineur et de ses parents. Dans l’hypothèse où une explication scientifique est trouvée pour des variants considérés initialement de signification inconnue alors qu’une analyse génétique a déjà été rendue au patient, il serait indispensable de le contacter de nouveau. Un protocole devrait être rédigé afin de préciser les modalités de cette nouvelle prise de contact ; – afin de faciliter l’interprétation des analyses génétiques, une collaboration internationale est nécessaire pour unifier les bases de données génotypiques, phénotypiques et de variants. La formation et l’information continue des professionnels de santé doivent être refondues complètement. Elles doivent porter sur la génétique humaine, le conseil génétique, l’interprétation des analyses de génétique et leurs conséquences possibles. Plusieurs niveaux de formation/informations doivent être créés depuis les généralistes jusqu’aux généticiens. Un débat de société sur la génétique et les conséquences des évolutions technologiques actuelles et de leurs conséquences sur la connaissance du génome devrait être engagé rapidement. L’information grand public n’existe pas et devrait être initiée. Que devient le séquenc¸age selon la technique de Sanger ? La technique de « Sanger » reste à ce jour encore la technique de référence. Les nombreuses comparaisons réalisées entre cette technique et les autres tendent à montrer que cette technique ne sera bientôt plus nécessaire. Actuellement, comme cela a été indiqué dans le paragraphe précédent, 33

Synthèse

Copyright © 2017 John Libbey Eurotext. Downloaded by an anonymous user on 18/01/2017.

le Sanger est encore utile pour étudier les zones non analysables par les autres techniques de séquenc¸age. Par ailleurs, quelle que soit la technique d’analyse (génome entier, analyse d’exome ou analyse ciblée), les mutations découvertes sont encore confirmées par la technique de Sanger afin d’éliminer les faux positifs toujours possibles avec les autres techniques. Les développements en cours sur les nouveaux séquenceurs ont entre autres pour objectif d’éliminer les rares faux positifs observés (notamment en améliorant l’analyse bio-informatique). Comment interpréter les nombreux variants de signification inconnue ? Avec les nouveaux séquenceurs et selon l’étendue de l’analyse (tout génome ou exome), le nombre de variants mis en évidence varie de quelques milliers à plusieurs millions. Un grand nombre de ces variants sont filtrés à l’aide de puissants outils bio-informatiques qui comparent les variants observés à de gigantesques bases de données contenant les variants étudiés sur des milliers d’individus dans le monde ainsi que sur des bases de données de mutations (filtres éliminant les polymorphismes sans incidence pathologique, par exemple). Bien entendu, ces filtres ne sont pas parfaits et peuvent éliminer des variants pathologiques qu’ils considèrent comme bénins (faux négatifs). Dans le cadre des analyses ciblées, ce risque est moindre car le nombre de gènes analysés est moins important (d’un gène avec nombreux exons à plusieurs dizaines de gènes ou plus), par conséquent, le nombre de variants à analyser aussi (quelques centaines le plus souvent). À l’aide des bases de données de variants et de mutations mais aussi à l’aide de logiciels d’interprétation de mutations, il est possible de classer les variants en bénin (non responsable de la maladie), ou pathologique ou en variant de signification inconnue (VUS, variants of uncertain significance). Parmi les bases de données pouvant aider le généticien, on peut citer 1 000 Genomes Project, Exome Variant Server et HGMD (Human Gene Mutation Database). Cependant, malgré la richesse de ces bases de données, il arrive régulièrement que des variants ne soient pas répertoriés dans ces bases de données (variants rares) ou que la conséquence sur la maladie étudiée soit ininterprétable. Des logiciels d’aide à l’interprétation de la responsabilité d’un variant dans la pathogénicité d’une maladie peuvent alors aider à la prédiction de la pathogénicité d’une mutation (par exemple, PolyPhen, Sift, Alamut). Ces logiciels ne sont néanmoins pas fiables à 100 %. Des études ont montré que leur sensibilité et leur spécificité globales étaient de 85 % environ. L’interprétation des données d’analyse pose donc encore des problèmes. En parallèle, l’histoire familiale et l’analyse de ségrégation peuvent aussi aider à établir cette pathogénicité ainsi que la fréquence observée du variant et la comparaison de la séquence mutée chez l’être humain et 34

dans d’autres espèces. Le seul moyen d’établir définitivement la pathogénicité d’une mutation à ce jour est l’analyse fonctionnelle. Celle-ci est cependant lourde, coûteuse et longue à réaliser. À ce jour, cependant, la signification de nombreux variants reste un immense défi pour la communauté génétique. Beaucoup de variants sont rares (

[Genomic medicine: the new way of thinking medicine present and future--Part two].

New sequencing techniques are revolutionizing medical practice as its applications are numerous and considerable. We are living a technological turnin...
449KB Sizes 1 Downloads 0 Views