Séquençage du génome entier pour le diagnostic des troubles neurologiques de l'expansion répétée au Royaume-Uni : une étude rétrospective d'exactitude diagnostique et de validation clinique prospective
Feb 19, 2022
Pour plus d'informations:ali.ma@wecistanche.com
Sommaire
Arrière plan
Les troubles de l'expansion répétée affectent environ 1 personne sur 3000 et sont des maladies cliniquement hétérogènes causées par des expansions de courtes répétitions d'ADN en tandem. Les tests génétiques sont souvent spécifiques à un locus, ce qui entraîne un sous-diagnostic chez les personnes qui ont des présentations cliniques atypiques, en particulier chez les patients pédiatriques sans antécédents familiaux positifs. Le séquençage du génome entier est de plus en plus utilisé comme test de première intention pour d'autres maladies génétiques rares, et nous avons cherché à évaluer ses performances dans le diagnostic des patients atteints deneurologiquetroubles de l'expansion à répétition.
Méthodes
Nous avons évalué rétrospectivement la précision diagnostique du séquençage du génome entier pour détecter les loci d'expansion répétée les plus courants associés àneurologiquerésultats (AR, ATN1, ATXN1, ATXN2, ATXN3, ATXN7, C9orf72, CACNA1A, DMPK, FMR1, FXN, HTT et TBP) à l'aide d'échantillons obtenus au sein du National Health Service en Angleterre auprès de patients suspectés d'avoirneurologiquetroubles; les résultats des tests PCR précédents ont été utilisés comme standard de référence. La précision clinique du séquençage du génome entier pour détecter les expansions répétées a été examinée de manière prospective chez des patients précédemment testés génétiquement et non diagnostiqués recrutés en 2013-2017 pour le 100 000 Genomes Project au Royaume-Uni, qui étaient soupçonnés d'avoir une maladie génétique.neurologiquetroubles (formes familiales ou précoces d'ataxie, neuropathie, paraplégie spastique, démence, maladie du motoneurone,parkinsonienmouvementtroubles mentaux, déficience intellectuelle ou troubles neuromusculaires). Si un appel d'expansion répété a été effectué à l'aide du séquençage du génome entier, la PCR a été utilisée pour confirmer le résultat.
Résultats
La précision diagnostique du séquençage du génome entier pour détecter les expansions répétées a été évaluée par rapport à 793 tests PCR précédemment effectués au sein du NHS sur 404 patients. Le séquençage du génome entier a correctement classé 215 des 221 allèles étendus et 1 316 des 1 321 allèles non étendus, montrant une sensibilité de 97·3 % (IC à 95 % 94·2–99·0) et une spécificité de 99·6 % (99·1–99 ·9) sur les 13 loci associés à la maladie par rapport aux résultats des tests PCR. Dans les échantillons de 11 631 patients du projet 100 000 Genomes, le séquençage du génome entier a identifié 81 expansions répétées, qui ont également été testées par PCR : 68 ont été confirmées comme des expansions répétées dans toute la gamme pathogène, 11 n'étaient pas - des expansions ou permutations intermédiaires pathogènes, et deux étaient des répétitions non expansées (taux de fausse découverte de 16 %).
Interprétation
Dans notre étude, le séquençage du génome entier pour la détection des expansions répétées a montré une sensibilité et une spécificité élevées, et il a conduit à l'identification deneurologiquetroubles de l'expansion à répétition chez des patients non diagnostiqués auparavant. Ces résultats soutiennent la mise en œuvre du séquençage du génome entier dans les laboratoires cliniques pour le diagnostic des patients qui ont uneneurologiqueprésentation compatible avec un trouble de l'expansion répétée.
Financement
Medical Research Council, Department of Health and Social Care, National Health Service England, National Institute for Health Research et Illumina.
Introduction
Malgré les progrès récents dans notre compréhension de la base génétique des maladies raresneurologiquetroubles génétiques, jusqu'à 70 % des patients atteints de ces troubles restent génétiquement non diagnostiqués.1–3 Cela est dû en partie aux défis techniques liés aux tests de variantes génétiques complexes et répétitives, y compris les expansions répétées ; on estime que ces expansions affectent environ 1 personne sur 3000 (annexe p 1) et sont la principale cause de plus de 40 troubles neurogénétiques4, dont la maladie de Huntington et le syndrome de l'X fragile. Les troubles de l'expansion répétée sont cliniquement et génétiquement hétérogènes, et l'expansion répétée peut être associée à diverses maladies. Par exemple, les expansions dans C9orf72 peuvent se présenter sous forme de sclérose latérale amyotrophique ou de démence frontotemporale.5 Des expansions répétées dans différents loci peuvent également produire des caractéristiques phénotypiques similaires, ce qui les rend difficiles à distinguer cliniquement : des expansions répétées dans au moins dix gènes d'ataxie spinocérébelleuse fréquemment présents à l'âge adulte. -l'ataxie d'apparition,6 et celles de C9orf72 et AR peuvent toutes deux provoquer une maladie du motoneurone.7,8

Les troubles de l'expansion répétée sont causés par une augmentation du nombre de courtes séquences d'ADN en tandem répétitives, et les seuils de pathogénicité pour chaque trouble sont spécifiques au locus. La taille de l'expansion varie de moins de 30 répétitions (par exemple, dans CACNA1A) à plusieurs milliers d'unités de répétition (par exemple, dans FMR1, DMPK, C9orf72 et FXN, qui peuvent s'étendre jusqu'à 5 kb). Les expansions répétées présentent une instabilité moléculaire, ce qui peut entraîner des changements dans la taille des répétitions (généralement en augmentation de longueur) à travers les générations et les tissus.4 Dans ces conditions, une augmentation du nombre de répétitions entraîne souvent une apparition plus précoce et une maladie plus grave dans les générations.4 L'apparition pédiatrique des troubles de l'expansion répétée peut se présenter comme des syndromes multisystémiques sans signatures phénotypiques spécifiques,9 et les enfants atteints de ces troubles sont donc plus susceptibles d'être sous-diagnostiqués en l'absence d'antécédents familiaux de trouble de l'expansion répétée.10– 12
L'évaluation en laboratoire des expansions répétées est généralement limitée à l'évaluation moléculaire ciblée d'un locus individuel guidée par le diagnostic clinique suspecté à l'aide de méthodes basées sur la PCR ou de Southern blot,13 qui peuvent être coûteuses et prendre du temps. De plus, en raison des caractéristiques phénotypiques variées et qui se chevauchent de ces troubles, les loci d'expansion répétée associés à la maladie peuvent rester non testés.14
Le séquençage du génome entier est en train de devenir un outil de diagnostic de première intention chez les patients atteints de maladies rares15 mais, jusqu'à récemment, on pensait qu'il avait une capacité limitée à évaluer les loci contenant des expansions répétées.16 Les progrès de la bioinformatique ont toutefois rendu possible la détection de la maladie. -causant des expansions répétées à partir de données de séquençage de nouvelle génération.17–22 Ici, nous rapportons l'évaluation diagnostique d'une approche de séquençage du génome entier pour détecter des expansions répétées à l'aide de données PCR rétrospectives, et sa validation clinique chez les patients du projet 100000 Genomes qui avait un trouble neurologique suspecté, non diagnostiqué avec des tests génétiques antérieurs.
Méthodes
Conception de l'étude et participants
Cette évaluation du séquençage du génome entier pour la détection des expansions répétées comprenait à la fois des évaluations de la précision diagnostique et de la précision clinique. La précision du diagnostic a été évaluée à l'aide de données provenant de patients qui avaient déjà été testés par PCR pour des expansions répétées connues pour provoquer une maladie neurologique. Cambridge, Royaume-Uni). Pour les deux groupes de patients, des tests PCR ont été effectués sur des échantillons de patients par des laboratoires du National Health Service (NHS) dans le cadre d'une évaluation clinique de routine : pour les échantillons du projet 100 000 génomes, des tests PCR ont été effectués avant le recrutement dans le projet par le Laboratoire de neurogénétique de l'University College London Hospital (Londres, Royaume-Uni); des échantillons avec des expansions répétées confirmées par PCR ont été obtenus à partir de patients testés par le laboratoire de génomique basé à Cambridge. Les patients avec des résultats de test PCR positifs et PCR négatifs pour les troubles de l'expansion répétée ont été identifiés pour être inclus dans notre étude par le biais de systèmes d'enregistrement de laboratoire ; tous les patients avaient donné leur consentement éclairé écrit pour l'utilisation de leur échantillon à des fins d'assurance qualité, de recherche et de formation, dans le cadre de l'optimisation et de la validation des services cliniques.

Le séquençage du génome entier de chaque échantillon a été effectué dans l'un des deux laboratoires : Genomics England (Hinxton, Royaume-Uni) pour les échantillons du projet 100 000 Genomes (n=254) et l'Illumina Clinical Services Laboratory (ICSL ; San Diego, CA, USA) pour les échantillons obtenus par le Genomic Laboratory basé à Cambridge (n=150). Dans l'ensemble, cet ensemble de données a été utilisé pour la partie de précision diagnostique de l'étude et se composait de données de PCR et de séquençage du génome entier de 404 patients, couvrant 13 loci qui représentent les troubles d'expansion répétée neurologiques les plus courants : 11 loci associés à l'ataxie et à la fin- troubles neurodégénératifs d'apparition (HTT, AR, ATN1, ATXN1, ATXN2, ATXN3, ATXN7, CACNA1A, TBP, C9orf72 et FXN), un locus associé à la déficience intellectuelle (FMR1) et un locus associé à la dystrophie myotonique (DMPK). Pour chaque locus, des données de test PCR étaient disponibles pour au moins un allèle élargi (annexe p 24).
La précision clinique a été évaluée en examinant la concordance des expansions répétées, telles que détectées par le séquençage du génome entier, avec le diagnostic clinique suspecté après confirmation par PCR chez les patients suspectés de troubles neurologiques génétiques (formes familiales ou précoces d'ataxie, neuropathie, paraplégie spastique, démence). , maladie du motoneurone,parkinsonientroubles du mouvement, déficience intellectuelle ou troubles neuromusculaires) recrutés pour le projet 100 000 génomes en 2013-2017. Le projet 100000 Genomes est un programme britannique visant à évaluer la valeur du séquençage du génome entier chez les patients ayant des besoins diagnostiques non satisfaits dans les maladies rares et le cancer. Suite à l'approbation éthique du projet 100000 Genomes par le East of England Cambridge South Research Ethics Committee (référence 14/EE/1112), y compris pour l'analyse des données et le retour des résultats de diagnostic aux patients, ces patients ont été recrutés par des professionnels de la santé et des chercheurs de 13 centres de médecine génomique en Angleterre et ont été inscrits au projet si eux-mêmes ou leur tuteur ont fourni un consentement écrit pour que leurs échantillons et données soient utilisés dans la recherche, y compris cette étude. Les proposants et, si possible, d'autres membres de la famille, ont été recrutés selon des critères d'éligibilité définis pour des conditions spécifiques de maladies rares (annexe pp 5-11). Les patients ont été recrutés pour le projet 100 000 génomes après des tests génétiques de niveau de soins dans le NHS, comme indiqué dans les critères d'éligibilité. Des données cliniques de base standardisées ont été enregistrées à l'aide de l'ontologie de phénotypage humain (HPO)23 par rapport à des modèles de données spécifiques à la maladie.24 L'état de la maladie des membres de la famille, par rapport à l'indication clinique du proposant pour le test, a également été recueilli.
Pour identifier les expansions répétées causales chez les patients atteints d'une maladie génétiquement non diagnostiquée, nous avons testé des patients présentant des troubles génétiques suspectés compatibles avec une maladie d'expansion répétée. Les patients ont été sélectionnés sur la base de la concordance de leur maladie et des termes HPO avec les troubles répétés associés à l'expansion. Les données de séquençage du génome entier des patients ont été interrogées pour rechercher des expansions dans des ensembles particuliers de répétitions à l'aide de quatre panels d'expansion de répétitions différents en fonction de leurs caractéristiques cliniques (annexe p 5). Les expansions répétées sélectionnées pour être incluses dans ces panels sont les locus d'expansion répétée causant des maladies neurologiques les plus courants. Les patients présentant des caractéristiques cliniques potentiellement compatibles avec plus d'un trouble d'expansion répétée ont été testés sur plusieurs panels. Si un appel d'expansion répété a été effectué à l'aide du séquençage du génome entier, un test de confirmation par PCR a été effectué.
Pour chaque patient avec une expansion répétée confirmée, le clinicien local a été informé du résultat diagnostique potentiel, et la contribution de l'expansion répétée aux caractéristiques cliniques du patient a été évaluée. Pour les expansions répétées qui expliquaient totalement ou partiellement les caractéristiques cliniques du patient, un rapport de diagnostic était délivré conformément aux procédures standard locales.
Procédures
Pour les échantillons historiques du NHS utilisés dans la partie de précision diagnostique de notre étude, des expansions répétées avaient déjà été testées à l'aide d'une amplification par PCR et d'une analyse de fragments. Southern blot a été réalisé pour les grandes expansions de C9orf72. Dans la partie précision clinique de notre étude, les expansions répétées détectées par séquençage du génome entier chez les patients du 100 000 Genomes Project ont été testées par PCR dans des échantillons stockés dans les laboratoires génétiques du NHS. Des détails supplémentaires, y compris les séquences d'amorces, sont fournis en annexe (pp 2–3, 25–26).
L'ADN a été préparé pour le séquençage du génome entier à l'aide de la préparation de la bibliothèque TruSeq DNA PCR-Free, et un séquençage apparié de 150 bp ou 125 bp a été effectué sur les plateformes HiSeq 2000 ou HiSeq X à l'installation de génomes à haut débit pour Genomics England et à l'ICSL . Les génomes ont été séquencés à une profondeur moyenne de 35× (31× à 37× ; annexe p 27). Le génotypage à répétitions courtes en tandem a été effectué à l'aide du progiciel ExpansionHunter version 3.1.2.25,26 En bref, ExpansionHunter réaligne les lectures de séquençage sur un ensemble prédéfini de courtes répétitions en tandem pour estimer la taille des deux allèles d'un individu (annexe p 3).

La sortie d'ExpansionHunter comprend une estimation du nombre d'éléments répétés, de la taille globale et de la limite de confiance pour chaque locus évalué. Les directives de l'Association for Medical Pathology et du College of American Pathologists recommandent une inspection visuelle des appels de variants lors de l'évaluation de routine des variants de séquençage à haut débit.27
Cependant, les variantes courtes répétées en tandem ne peuvent pas être visualisées de manière adéquate par des outils de visualisation courants tels que Integrative Genomics Viewer. des génotypes ExpansionHunter (annexe pp 3, 15). L'inspection visuelle du graphique pileup a été effectuée sur tous les appels de répétition en tandem courts de séquençage du génome entier pour confirmer que la prédiction ExpansionHunter pour les allèles était entièrement contenue dans chaque lecture (c'est-à-dire que la séquence de répétition était plus petite que la longueur de lecture du séquençage) ; pour confirmer la présence d'une expansion monoallélique ou biallélique ; pour détecter les appels faux positifs putatifs ; et pour détecter les allèles faux négatifs dans les expansions répétées bialléliques, telles que FXN (annexe pp 4, 16).
ExpansionHunter estime la taille de répétition à partir des données de séquençage du génome entier en analysant les lectures de séquençage qui contiennent entièrement ou partiellement une courte répétition en tandem. Si un allèle à répétition en tandem court est plus court que la longueur de lecture, ExpansionHunter prédit la taille exacte ; si un allèle de répétition en tandem court est plus long que la longueur de lecture, ExpansionHunter estime la taille de répétition dans un CI, en fonction de la composition de la séquence du locus, de la profondeur du séquençage et de la qualité du séquençage.
analyses statistiques
Nous avons classé les répétitions comme étendues par séquençage du génome entier si la taille prédite par ExpansionHunter était supérieure au seuil de prémutation, ou non étendues si la taille prédite était inférieure au seuil (annexe p 28).
La sensibilité et les IC pour la détection de l'expansion répétée du séquençage du génome entier ont été calculés comme la proportion d'allèles avec des répétitions élargies parmi les allèles précédemment confirmés par PCR avec des répétitions élargies. La spécificité a été estimée comme la proportion d'allèles non développés parmi les répétitions non développées précédemment testées par PCR. Une description complète des formules statistiques est fournie en annexe (p 1).
Pour comparer les tailles de répétition par PCR avec les estimations de taille de répétition par séquençage du génome entier, les allèles quantifiés par PCR ont été comparés aux tailles de répétition prédites par ExpansionHunter pour les allèles plus courts que la longueur de lecture sur les 13 locus de répétition en tandem courts. La concordance a été calculée par le pourcentage de tailles de répétition prédites par ExpansionHunter qui étaient en accord avec la taille quantifiée par PCR, en tenant compte de l'erreur PCR de plus ou moins une répétition. L'analyse statistique a été réalisée à l'aide du logiciel statistique R version 3.6.3.
Rôle de la source de financement
La conception de l'étude, le recrutement des patients, la collecte de données et le séquençage ont été dirigés par des employés de Genomics England et des chercheurs universitaires. Les employés d'Illumina ont effectué le séquençage de 150 échantillons de patients dans le cadre de l'étude de précision diagnostique du séquençage du génome entier et ont développé ExpansionHunter. Des employés de Genomics England, des chercheurs universitaires et les coauteurs RTH, ED et MAE ont effectué l'analyse et l'interprétation des expansions répétées chez les patients recrutés pour le projet 100 000 Genomes. Les sources de financement n'ont joué aucun rôle dans l'interprétation des données ou la rédaction du rapport.


Résultats
La précision diagnostique du séquençage du génome entier pour détecter les expansions répétées a été évaluée par rapport à 793 tests PCR précédemment effectués au sein du NHS sur 404 patients (64 patients ont été testés pour plus d'une répétition ; figure 1). Parmi ces tests, 183 ont été classés comme ayant une répétition étendue et 610 comme n'ayant pas d'expansion répétée par PCR, donnant un total de 221 allèles individuels étendus et 1321 allèles individuels non étendus sur 13 loci de la maladie (annexe pp 24, 28). Le séquençage du génome entier a correctement classé 215 des 221 allèles étendus et 1316 des 1321 allèles non étendus par rapport aux résultats des tests PCR (annexe pp 27, 29), montrant une sensibilité initiale de 97·3 % (IC à 95 % 94·2–99 ·0) et spécificité de 99·6 % (99·1–99·9 ; tableau 1). Suite à la correction visuelle de tous les appels en fonction de la qualité des lectures, la sensibilité est passée à 99·1 % (96·8–99·9) et la spécificité à 100 % (99·7–100 ; figure 2A, tableau 1). La visualisation des allèles étendus a permis la détection de résultats faux positifs et la reclassification de tous les allèles faux négatifs dans FXN, dont un seul allèle a été correctement classé comme étendu dans les échantillons avec des expansions bialléliques (annexe pp 17, 18).

La longueur de répétition a été quantifiée par PCR dans 509 tests PCR interrogeant 945 allèles sur 13 loci d'expansion répétée. Les corrélations entre ExpansionHunter et la PCR pour les tailles de répétition plus courtes et plus grandes que la longueur de lecture du séquençage (c'est-à-dire 150 bp) sont présentées en annexe (annexe p 19). Une concordance élevée a été observée pour les répétitions plus courtes que la longueur de lecture, avec un accord de 92,7 % (836 sur 902) entre la PCR et ExpansionHunter. Une variabilité du locus a été observée, avec une forte concordance entre ExpansionHunter et la PCR pour ATXN2, ATXN7, CACNA1A et HTT, et une faible concordance pour DMPK ou TBP (annexe p 30). Les longueurs d'allèles supérieures à la longueur de lecture ont été sous-estimées par ExpansionHunter, ce qui a affecté la précision de l'appel dans DMPK, FMR1 et FXN (figure 2B, annexe pp 19, 31).
Bien qu'ExpansionHunter ait pu identifier correctement les grands allèles étendus dans FMR1, DMPK, C9orf72 et FXN (annexe p 29), les estimations de taille prédites avaient tendance à être inférieures à celles obtenues par PCR à mesure que la taille de répétition augmentait dans la plage pathogène, ce qui affectait le capacité à distinguer les grandes et les petites expansions dans DMPK, C9orf72 et FXN, ou entre les expansions complètes et les permutations dans FMR1 (annexe p 31). Par exemple, les loci avec une longueur de répétition évaluée par PCR supérieure à 200 répétitions dans FMR1 et classés comme mutation complète avaient une taille de répétition moyenne estimée par ExpansionHunter de 92·6 (SD 17·8 ; annexe p 31).
Pour tester la capacité de la détection d'expansion répétée par séquençage du génome entier pour résoudre le diagnostic de patients précédemment testés et génétiquement non diagnostiqués, nous avons testé 11 631 patients suspects d'un trouble neurologique génétique recrutés dans le cadre du projet 100 000 génomes (figure 1). Les données de séquençage du génome entier ont été évaluées à l'aide de quatre panels d'expansion répétés différents en fonction des caractéristiques cliniques du patient. Les nombres de patients testés avec chacun des quatre panels sont présentés dans le tableau 2.
Dans l'ensemble, nous avons détecté et confirmé visuellement des expansions répétées dans des échantillons de 105 patients (tableau 2, annexe pp 20, 33). Parmi ceux-ci, 81 échantillons étaient disponibles pour les tests de confirmation par PCR, et 68 ont été confirmés comme ayant une expansion répétée (0·6 % de rendement) : 45 (1·2 %) sur 3 692 dans le panel A, huit ({ {18}}·3 %) sur 2 743 dans le panneau B, cinq (0,6 %) sur 860 dans le panneau C et dix (0,1 %) sur 6 731 dans le panneau D. Treize des 81 appels d'extension n'ont pas été confirmés comme des expansions répétées pathogènes (taux de fausse découverte de 16 %). Parmi ceux-ci, deux étaient des allèles non développés dans ATXN1 et ATXN2, quatre étaient des appels de taille intermédiaire FMR1 (annexe p 21) et sept étaient des permutations FMR1.
Les détails cliniques des 68 patients avec des expansions répétées confirmées par PCR, y compris leurs présentations cliniques, l'expansion répétée identifiée et la contribution de l'expansion répétée aux caractéristiques cliniques du patient sont fournis dans le tableau 3 ; les termes HPO, la taille de répétition estimée par ExpansionHunter et si un rapport de diagnostic a été émis sont répertoriés dans l'annexe (p 33).
Des expansions ont été observées chez des patients présentant une grande variété de présentations cliniques se chevauchant testées avec le panel A (tableau 3, annexe p 22), y compris une expansion répétée d'ATXN2 chez un patient atteint de la maladie de Parkinson à début précoce répondant à la lévodopa et ayant des antécédents d'ataxie cérébelleuse progressive , et expansions AR chez quatre patients cliniquement diagnostiqués avec la maladie de Charcot-Marie-Tooth, dont un avec une neuropathie démyélinisante génétiquement confirmée (c'est-à-dire, maladie de Charcot-Marie-Tooth type 1, patient 42 ; annexe p 33). Un large éventail de diagnostics cliniques antérieurs a été observé chez les patients présentant des expansions répétées pathogènes.
Par exemple, chez sept patients atteints de sclérose latérale amyotrophique ou d'une autre maladie du motoneurone, des expansions ont été identifiées dans AR (n=4) et C9orf72 (n=3). Chez les patients suspectés d'ataxie héréditaire, nous avons identifié des expansions de loci qui n'avaient pas été évaluées dans le cadre du bilan diagnostique de routine au sein du NHS au moment du recrutement, y compris ATN1, ATXN2, ATXN3, ATXN7, CACNA1A, FXN, TBP et HTT ( Tableau 3). Nous avons également détecté des expansions répétées chez des patients présentant des caractéristiques cliniques compatibles avec des troubles alternatifs d'expansion répétée, y compris une expansion C9orf72 dans la maladie de Parkinson précoce et familiale (patient 24, tableau 3) et des expansions répétées dans la plage de pénétrance réduite dans le HTT (38 répétitions) chez deux sœurs avec un trouble du mouvement, une démence, une dépression et des difficultés d'élocution (patientes 44 et 45), soulignant le défi diagnostique présenté par ces troubles de l'expansion à répétition.
Huit enfants testés avec le panel B présentaient de grandes expansions répétées CAG (figure 3), dont sept expliquaient pleinement les caractéristiques cliniques du patient. Six patients n'avaient pas d'antécédents familiaux informatifs et ne s'étaient pas vu proposer de répéter le test d'expansion dans le cadre de leur évaluation clinique au moment du recrutement (patients 48–53 ; tableau 3, annexe p 33). Deux de ces enfants portaient de grandes expansions HTT (90 à 100 répétitions CAG). Il convient de noter qu'un enfant avait hérité de la répétition d'un parent non affecté sans antécédents familiaux de la maladie de Huntington. Les tests familiaux sont en cours, mais un allèle à pénétrance réduite a été identifié dans la famille élargie, indiquant que la répétition s'était étendue de plus de 60 unités répétées en une seule génération (patient 52). Au moment d'écrire ces lignes, personne dans la famille ne présentait de signes de la maladie de Huntington, et des conseils et des tests génétiques sont en cours pour les parents. Deux enfants de moins de 5 ans portaient de grandes expansions répétées dans ATXN7 et présentaient une maladie multisystémique complexe. Pour l'un de ces enfants (patient 50), leur parent a présenté des problèmes de marche 2 ans après son inscription au projet 100 000 génomes. De même, une fille âgée de 10 ans atteinte de déficience intellectuelle présentait une 99-expansion répétée dans ATXN2, malgré le fait que les deux parents étaient désignés comme non affectés, et une fille âgée de 18 ans atteinte de démence était porteuse d'un { {19}}répéter l'expansion dans ATN1 (annexe p 33).

Cinq expansions de DMPK (panel C) ont été détectées, y compris chez un enfant et une mère avec un diagnostic clinique de dystrophie musculaire, chez deux frères et sœurs suspects de myopathie distale et chez un adolescent atteint de myopathie congénitale (patients 54-58). Des expansions de FMR1 (panel D) ont été détectées chez neuf garçons et une fille, et un diagnostic de syndrome de l'X fragile expliquait totalement ou partiellement les caractéristiques cliniques présentées (patients 59–68).
Discussion
Le diagnostic des troubles de l'expansion répétée est difficile dans les soins de santé en raison de caractéristiques cliniques hétérogènes et qui se chevauchent et de résultats cliniques non spécifiques, qui peuvent augmenter en gravité avec l'âge et à chaque génération suivante. Les troubles de l'expansion répétée sont parmi les causes les plus fréquentes de maladies neurologiques héréditaires.4 Néanmoins, les patients peuvent être sous-diagnostiqués, soit parce que des tests génétiques insuffisants ont été effectués, soit parce que les variants génétiques responsables n'ont pas encore été découverts. Les approches de test sont actuellement fragmentées et les patients peuvent faire tester le locus d'expansion répétée incorrect29 ou recevoir un test moléculaire pour une classe différente de variant en raison du chevauchement des caractéristiques cliniques avec d'autres troubles génétiques neurologiques.30


Le séquençage du génome entier a été utilisé dans de multiples contextes comme test de diagnostic de première intention pour les troubles neurologiques rares, mais on pensait auparavant qu'il avait une faible capacité à détecter les expansions répétées.16 Plusieurs outils ont été développés pour identifier les expansions répétées à partir du génome entier. séquençage dans le cadre de la recherche,31 mais aucune de ces approches n'a été appliquée aux données de séquençage du génome entier recueillies auprès d'un grand nombre de patients dans un seul service de santé. Nous présentons des preuves qu'un algorithme conçu pour détecter les expansions répétées à partir du séquençage du génome entier peut évaluer de manière fiable les expansions répétées les plus courantes à l'origine de la maladie et résoudre les cas précédemment non diagnostiqués génétiquement dans une grande cohorte de patients atteints de troubles neurologiques. Nos résultats indiquent que le séquençage du génome entier peut faire la distinction entre les allèles non étendus et étendus avec une sensibilité et une spécificité élevées sur 13 locus d'expansion répétés (qui peuvent être encore améliorés par inspection visuelle), peut calculer avec précision la taille des allèles plus petits que la longueur de lecture , et pourrait sous-estimer la taille des grandes expansions dans FMR1, DMPK, FXN et C9orf72.
Lorsque la détection d'expansions répétées par séquençage du génome entier a été évaluée par rapport aux résultats positifs et négatifs précédemment obtenus dans les laboratoires de génomique diagnostique clinique utilisant des méthodes de référence, nous avons trouvé un minimum de 97,3 % de sensibilité et de 99,6 % de spécificité. De plus, nous avons montré que la spécificité et la sensibilité peuvent être améliorées par la curation manuelle de l'empilement de lecture, permettant la détection de résultats faux positifs et la reclassification des allèles faux négatifs dans des échantillons avec des expansions bialléliques. Sur les 6731 patients testés pour FMR1 (panel D), 124 appels devaient être élargis. Nous avons pu exclure 97 par inspection visuelle en tant que faux positifs probables. Cela indique que 1 test de séquençage du génome entier sur 54 aurait un appel FMR1 qui devrait être inspecté visuellement pour éliminer un éventuel appel faux positif. Des travaux sont en cours pour améliorer la méthode de génotypage ExpansionHunter afin de réduire le nombre d'appels faussement positifs pour FMR1.
We show that repeat sizing is accurate for repeats smaller than the sequencing read lengths, and therefore that most non-expanded and premutation CAG repeat expansion disorder alleles can be sized accurately. These results are consistent with other studies showing a strong correlation between whole genome sequencing and PCR quantification of repeat lengths smaller than the sequencing read length.19,25,26 Whole genome sequencing expansion detection is limited in its sizing of alleles considerably larger than the read length, such as in Fragile X syndrome. We note that all FMR1 repeats previously classified by PCR as fully expanded (ie, >200 repeats) were classified by whole genome sequencing as permutation (50–200 repeats) in this study. Repeat size estimation for repeats larger than the read length is particularly important for loci in which the length of the repeat correlates with the disease clinical features. This includes DMPK, for which small expansions (50–150 repeats) cause mild myotonic dystrophy type 1 and large expansions (>1000 répétitions) provoquent une maladie plus grave, et l'ataxie spinocérébelleuse de type 36 (NOP56), pour laquelle des expansions supérieures à 650 répétitions sont considérées comme pathogènes et des tailles de répétition de 15 à 650 sont considérées comme intermédiaires et des variantes de signification incertaine.
Plus de 40 locus d'expansion répétés ont été identifiés; nombre de ces loci n'ont été identifiés que récemment et sont maintenant associés à des affections auparavant inexpliquées, notamment l'ataxie cérébelleuse avec neuropathie et syndrome d'aréflexie vestibulaire (RFC1) 32 et l'épilepsie myoclonique (SAMD12). 33 sélectionnés pour notre étude en fonction de la disponibilité d'échantillons de contrôle positifs et négatifs.
Les résultats présentés ici suggèrent qu'ExpansionHunter devrait être capable de classer avec précision les allèles non développés et développés à n'importe quel locus d'expansion répétée si les allèles non développés sont plus petits que la longueur de lecture (c'est-à-dire 150 bp). Bien que la plupart des loci d'expansion répétée aient des allèles inférieurs à 150 bp lorsqu'ils ne sont pas expansés, certains loci pour lesquels la taille de l'allèle non expansé est proche de 150 bp (par exemple, NOTCH2NLC)34 pourraient être plus difficiles à génotyper en utilisant cette approche. Pour les loci où la répétition étendue est significativement plus grande que la longueur de lecture, le séquençage du génome entier peut détecter des expansions pathogènes (par exemple, NOP56,35 RFC120,32). Les technologies émergentes de séquençage à lecture longue pourraient offrir des approches complémentaires lors du génotypage de grandes expansions.36
L'évaluation des expansions répétées à l'aide du séquençage du génome entier chez 11 631 patients non diagnostiqués recrutés pour le projet 100 000 Genomes a donné 68 patients avec des résultats explicatifs. Les patients ont été recrutés pour le projet 100 000 sur les génomes après des tests génétiques conformes aux normes de soins ; par conséquent, la proportion d'expansions répétées identifiées dans cette cohorte représente une augmentation du rendement diagnostique des tests NHS standard, qui comprennent des tests spécifiques au locus pour les troubles d'expansion répétée tels que FXN ou DMPK. Il convient de noter que certains diagnostics n'ont pas été suspectés sur la base des caractéristiques cliniques du patient, y compris six patients pédiatriques qui n'avaient aucun antécédent familial connu de trouble d'expansion répétée. Les tailles moyennes d'expansion répétée prédites par le séquençage du génome entier chez les patients pédiatriques décrits dans cette étude sont nettement plus grandes que la moyenne chez les adultes, ce qui correspond à l'attente selon laquelle des expansions plus importantes sont associées à une apparition plus précoce et plus grave, même chez les enfants. Des travaux supplémentaires sont nécessaires, mais cette découverte suggère qu'une évaluation de la pathogénicité en fonction de l'âge et de la taille pourrait étayer un diagnostic pédiatrique en réduisant le risque potentiel d'identification des allèles à risque d'apparition à l'âge adulte, conduisant à des tests prédictifs non sollicités chez les enfants.
Nos résultats permettent la mise en place d'un workflow de diagnostic clinique pour le séquençage du génome entier (annexe p 23). Nous proposons qu'une inspection visuelle soit effectuée pour tous les appels classés comme étendus pour détecter les faux positifs, et pour les expansions bialléliques pour lesquelles un seul allèle étendu a été détecté (par exemple, FXN). Nous recommandons aux laboratoires d'utiliser ExpansionHunter pour évaluer la présence d'une expansion sans respecter l'estimation de la taille et d'effectuer des tests PCR de confirmation en tant que composant standard du flux de travail des tests.

Les maladies héréditaires rares comprennent un large éventail de caractéristiques cliniques, ce qui rend les tests génomiques spécifiques à un locus inefficaces, ardus et coûteux. Nous présentons des preuves que le séquençage du génome entier de qualité clinique avec le potentiel de diagnostiquer une gamme de maladies neurologiques rares présentant généralement une seule base, un indel ou des variantes de nombre de copies pourrait désormais être étendu à des expansions répétées. Étant donné que le séquençage du génome entier fournit un test unique capable d'identifier les expansions répétées les plus courantes, tout en permettant de tester simultanément les mutations ponctuelles et les variantes du nombre de copies dans les gènes associés à ces conditions, il offre la possibilité d'identifier la plupart des patients atteints de ces troubles hétérogènes. qui n'ont pas été diagnostiqués à l'aide de tests spécifiques au locus. À l'ère des thérapies émergentes pour ces troubles, la détection précoce pourrait devenir cruciale.37 Ces résultats soutiennent la mise en œuvre du séquençage du génome entier pour la détection des expansions répétées dans les laboratoires de diagnostic clinique, une approche qui a déjà été incluse dans le NHS England National Genomic Test Directory,38 pour l'investigation des maladies neurologiques rares non diagnostiquées.
Références
1 Ngo KJ, Rexach JE, Lee H, et al. Un plafond diagnostique pour le séquençage de l'exome dans l'ataxie cérébelleuse et les troubles neurologiques associés. Hum Mutat 2020; 41 : 487–501.
2 Lynch DS, Koutsis G, Tucci A, et al. Paraplégie spastique héréditaire en Grèce : caractérisation d'une population jusque-là inexplorée à l'aide du séquençage de nouvelle génération. Eur J Hum Genet 2016 ; 24 : 857–63.
3 Graziola F, Garone G, Stregapede F, et al. Rendement diagnostique d'un panel de gènes de séquençage de nouvelle génération ciblés pour les troubles du mouvement pédiatriques : une étude de cohorte de 3- ans. Avant Genet 2019; 10 : 1026.
4 Paulson H. Maladies à expansion répétée. Handb Clin Neurol 2018; 147 : 105–23.
5 Gossye H, Engelborghs S, Van Broeckhoven C, van der Zee J. C9orf72 démence frontotemporale et/ou sclérose latérale amyotrophique. Seattle, Washington : Université de Washington, 2015.
6 Klockgether T, Mariotti C, Paulson HL. Ataxie spinocérébelleuse. Nat Rev Dis Primers 2019 ; 5 : 24.
7 Shakkottai VG, Fogel BL. Neurogénétique clinique : ataxie spinocérébelleuse autosomique dominante. Neurol Clin 2013; 31 : 987–1007.
8 La Spada A. Amyotrophie spinale et bulbaire. Dans : Adam MP, Ardinger HH, Pagon RA, et al, eds. GeneReviews. Seattle, Washington : Université de Washington, 1999.
9 Gousse G, Natural H, Touraine R, et al. Forme mortelle d'ataxie spinocérébelleuse de type 7 avec début précoce dans l'enfance. Arch Pediatr 2018; 25 : 42–44.
10 Ansorge O, Giunti P, Michalik A, et al. Agrégation et ubiquitination de l'ataxine -7 dans SCA7 infantile avec 180 répétitions CAG. Ann Neurol 2004; 56 : 448-52.
11 Ramocki MB, Chapieski L, McDonald RO, Fernandez F, Malphrus AD. Ataxie spinocérébelleuse de type 2 présentant une régression cognitive dans l'enfance. J Child Neurol 2008; 23 : 999–1001.
12 Mitchell N, LaTouche GA, Nelson B, Figueroa KP, Walker RH, Sobering AK. Ataxie spinocérébelleuse de l'enfance 3 : dystonie de la langue comme manifestation précoce. Tremblement Autre Mov hyperkinétique 2019 ; publié en ligne le 13 septembre.
13 oiseaux TD. Dystrophie myotonique de type 1. Dans : Adam MP, Ardinger HH, Pagon RA, et al, eds. GeneReviews. Seattle, Washington : Université de Washington, 2019.
14 Aydin G, Dekomien G, Hoffman S, Gerding WM, Epplen JT, Arning L. Fréquence des expansions répétées de SCA8, SCA10, SCA12, SCA36, FXTAS et C9orf72 chez les patients SCA négatifs pour les sous-types de SCA les plus courants. BMC Neurol 2018 ; 18 : 3.
15 Turro E, Astle WJ, Megy K, et al. Séquençage du génome entier de patients atteints de maladies rares dans un système de santé national. Nature 2020; 583 : 96–102.
16 Ashley EA. Vers une médecine de précision. Nat Rev Genet 2016; 17 : 507–22.
17 Liu HY, Zhou L, Zheng MY, et al. Utilité diagnostique et clinique du séquençage du génome entier dans une cohorte de familles chinoises non diagnostiquées atteintes de maladies rares. représentant scientifique 2019 ; 9 : 19365.
18 Mousavi N, Shleizer-Burko S, Yanicky R, Gymrek M. Profilage du paysage pangénomique des expansions répétées en tandem. Acides nucléiques Res 2019 ; 47 : e90.
19 Tankard RM, Bennett MF, Degorski P, Delatycki MB, Lockhart PJ, Bahlo M. Détection d'expansions de répétitions en tandem dans des cohortes séquencées avec des données de séquençage à lecture courte. Am J Hum Genet 2018; 103 : 858–73.
20 Rafehi H, Szmulewicz DJ, Bennett MF, et al. Identification basée sur la bioinformatique des répétitions étendues : une expansion de pentamère intronique non-référence dans RFC1 provoque CANVAS. Am J Hum Genet 2019; 105 : 151–65.
21 Gross AM, Ajay SS, Rajan V, et al. Variantes de nombre de copies dans le séquençage du génome clinique : déploiement et interprétation pour les maladies rares et non diagnostiquées. Genet Med 2019 ; 21 : 1121–30.
22 Trost B, Engchuan W, Nguyen CM, et al. Détection à l'échelle du génome des répétitions d'ADN en tandem qui sont développées dans l'autisme. Nature 2020; 586 : 80–86.
23 Robinson PN, Kohler S, Bauer S, Seelow D, Horn D, Mundlos S. L'ontologie du phénotype humain : un outil pour annoter et analyser les maladies héréditaires humaines. Am J Hum Genet 2008; 83 : 610–615.
24 Génomique Angleterre. Modèles de données cliniques sur les maladies rares. 2018. https://www.genomicsengland.co.uk/?wpdmdl=5500 (consulté le 4 août 2021).
25 Dolzhenko E, van Vugt JJFA, Shaw RJ, et al. Détection de longues expansions répétées à partir de données de séquence du génome entier sans PCR. Génome Res 2017 ; 27 : 1895-903.
26 Dolzhenko E, Deshpande V, Schlesinger F, et al. ExpansionHunter : un outil basé sur un graphe de séquence pour analyser la variation dans les régions répétées en tandem courtes. Bioinformatique 2019; 35 : 4754–56.
27 Roy S, Coldren C, Karunamurthy A, et al. Normes et lignes directrices pour la validation des pipelines bioinformatiques de séquençage de nouvelle génération : une recommandation conjointe de l'Association for Molecular Pathology et du College of American Pathologists. J Mol Diagn 2018; 20 : 4–27.
28 Robinson JT, Thorvaldsdottir H, Winckler W, et al. Visionneuse de génomique intégrative. Nat Biotechnol 2011; 29 : 24–26.
29 Schneider SA, van de Warrenburg BPC, Hughes TD, et al. Homogénéité phénotypique de la présentation semblable à la maladie de Huntington dans une famille SCA17. Neurologie 2006 ; 67 : 1701–03.
30 Schneider SA, Bird T. La maladie de Huntington, les sosies de la maladie de Huntington et la chorée héréditaire bénigne : quoi de neuf ? Mov Disord Clin Pract 2016 ; 3 : 342–54.
31 Bahlo M, Bennett MF, Degorski P, Tankard RM, Delatycki MB, Lockhart PJ. Progrès récents dans la détection des expansions répétées avec le séquençage de nouvelle génération à lecture courte. F1000Res 2018 ; 7 : 736.
32 Cortese A, Simone R, Sullivan R, et al. L'expansion biallélique d'une répétition intronique dans RFC1 est une cause fréquente d'ataxie d'apparition tardive. Nat Genet 2019; 51 : 649–58.
33 Ishiura H, Doi K, Mitsui J, et al. Expansions des répétitions introniques TTTCA et TTTTA dans l'épilepsie myoclonique familiale bénigne de l'adulte. Nat Genet 2018; 50 : 581–90.
34 Ishiura H, Shibata S, Yoshimura J, et al. Expansions répétées CGG non codantes dans la maladie d'inclusion intranucléaire neuronale, la myopathie oculopharyngodistale et une maladie qui se chevauche. Nat Genet 2019; 51 : 1222–1232.
35 Rafehi H, Szmulewicz DJ, Pope K, et al. Diagnostic rapide de l'ataxie spinocérébelleuse 36 dans une famille de trois générations à l'aide de données de séquençage du génome entier à lecture courte. Mov Désordre 2020 ; 35 : 1675–79.
36 Mantere T, Kersten S, Hoischen A. Séquençage à lecture longue émergeant en génétique médicale. Avant Genet 2019; 10 : 426.
37 Ellerby LM. Troubles de l'expansion répétée : mécanismes et thérapeutiques. Neurothérapeutique 2019 ; 16 : 924–27.
38 Système national de santé. Répertoire national des tests génomiques : critères de test pour les maladies rares et héréditaires. octobre 2021.






