Les résultats du séquençage pour l'échantillon NA12878 ont été comparés à un génotype très sûr pour NA12878, établi par le National
Institute of Standards and Technology (NIST) (v.2.19). Sur les 9 232 cibles, 8 009 cibles se trouvaient entièrement dans les zones
génomiques très sûres, 776 cibles se chevauchaient en partie, et 447 cibles ne se chevauchaient pas dans la séquence NIST. Cela a
résulté en 1 831 483 coordonnées par réplique pour la comparaison. Les définitions de bases non-variants ont été comparés à la
séquence de référence du génome humain hg19. Les résultats sur la précision sont affichés dans le tableau
germinaux pour l'échantillon NA12878 avec la base de données NIST à la page
Tableau 18
Concordance des variants germinaux pour l'échantillon NA12878 avec la base de données NIST
Nbr de cibles
Échantillon
couvertes
NA12878
8785
D'après les données fournies par les 18 analyses de cette étude germinale, le Instrument NovaSeq 6000Dx peut séquencer ce qui suit
de façon uniforme :
•
Teneur en GC ≥ 20 % (toutes les bases définies dans 1 692 régions cibles séquencées avec une teneur en GC de 20 % définis
correctement avec un taux sans définitions de 0 %)
Teneur en GC ≤ 86 % (toutes les bases définies dans 846 régions cibles séquencées avec une teneur en GC de 86 % définis
•
correctement avec un taux sans définitions de 0 %)
•
Longueurs de PolyA ≤ 46 (toutes les bases définies dans 846 régions cibles séquencées avec 46 répétitions de PolyA définies
correctement avec un taux sans définitions de 0,27 %)
•
Longueurs de PolyT ≤ 40 (13 384 074 bases définies sur 13 384 321 dans 846 régions cibles séquencées avec 40 répétitions de
PolyT définies correctement avec un taux sans définitions de 0,26 %)
•
Longueurs de PolyG ≤ 11 (toutes les bases définies dans 846 régions cibles séquencées avec une 11 répétitions de PolyG définies
correctement avec un taux sans définitions de 0 %)
Longueurs de PolyC ≤ 8 (9 815 030 bases définies sur 9 815 035 dans 5 922 régions cibles séquencées avec 8 répétitions de PolyC
•
définies correctement avec un taux sans définitions de 0,53 %)
Les longueurs de répétitions de dinucléotides ≤ 31x (32 233 922 bases définies sur 32 233 926 dans 846 régions cibles séquencées
•
avec 31 répétitions de dinucléotides définies. correctement avec un taux sans définitions de 0,21 %)
•
Les longueurs de répétitions de trinucléotides ≤ 23x (toutes les bases définies dans 846 régions cibles séquencées avec
23 répétitions de trinucléotides définies correctement avec un taux sans définitions de 0,21 %)
Appelabilité de
TP
l'autosome
99,4
247709
51.
FN
TN
FP
218
394262149
4584
Concordance des variants
PCP
PCN
PCG
> 99,9
> 99,9
> 99,9