然而, SMRT 这项新技术不仅能从单个未扩增的分子中产生更长且高度准确的 DNA 序列,还能显示甲基化的碱基存在于何处,从而提供了有关 DNA 甲基化酶的功能信息。如今, PacBio RS II 的平均读长达 5,000 bp,最长读长超过 20,000 bp,通量也较之前的版本增加一倍。
作者在文中提到, SMRT 技术具有三大优势。首先,长的读长特别适合新颖基因组的de novo组装。尽管新一代测序能够提供基因组的深度覆盖,但短的读长和扩增偏向会导致片段化的组装,特别是在遇到复杂重复或扩增不佳的区域时。利用 SMRT 测序运行的长 reads ,它将覆盖更多重复和缺失的碱基,从而自动消除缺口,节省整理时间。目前细菌基因组正利用这种方法完全组装,他们希望这种做法在不久的将来会转化到更大的基因组。
其次,考虑到 DNA 甲基化酶。这些作为单独的实体或限制-修饰系统的一部分而存在。在这两种情况下, DNA 甲基化酶对相对短的序列motif进行甲基化,因 DNA 聚合酶的动力学有所改变,从而很容易从 SMRT 序列数据中识别。此外, SMRT 测序也能识别RNA碱基修饰,不过要用RNA转录酶取代 DNA 聚合酶。因此,通过这种测序方法可直接获取功能信息。
第三就是关于 SMRT 测序不如其他NGS平台准确的流言。研究结果已表明, SMRT 测序与其他测序技术在确定遗传多态性上的性能相当。同时,利用 SMRT 测序及其他技术来组装完整基因组被证明与传统方法同样可靠且准确。此外,也有人证明,只利用 SMRT 测序 reads 进行组装实现了与其他平台相当甚至更好的性能。
作者也进一步谈了平台错误率。他们认为, SMRT 测序数据的优势在于其读长长和错误的随机性。单个 reads 确实包含较多的错误:大约11%-14%,或Q12-Q15,而 Illumina 为 Q30-Q35。然而,考虑到足够的深度(比方说8x或更高), SMRT 测序提供了高度准确的基因组序列,因为同一错误不可能被观察到很多次。
作者总结道,将其他技术的序列密集数据与中度覆盖的 SMRT 数据相结合,可改善基因组,获得它们的甲基化模式,并推导出甲基化转移酶基因的功能活性。作者呼吁从事细菌基因组研究的所有小组采用这一策略。此外,随着 PacBio RS II 仪器的推出,作者认为 SMRT 测序有望更广泛地应用于真核基因组的组装。
原文检索:
Richard J Roberts, Mauricio O Carneiro and Michael C Schatz. The advantages of SMRT sequencing. Genome Biology, 3 July 2013; doi:10.1186/gb-2013-14-6-405