为什么有的基因组拼不出来?为什么有的突变二代测序永远看不见?答案可能藏在‘读长’里。
在生命科学领域,测序技术的发展就像计算机芯片一样日新月异。从最早的一代测序(Sanger),到广泛应用的二代测序(NGS),再到如今的第三代测序(long-read sequencing),每一次迭代都在推动基因组学和转录组学研究进入新阶段。
今天,我们将重点介绍三代测序技术,并深入探讨 PacBio 与 Nanopore 两大平台,同时对比二代测序,帮助你快速了解它们的优势与局限。
第三代测序指能对单个未扩增的 DNA 或 RNA 分子进行直接测序的技术,能够产生千到上万碱基甚至更长的连续读长,常见实现包括纳米孔测序(Oxford Nanopore Technologies,ONT)和单分子实时测序(Pacific Biosciences,PacBio)的 HiFi/SMRT。
测序技术 | 主要特点 | 代表平台 |
---|---|---|
二代测序(NGS) | 高通量、短读长(通常 50-300bp)、需 PCR 扩增 | Illumina(如 NovaSeq、Miseq) |
三代测序 | 单分子测序、长读长(可达数万至数十万 bp)、无需 PCR 扩增 | PacBio SMRT、Oxford Nanopore |
简单来说,二代测序擅长“大规模并行短读长测序”,而三代测序则擅长“单分子长读长测序”。
PacBio 的核心技术是 单分子实时测序(SMRT),由美国太平洋生物科学公司(Pacific Biosciences)开发。PacBio SMRT / HiFi(Circular Consensus Sequencing, CCS):单个 DNA 分子被做成环状模板,在酶驱动下重复读多个循环,生成多次覆盖同一分子后合并成高精度的 HiFi 读(既长又高准)。HiFi 读的准确率可以达到短读长可比的水平(>99%)。
PacBio 的测序过程可以形象地理解为“观察 DNA 聚合酶跳舞”:
如果说三代测序曾经“长但不准”,PacBio HiFi 就是那个把“长 + 准”结合在一起的方案。
Nanopore 测序由英国牛津纳米孔公司(Oxford Nanopore Technologies,ONT)开发,是另一种主流的三代测序技术。Oxford Nanopore (ONT):分子被牵引通过蛋白或固态纳米孔,穿过孔时扰动离子电流产生“squiggle”信号,随后通过 base-calling 将信号转换成碱基序列。优点是实时产出、可做超长读(>100 kb 可达 Mb 级)和便携性强(如 MinION)。
Nanopore 的核心是“让 DNA 分子穿过纳米孔,通过电流变化来识别碱基”:
这让 ONT 特别适合 现场测序(比如疫情期间快速检测病原体),也适合研究 超长重复区和端粒序列。
长读长能直接跨越重复序列与结构变异,极大提高基因组拼接与 SV(结构变异)检测的分辨率。
能读取完整转录本(full-length isoforms),无需复杂的拼接(imputation),利于 isoform 定量、TSS/TER 识别和可变剪接研究。
不过,随着 PacBio HiFi 和 ONT base-caller 的不断改进,这些问题正在逐步缓解。
第三代测序在准确性、通量和成本上都在快速进步。想象一下,Illumina 给你的是“拼图碎片”,而 PacBio 和 ONT 给你的是“整张拼好的拼图”。这就是三代测序的魅力。PacBio 的 HiFi 路线把“长读 + 高准确”变为现实,ONT 在化学、孔道与 AI base-caller 的改进上持续推进,使得长期被视为“错误率高”的问题逐步缓解。未来,随着技术的不断进步,三代测序的准确性将进一步提高,成本也将逐渐降低,预计将在更多领域得到广泛应用。
如果你的研究问题涉及 异构转录本、结构变异、复杂基因组拼接或碱基修饰,第三代测序几乎是不可替代的工具。选择平台前请把研究目标、样本特性、预算与计算资源放在第一位,必要时考虑混合策略(长短结合)以兼顾准确率、成本与覆盖范围。