来源:动脉网
2025-08-07 13:58:00
(原标题:齐碳科技,纳米孔蛋白测序的野心藏不住了!)
过去这一个多月,国产纳米孔测序的技术开发和产品化明显开始提速。不管是DNA测序的Q20准确率,还是DNA甲基化的直接读取,抑或是超高通量测序芯片的推出,国产纳米孔测序都实现了门槛式的跨越。国产纳米孔测序走入每一个实验室,已经是指日可待。
产业先行者Oxford Nanopore Technologies(ONT)及不断增加的科学研究已经为纳米孔核酸测序做了很多探索,这些也将为DNA/RNA纳米孔测序的持续改进和开发提供指引。
DNA/RNA之后,下一个对象就是蛋白质。蛋白离生理活动更接近,蛋白水平的变化将能更多提示背后的生物学,因此蛋白的研究天然受到更多关注;最近,测序龙头Illumina通过并购进入到蛋白组学领域,而ONT也实现了通过纳米孔进行多肽测序的概念验证,行业龙头的引领更进一步推动了蛋白组学技术成为新的热点。
使用纳米孔进行蛋白测序这一概念早在十多年前就被正式提出了。这虽然比纳米孔核酸测序的发展晚了20多年,但也已经不是一个很新的技术开发思路了。然而,利用纳米孔进行蛋白测序的难度和挑战都远超DNA或RNA。
来源于Nivala, J., Marks, D. & Akeson, M. Nat Biotechnol 31, 247–250 (2013).
与DNA/RNA的4碱基组成不同,组成蛋白质的天然氨基酸有20种。由于其侧链基团的不同,使得这20种氨基酸的带电属性、极性、亲水性等不尽相同。当然,这些原子水平的差异可能造成独特的电信号特征,使得纳米孔测序可以用来分辨并鉴定详细的序列信息。
但总的来说,这带来了几个重大障碍需要克服。
首先,由于不同氨基酸侧链基团的相互作用,多肽链会天然倾向于折叠形成复杂的3D结构,对于读取氨基酸序列来说,必须要先解开这种空间构象使得其成为单一链才能进行穿孔和电信号读取,这不光是需要在过孔前需要解开,同时也要防止其在孔蛋白通道内自然折叠。
其次就需要考虑带正电荷的氨基酸,它们不像DNA/RNA通常都带负电的磷酸骨架可以自然地在电场力的作用下进行方向一致且稳定的穿孔。
来源于https://doi.org/10.1016/j.isci. 2021.103032
即便如此,还是需要考虑减缓多肽链的过孔易位速度,与DNA/RNA一样,需要构建一套体系来控制其穿孔速度,使得链中的氨基酸序列可以被有效地读取。
除此之外,由于氨基酸彼此组合的多样性空间更大,这使得在几十个皮安的信号中解码这种量级的信号状态难度指数级上升。
因此,不同的技术路线先后被开发,通过解决上面的这些问题,一定程度上实现了相应多肽测序的概念验证。这些不同的技术在所使用的蛋白孔、解开蛋白、引导过孔及控制易位等方面的思路和实现方式不尽相同。
来源于https://doi.org/10.1016/j.molcel.2024.10.038
利用纳米孔核酸测序已经相对开发成熟的技术基础,通过寡核苷酸偶联多肽链、使用DNA合成酶或解旋酶作为控速机制的技术路线在近几年比较多被报道。(事实上,几个月前,ONT也展示了利用这种技术路线在检测特定蛋白标记物或蛋白表达tag方面所取得的成绩。)但这些工作基本上处于技术验证或者早期探索阶段,距离产品化或者适配较大的场景使用都还需要持续的开发工作。
上个月初,齐碳科技联合创始人、清华大学白净卫教授课题组在Journal of the American Chemical Society发表了一篇文章,似乎并未引起太多关注,但对于DNA偶联多肽易位穿孔的多肽测序技术路线来说实则意义重大。
这篇文章题为“Spike signals and MD simulations reveal the significance of peptide stretching in nanopore protein sequencing”,通过实验证据和分子动力学模拟,文章得出结论:多肽以拉伸固定的构象通过纳米孔是实现单氨基酸辨识纳米孔蛋白质测序的必要条件。
早在2021年11月,白净卫团队就在Chemical Science上发表了DNA偶联多肽易位测序的技术开发成果。同年,国内南京大学⻩硕教授团队和荷兰代尔夫特理工大学的Cees Dekker教授团队也发表了类似的技术体系的初步验证成果。
那时,基于齐碳现有的纳米孔测序平台搭建,白净卫等人将待测肽链与ssDNA进行偶联(3’-ssDNA(89nt)-5’-N-peptide(23aa)-C-3’-polyT(30nt)-5’) ,以耐高盐的MTA-h解旋酶来控速DNA进而控制待测肽链穿过纳米孔,选择收缩点位于通道底部的MspA-M2作为纳米孔读头,实现了17个氨基酸(aa)的短肽读取。
多肽测序的目标自然是实现单个氨基酸(及其修饰)的明确区分,进一步说就是实现每个氨基酸侧链基团的区分和读取。但在这篇Chemical Science文章中,白净卫等人发现肽易位并没有产生清晰和可重复的步进式离子电流,这也就无法对单个氨基酸残基的顺序进行区分。既然无法进行测序,换个角度看,他们想搞清楚这个体系是否能用于区分短肽链中单个氨基酸残基的变化。有意思的是,如果将多肽序列中的部分正电荷氨基酸突变为中性氨基酸,结果是很难区分出变化,但是引导DNA与多肽偶联交界处能观察到大量的毛刺式振荡电流信号。而突变为带负电的氨基酸,或者进行磷酸化后,毛刺振荡信号会更加急促,且多肽处也出现了明显的台阶式电流抬升。
棕色标记的信号转换区域提示:(a) S5D 和(b) S5Q 显示出强烈的尖峰信号,而S5K (c) 和S5R (d) 则几乎没有尖峰。
然而,同期发表的其他文章则提示应用类似的策略对高负电荷氨基酸肽段进行测序却实现了步进式阻断电流。于是,白净卫等人推测,肽链中氨基酸的电荷状态可能与肽链过孔的拉伸状态相关,因此可能会形成类似于弹簧松弛的振荡状态。
最近的这篇JACS文章可以说是对于4年前这一猜测的完整论证。在这篇文章中,白净卫团队终于明确且创新地提出了DNA弹簧振荡模型,通过对肽链在纳米孔内转位动态的深入理解,解释了带电性氨基酸突变如何影响毛刺信号的机制。
前面说到,在ssDNA 与肽段的连接区,会观察到特别的毛刺信号,在电流轨迹中会出现快速、重复的剧烈波动,先为高于ssDNA 信号的“向上尖峰”,随后转为低于肽段信号的“向下尖峰”信号。这些信号的停留时间均小于5 ms,显著短于文章中使用的解旋酶的步进时间(约几十ms),这说明毛刺信号的产生不是由马达运动导致的,提示其可能与ssDNA -肽的构象波动有关。
那么到底是什么导致了毛刺信号产生呢?通过对比不同氨基酸突变体的信号特征,发现如果氨基酸突变成带负电荷,ssDNA 振荡变得短促;而突变为正电荷,则几乎不会出现毛刺信号;同时,这一突变电荷越靠近ssDNA的连接位置,则其对信号的影响越大。这就提示肽链电荷可以影响电场力的方向和强度,进而影响ssDNA 的弹性状态。
当ssDNA之后连接的带负电荷氨基酸进入孔道时,电场力骤降,原本因此拉伸的ssDNA 像“释放的弹簧” 一样快速收缩,短暂地将肽段拉入孔道,形成更大电阻和向上尖峰信号,但随后ssDNA 在电场力作用下又回弹,肽段部分退出孔道,这时只有ssDNA留在孔道中,因此又形成了向下尖峰,反复这般就构成了周期性波动。
为了验证这一模型的合理性,文章通过三个实验获得了关键性证据支持。
通过检测ssDNA引导链-多肽偶联物末端核苷酸信号的丢失情况,初步证实DNA具有弹簧特性。因为ssDNA 的弹性收缩会导致末端碱基快速通过孔道而无法检测,结果提示正电荷会增强收缩从而导致更多的末端碱基过孔信号的丢失,而负电荷可抑制收缩从而保留末端核苷酸信号读取。
通过引入柔性C6-spacer修饰DNA,降低了ssDNA 的弹性常数,使得毛刺信号完全消失,降低ssDNA的弹性抑制了振荡能力,这进一步支持DNA弹簧模型。
与深势科技合作进行的分子动力学模拟,不仅直接观测到DNA弹簧振荡行为,还发现不带电多肽在纳米孔中呈现动态卷曲/伸展构象,这种不稳定构象导致台阶电流信号难以形成,而强负电性多肽则保持拉伸固定状态,因此可以产生明显台阶信号。
肽链在纳米孔孔道内保持拉伸可以实现单氨基酸分辨率,这是文章所证实并传递的一个重要讯息。
比如带周期性负电荷的4ESS 肽链在电场力与解旋酶拉力的共同作用下,毛刺信号消失,恢复了清晰的阶梯信号(平均12 个台阶),这与马达的步进运动同步。而如果把其突变为4EWW(含色氨酸,大体积疏水侧链),因侧链大小影响孔内电流,信号在2-6 位有显著差异。(而如果突变为4EYY (酪氨酸,侧链有芳香族氨基酸),也可以与4EWW 的信号实现类似的区分,证明文章中所使用的纳米孔对芳香族氨基酸具有敏感性。)
通过拉伸肽链,可稳定其纳米孔内构象并恢复阶梯信号,实现单氨基酸分辨率,这为后续高分辨率的测序奠定了一个关键理论和事实基础。
然而这如何转化到实际的工作流程及测序方法体系搭建上呢?
文章中提到,在ssDNA-肽偶联处尽可能地引入负电荷氨基酸,因此可以产生拉伸力可稳定肽链构象,这在现实样本中似乎并不具有实际操作性,更何况涉及到任何连接反应都有效率的问题。或者是文章提示的通过使用修饰的DNA去做偶联,使得ssDNA骨架更加僵硬或者不带电荷?
之前很多研究关注的是如何实现蛋白折叠结构的解开和受控的易位穿孔。这里不管是使用核酸聚合酶/解旋酶还是蛋白解折叠酶如ClpX等,似乎更多的假设都是DNA多肽偶联物会在这些酶控条件下保持相应的步进。但白净卫团队这篇文章一针见血地指出,不管是怎样的控速,要实现单氨基酸测序分辨率的前提是,肽链在步进的同时一定也要保持拉伸状态。
当然,保持肽链拉伸并不足以实现高效的多肽测序。比如这篇文章及其他一些业内文章所提示的,纳米孔及其读取精度的选择对于高效、高准确率区分一些残基结构相似的氨基酸来说也很关键,这也会推动后续工作不断地去筛选、改造并优化更理想的纳米孔蛋白,比如可实现更高分辨率的、更小的氨基酸读取头,和可实现更大读长的、更长的纳米孔茎干/孔道。
但可以很明确的是,弹簧振荡模型阐明以后,不管是后续开发还是优化,我们都有了一个明确的方向性指引,以是否可以增强肽链的拉伸固定构象为基准,可以构建更加稳健的assay用于辅助或加速蛋白测序的体系开发和完善。
最近有幸与白老师交流,在这篇文章之后,他的团队在后续开发上已经又取得了一些成果,在如何形成对抗、拉伸肽链、实现高分辨读取方面,已经搭建了相应的体系,可以稳定地实现氨基酸过孔的步进式阶梯信号、可以实现短肽序列中氨基酸的高分辨率识别和读取。
相信这样的技术体系已经可以朝向产品化去做转化,就像ONT展示的那样,虽然实现长链读取和从头测序还异常艰辛,但这至少可以用于蛋白biomarker、一些磷酸化修饰等的靶向检测,在业内生态的共同努力下,这样的工具或许已经能探索用于并解决不少的现实问题。
需要特别强调的是,上面提到的这些技术和相应的专利都已经独家授权到了齐碳科技公司。
通过将多肽连接核酸、在核酸酶控制下实现偶联物穿孔、通过读取纳米孔电流信号获得多肽序列的这一方法学专利,在2019年6月29日就在国内提交了专利申请,并在2020年6月24日进入了国际申请阶段。目前,国内和欧洲专利已经获批,美国专利还在答复阶段。从专利优先权日来看,齐碳所获得的这个方法学专利(2019年6月29日)比ONT的DNA多肽偶联穿孔测序专利还要早(2019年12月2日,通过专利GB1917599.1A申请所获得的优先权),这也为齐碳后续产品开发和商业化提供了不少底气。
在纳米孔核酸测序的第35个年头,通过纳米孔进行蛋白测序的开发才刚刚起步,不同的技术路线或许都有机会在未来一角雌雄。面对蛋白组学上百亿美元的潜在市场来说,任何创新的技术解决方案也都将有机会在这个大舞台上一展身手。
而对于齐碳科技来说,这样的戏码似乎在公司刚创立的时候就默默想好了。
作为国内第一家纳米孔核酸测序公司,悄无声息地,齐碳也将在纳米孔蛋白测序上迎来破局并正式亮相。
参考:
https://doi.org/10.1021/jacs.5c00827
https://doi.org/10.1039/D1SC04342K
雷达财经财富号
2025-08-07
雷达财经财富号
2025-08-07
雷达财经财富号
2025-08-07
源媒汇
2025-08-07
证券市场周刊
2025-08-07
证券市场周刊
2025-08-07
证券之星资讯
2025-08-07
证券之星资讯
2025-08-07
证券之星资讯
2025-08-07