在短短几分钟内对关键分子进行测序

纳米孔和图像识别软件可以实时对硫酸化的糖胺聚糖进行测序。

研究人员使用纳米孔证明了将糖胺聚糖(一类长链连接的糖分子,对我们的生物学至关重要,与DNA一样重要)测序所需的时间从数年减少到数分钟的潜力。

正如本周在《美国国家科学院院刊》上发表的那样,伦斯勒理工学院的一个研究小组表明,机器学习和图像识别软件可以用于基于电子学原理快速,准确地识别糖链,特别是四种合成硫酸乙酰肝素。信号通过晶体晶片上的小孔时产生。

“糖胺聚糖是一个复杂的序列表,因为莎士比亚的作品或耶茨的一首诗是一个复杂的字母集。伦斯勒理工学院首席研究员兼化学和化学生物学教授罗伯特·林哈特说:“要写它们需要专家,要阅读它们需要专家。”“我们训练过的机器可以快速读取等同于'ababab'或'bcbcbc'四个字母的单词。这些是简单的序列,没有任何意义,但是它们向我们展示了可以教机器阅读的方法。如果我们扩展和开发这项技术,它就有可能实时对聚糖甚至蛋白质进行测序,从而省去了多年的工作。”

商业的纳米孔测序设备用于对DNA进行测序,DNA由四个核酸单元(以字母A,C,G和T组成)组成,并以无尽的构型串在一起。该设备依赖于离子电流流经一个洞,该洞仅在膜中数十亿分之一米的宽度上。DNA链放置在孔的一侧,并随电流流过。每种核酸在穿过孔时都会在一定程度上阻塞孔,从而破坏电流并产生与该核酸相关的特定信号。目前用于野外工作的设备只是几种相对快速和自动化的DNA测序技术之一。

糖胺聚糖(GAG)是结构复杂的一类聚糖(存在于活生物体中的必需糖),存在于所有动物的细胞表面和细胞外基质中,并在细胞生长和信号传导,抗凝和伤口修复以及维持细胞中发挥许多功能附着力。目前从屠宰动物中提取的GAG被用作药物和保健食品。

像DNA一样,GAG可以细分为它们的组成二糖糖单元。但是,尽管DNA仅由线性串中的四个字母组成,但是这些聚糖具有数十个基本单元,其中一些具有连接的硫酸盐基团,酸基团和酰胺基团。例如,即使是一个相对较小的天然存在的六个糖单元的硫酸乙酰肝素分子也可能具有32,768个可能的序列。由于存在挑战,聚糖测序仍然很繁琐,依靠艰苦的实验室工作和复杂的分析,涉及诸如液相色谱-串联质谱和核磁共振波谱之类的技术。

作为他工作的一部分,聚糖专家Linhardt开发了常见的血液稀释剂肝素的合成变体,对GAG进行测序以了解天然形式并开发出合成变体。

伦斯勒生物技术与跨学科研究中心的成员林哈特说:“使用标准的分析方法,我们花了两年时间才对第一个简单的GAG进行测序。”“我们还有另外一个工作,我们已经完成了大部分工作,这花了我们五年多的时间-而且可能还要再花五年的时间才能完成,”

由于可以使用纳米孔测序来鉴定GAG中的二糖单元,因此研究小组构建了自己的纳米孔装置,并使用Linhardt实验室开发的化学酶法合成了四个硫酸乙酰肝素GAG链。重要的是,这四种硫酸乙酰肝素非常简单-由仅四种不同类型的糖单元的组合制成,组装成约40个单元长的链,并具有精心控制的组成和顺序。

研究小组将每种硫酸乙酰肝素通过纳米孔,并绘制了一个曲线图,描述了该设备随时间变化的输出电压。四个变体中的每一个都通过该设备运行了2,000次以上,考虑到实验性纳米孔的基本设计,增加了准确读取的统计可能性。

Linhardt说:“该设备实时对最简单的硫酸乙酰肝素进行测序,并产生了一种模式,我们的眼睛可以立即轻松地识别出这四个样品。”“您可以立即说出它们与众不同。”

为了确保分析无偏见,该小组使用Google的深度神经网络将结果输入免费的机器学习和图像识别软件中,对其进行训练以区分四种不同模式并识别硫酸乙酰肝素的每种变体。最成功的机器学习模型产生的分析准确率接近97%。

“ GAG序列中的信息含量可以大大超过相似数量的DNA或RNA,这意味着快速读取GAG序列的能力为了解生命的复杂生物化学打开了一个新的窗口,” Curt Breneman说。伦斯勒科学学院。“这项概念验证研究将创新的纳米检测方法与最先进的机器学习工具联系在一起,并展示了跨学科思维的力量,可以扩展知识领域。”

降低GAG通过纳米孔的速度可以提高准确性,并且可以在其他糖单元和更复杂的序列上训练该设备,所有这些都是未来的研究目标。林哈特说,这台机器必须学习10至20个糖单位,才能对GAG进行完全排序。

“这是概念的证明;我们已经让它读了两个字母的单词,”林哈特说。“一旦我们教了完整的字母,它将能够读取每个不同的序列。它将能够读取所有单词。”

参考:“合成硫酸乙酰肝素标准品和机器学习促进了固态纳米孔分析的发展”,美国国家科学院院刊。

该研究在国家科学基金会和美国国立卫生研究院的支持下发表。在伦斯勒(Rensselaer),林克哈特(Kin Xia),詹姆斯·T·哈根(James T. Hagan),李夫,布莱恩·S·皮茨(Brian S. Sheetz),索姆达塔·巴塔查亚(Somdatta Bhattacharya),张发明和杰森·德威尔(Jason R. Dwyer)参与了这项研究。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。