细胞

首页 » 常识 » 问答 » 深度学习帮助确定蛋白质结构,或有助于新冠
TUhjnbcbe - 2022/11/5 16:47:00

编译|文龙

低温电子显微镜(cryo-EM)让科学家能够生成诸如蛋白质之类的微小分子的高分辨率三维图像。这项技术十分适用于仅有一种构象的蛋白质成像,但是美国麻省理工学院(MIT)的研究人员开发出了一种机器学习算法,可以帮助他们识别蛋白质所能采取的多种可能结构。

与旨在仅从序列数据中预测蛋白质结构的AI技术不同,使用cryo-EM通过实验确定的蛋白质结构可产生数十万甚至数百万个蛋白质样品的二维图像,并将其冷冻在一层薄薄的冰层中。然后,计算机算法将这些从不同角度拍摄的图像拼凑在一起,形成蛋白质的三维构象图形,这一过程被称为重建。

图|蛋白质结构的3D电子密度(来源:MITNews)

在《自然方法》(NatureMethods)的一篇论文中,MIT的研究人员报告了一种基于AI的新软件Cryo-DRGN,该软件用于重建成像蛋白质的多种结构和运动,以实现蛋白质学术界的主要目标。在将蛋白质结构的传统表示形式作为3D电子散射强度被证明是不可行的之后,研究人员引入了一种新的神经网络体系结构,该结构可以有效地在单个模型中生成完整的结构集合。

论文的主要作者、MIT研究生EllenZhong说:「凭借着神经网络广泛的表示能力,我们可以从嘈杂的图像中提取结构信息并可视化大分子机器的详细动向。」

借助软件,他们从成像数据集中发现了蛋白质运动,虽然最初仅识别出一个静态3D结构;还可视化了剪接体的大规模运动,剪接体是一种蛋白质复合物,可协调转录RNA的蛋白质编码序列的剪接。

MIT生物学系助理教授JosephDavis说:「我们的想法是尝试使用机器学习技术来更好地捕获潜在的结构异质性,以及观察样本中存在的各种结构状态。」

麻省理工学院计算机科学和人工智能实验室的计算与生物学小组负责人、数学教授BonnieBerger和Davis以及博士后TristanBepler同样是这项研究的作者,该研究于2月4日发表在《自然方法》上。

组装流程可视化

研究人员通过分析组装核糖体的过程中所形成的结构来证明这个新方法的实用性。核糖体是负责读取信使RNA并将其转化为蛋白质的细胞器,有两个主要的亚基,每个亚基都包含许多蛋白质,这些蛋白质通过多步进行组装。Davis在斯克里普斯研究所(ScrippsResearchInstitute)担任博士后时就开始研究核糖体的结构。

为了详细研究核糖体组装的步骤,Davis在组装过程中的不同时间节点进行暂停,为所得结构拍摄电子显微镜图像。通过在不同节点暂停后得到的结构,可以判断产生方式的数量:如果仅有单个结构的积累,则表明该步骤只有一种产生方式;但如果有许多不同的结构,那么装配可能以多种方式发生。

由于其中一些实验产生了许多不同的蛋白质结构,因此传统的cryo-EM重建工具无法很好地确定这些结构是什么。

「总的来说,试图弄清粒子混合时有多少种状态是一个极具挑战性的问题。」

自年,Daivs就与Berger合作利用机器学习开发了一个可以使用cryo-EM产生的二维图像生成原始样本中发现的所有三维结构的模型。

在这项新研究中,研究人员提出了一种基于神经网络的cyro-EM重建方法cryoDRGN,制定了基于变分自动编码器(VAE)的图像编码器-体积解码器架构,该方法可以从未标记的2D图像对3D体积上的连续分布执行从头开始的无监督重建。虽然标准VAE假定所有图像异质性都纠缠在潜在变量中,但他们提出的体系结构能够在成像过程中独立于体积的外在取向对体积的固有异质性进行建模。他们通过使用该技术识别以前从未见过的核糖体状态,进一步证明了该技术的强大功能。

图|CryoDRGN模型框架(来源:论文)

先前的研究表明,当组装核糖体时,首先会形成类似于建筑物承重结构的大型结构元素。只有在基础形成后,读取信使RNA并合成蛋白质的核糖体「活性位点」才被添加到结构中。研究人员发现,在很小的核糖体子集(约占1%)中,通常在末尾添加的结构实际上会在基础组装之前就出现。为了解决这个问题,Davis认为对于细胞而言,要确保每个单个核糖体均以正确的顺序组装可能过于耗能。

「细胞能进化出一种平衡,这种平衡是存在于细胞能够和一小部分有害结构共存的承受力和移除出合成路径所需要付出的代价中权衡的。」

应用:新冠病*的刺突蛋白解析

研究人员现在正在使用这种技术研究冠状病*刺突蛋白,该蛋白与人体细胞上的受体结合使得细胞允许它们的进入。刺突蛋白的受体结合结构域(RBD)具有三个亚基,每个亚基均可指向上方或下方。

「对我而言,过去一年来大流行的爆发突出了一线抗病*药物在对抗病*方面的重要性,这些病*很可能会在未来出现。当我们开始思考如何开发小分子化合物以迫使所有RBD进入『下降』状态,从而使它们无法与人类细胞相互作用时,确切地了解『上升』状态的表象以及将为药物设计提供有益信息的构想易变性。我们希望这项新技术可以揭示这些结构的细节,」Davis说。

论文链接:

1
查看完整版本: 深度学习帮助确定蛋白质结构,或有助于新冠