9月2日,天壤发布国内首款AI蛋白质设计工作台,赋能科研工作者高效研究工作,推动AI+蛋白质计算领域的大规模快速应用与发展。
WAIC生物计算论坛在上海张江科学会堂顺利举办。上海市委统战部副部长黄红、上海市经信委副主任张英出席开幕式。天壤XLab负责人苗洪江博士受邀出席,发布国内首款AI蛋白质设计工作台,并分享AI应用于生物科技的最新技术和发展。
蛋白质世界的空间巨大、功能丰富,氨基酸的蛋白质可能序列是20^~1.3×10^,相比之下,通过进化得来的天然蛋白质只是其中非常微小的子集。未知空间中还有很多可能解决医疗健康、能源环保等挑战的功能蛋白质没有被触及。
苗洪江博士认为,AI使蛋白质实现了从被预测到被发明的飞跃,我们今天能够端到端地完成蛋白质的从头设计,这将打开一个全新的世界。
以下是本次演讲的核心内容:
AI实现了从感知到创造的飞跃性发展
过去几年,从战胜围棋世界冠军朴廷桓、到城市交通治理实现南昌交通不限行、再到原子精度级别的蛋白质结构预测,天壤见证了人工智能算法在越来越复杂的系统中展现出的惊人实力。今年天壤的TRDesign算法完成了蛋白质设计工作,真正实现了AI从感知到创造的飞跃性发展,这种方法能够为人们带来一个全新的蛋白质设计世界。
年,只根据天然蛋白质序列进行局部搜索的进化方式获得诺贝尔化学奖,然而此种方式还远远不够,以全新的从头设计的方式才能够去探索整个广阔的蛋白质空间世界。
蛋白质设计大约经历了四个阶段:从20世纪90年代初期,只有非常少量的蛋白质结构,对蛋白质折叠的理解非常局限,研发人员只能通过手动拼接出非常简单的二级结构片段来研究蛋白质;随着PDB中蛋白质结构信息的增加,科学家们能够通过从这些结构信息中总结出的理性经验和更为复杂的能量函数关系、通过实践设计出了越来越多功能的蛋白质结构;尽管如此,设计蛋白质的流程复杂且落地非常困难;现在通过AI的方式能够从头设计蛋白质,可以规模化地应用于产业,蛋白质设计已经进入了全新的时代,这与人们对蛋白质结构的解析和理解密不可分。
准确预测蛋白质结构开启新的大门
以AlphaFold为代表的各种AI算法已经能够实现快速准确的蛋白质结构预测,并达到实验室解析水平,蛋白质结构的准确预测为蛋白质设计开启了新的大门。天壤的TRDesign即在蛋白质折叠问题破解的基础上,通过对序列-结构-功能底层关系的深刻理解和剖析,实现了蛋白质的端到端设计,能够根据功能需求从头设计蛋白质结构和序列。
基于TRDesign算法,天壤设计了新冠刺突蛋白结合剂,能有效阻止刺突蛋白和人体ACE2蛋白结合,以此防止病毒的传播。设计过程通过参考各种已知新冠变种刺突蛋白与人体ACE2的结合结构,最大程度的包含了整个结合界面作为motif来进行设计,有希望普适性的应对各种新冠变种。
在更困难的多配体蛋白质设计方向,天壤从头设计生成的IL2类似蛋白质,不仅能够包含激活淋巴细胞的motif,也因无法与CD25结合避免了天然蛋白的毒性,且设计蛋白质长度只有个氨基酸左右,与天然IL2蛋白序列相似度不足10%。
这样高拟合程度表明了蛋白质设计算法在目标功能的开发当中能够广泛搜索潜在的蛋白质序列空间,并折叠成结构符合功能的蛋白质。
此外,在多表位的抗原蛋白质设计方向,RSV病毒会引起肺部和呼吸道感染,对婴幼儿产生极大危害,而这种病毒的表面融合蛋白在融合前后会产生较大的构象变化,导致疫苗开发一直无法获得成功。利用TRDesign将融合蛋白上两个已知的抗原表位成功设计成一个约90个氨基酸的稳定蛋白质,在结构分析中可以看到设计蛋白质可以很好的呈递抗原表位,天壤XLab正积极推进进一步的实验检测,来测试细胞内的免疫激活水平。
这些示例都来自于TRDesign蛋白质设计算法:只需输入所需的功能motif,就可以端到端的进行蛋白质的从头设计,输出符合需求的蛋白质序列和对应结构。不再受到从前设计方法中人为经验或者能量函数的限制,能够快速高效的进行蛋白质设计落地和应用。
AllinOne:人人可用的蛋白质设计平台
AIforScience时代,为了更好地利用AI工具帮助人们加速科学研究,天壤开发建设了一个Allinone的工作平台——CREATOR蛋白质设计工作台,希望借助这个人人可用的蛋白质平台,提供数据、算法、算力以及系统级的项目管理支持,推动蛋白质设计的普及和应用。
在该平台上,研发人员可以以非常简单的操作逻辑实现从结构预测、蛋白质设计、到特性分析优化的各项任务,并对历史任务进行跟踪查看,且所有任务可以可视化呈现;另外,研发人员可以以项目的方式自由的对原本零散的任务进行分类、串联和管理,一站式的完成从项目规划到结果分析的整个流程,大幅提升研发效率。
CREATOR工作台不仅提供了天壤的自研算法,同时也提供各种开源及合作伙伴的算法,供大家自由选择使用,实现一个平台就能完成所有研究任务,告别为不同任务寻找不同算法的科研局面。
00:32以新冠病毒刺突蛋白的结构预测任务为例,用户从构建项目、选择算法、启动预测,操作流畅简洁,在任务完成后可以对预测结果进行可视化和分析。
00:57作为国内首款AI蛋白质工作台,平台可预测可编辑,以算法、算力、数据管理为基础,融合了完善的蛋白质设计、预测分析和优化能力,流程操作简单,人人可用、易用,且无需安装,在线登陆账号就能启用所有功能,可以广泛的应用于多肽、酶、抗体和各类功能蛋白质,研发人员可以在工作台上完成全部的计算工作。
期待未来将有数以万计的各类全新设计的功能蛋白质从天壤的工作台产出,通过实验合成和检验,应用新材料、新药物和新食品应用于人们生活的各种场景。
目前工作台正在不断的扩充功能和算法,建设蛋白质知识图谱和扩展已有的功能motif库,赋能研发人员的同时进一步降低蛋白质设计的门槛,使CREATOR真正成为人人可用的设计工作台。
未来,随着跨时代设计能力的普及、人们对蛋白质理解的深入以及越来越多的人的加入,天壤相信将与大家一起推动蛋白质设计和AI生物计算的发展和应用落地。
CREATOR工作台将在10月1号正式上线并面向全国高校免费开放,登入天壤XLab