(资料图)

美国麻省理工学院研究人员在新一期《应用物理学杂志》发表的论文中,将注意力神经网络与图神经网络相结合,以更好地理解和设计蛋白质。该方法将几何深度学习与语言模型的两种优势结合起来,不仅可预测现有蛋白质特性,还可设想自然界尚未设计出的新蛋白质。

蛋白质通过构建块的独特排列来执行大量生物任务。将这个几乎无限的排列库转化为各自的功能,就可让研究人员设计用于特定用途的定制蛋白质。

但蛋白质一直难以建模,尤其是人们想要“反向操作”——将所需的功能转化为蛋白质结构,更是一个高难度挑战。

此次新模型就可通过对基本原理建模,将大自然发明的一切作为基础,重新组合了这些自然构建块,能实现新功能并解决多类型任务。

新建模型将数字、描述、任务和其他元素转化为符号供神经网络使用。团队首先训练模型,根据不同蛋白质的功能来预测它们的序列、溶解度和氨基酸组成部分。然后,在收到新蛋白质功能的初始参数后,教它发挥创造力并生成全新的结构。

这种方法能创造出以前必须溶解在水中的固体抗菌蛋白。在另一个例子中,团队采用了一种天然存在的丝蛋白,并将其进化成各种新形式,包括赋予其螺旋形状或褶皱结构,让其具有弹力和韧性。

研究人员表示,该技术的广泛性意味着这一模型能应用于蛋白质设计之外的许多领域,如设计具有特定失效模式的材料。

推荐内容