谷歌人工智能专家,DeepMind,在需要证明人工智能的简单性,以协助已完成仅有基于其基因序列预测蛋白质的3D结构的简单任务方面,早已声称具备“最重要的里程碑”。理解蛋白质结构在疾病诊断和化疗中十分最重要,可以提升科学家对人体的了解-并有助反对蛋白质设计和生物工程。
在一篇关于用于AI来预测蛋白质如何拉链的项目的博客文章中写到:“AlphaFold[DeepMind的AI]分解的蛋白质的3D模型比以前的任何蛋白质更加精确-制作在生物学的核心挑战之一获得重大进展。”有各种科学方法可用作预测DNA中残余氨基酸的蛋白质分子的天然3D状态(即蛋白质链如何拉链以超过天然状态)。
但是对3D结构展开建模是一项非常复杂的任务,因为蛋白质拉链有可能不存在多少排序,这各不相同诸如氨基酸之间的相互作用等因素。甚至还有一个众包在游戏(FoldIt)企图利用人类的直觉来预测不切实际的蛋白质形式。
DeepMind回应,其方法依赖多年前用于大数据企图预测蛋白质结构的研究。明确而言,它正在将深度自学方法应用于基因组数据。“幸运地的是,由于基因测序成本的较慢减少,基因组学领域的数据非常丰富。因此,在过去几年中,依赖基因组数据的预测问题的深度自学方法显得更加风行。
DeepMind关于这个问题的工作产生了AlphaFold,我们今年递交给了CASP[蛋白质结构预测技术关键评估的社区范围实验]。deepmind团队专心于从头开始建模目标形状的难题,而不用于先前解析的蛋白质作为模板。
我们在预测蛋白质结构的物理特性时超过了高度的准确性,然后用于两种有所不同的方法来建构原始蛋白质结构的预测。DeepMind它用于的两种方法依赖用于深度神经网络训练来预测其基因序列中的蛋白质特性。其网络预测的属性是:(a)氨基酸对之间的距离和(b)相连这些氨基酸的化学键之间的角度。
第一个发展是对常用技术的变革,这些技术可以估算氨基酸对否彼此相似。通过训练了一个神经网络来预测蛋白质中每对残基之间的距离的分开产于。然后将这些概率组合成评估所明确提出的蛋白质结构的准确度的分数。
还训练了一个分开的神经网络,它用于所有距离汇总来估算建议书结构与准确答案的相似程度。然后,它用于新方法尝试建构蛋白质结构的预测,搜寻与其预测相匹配的未知结构。“第一种方法创建在结构生物学中常用的技术上,并且用新的蛋白质片段重复更换蛋白质结构的片段。
训练一个分解神经网络来发明者新的片段,用作大大提升所明确提出的蛋白质结构的分数。”“第二种方法通过梯度上升优化分数-一种常用于机器学习的数学技术,用作展开小的,趋向的改良-这造成了高度准确的结构。这种技术限于于整个蛋白质链而不是必需在装配前分开拉链的碎片,这减少了预测过程的复杂性。
“DeepMind用于计算方法将迄今为止所获得的成果叙述为“蛋白质拉链进展的早期迹象”-声称它们证明了“AI用作科学找到的实用性”。虽然它也特别强调深度自学方法仍正处于早期阶段,具备任何“可分析的影响”。尽管在需要对化疗疾病,管理环境等方面产生可分析的影响之前还有很多工作要做到,但我们告诉这种潜力是极大的。
本文来源:博鱼(boyu·中国)官方网站-www.fuxibao.com