主要科学进展:DeepMind AI AlphaFold解决了长达50年的蛋白质结构预测大挑战
自由建模类别中蛋白质靶标的两个示例。AlphaFold可以根据实验结果预测高度精确的结构。
DeepMind开发了针对50年蛋白质挑战的AI解决方案,为加速生物学研究创造了潜力。
根据一项严格的独立研究,在一项重大的科学进步中,DeepMind的AI系统AlphaFold的最新版本已被视为解决50年来蛋白质结构预测面临的巨大挑战(通常被称为“蛋白质折叠问题”)的解决方案。评估。从长远来看,这一突破可以大大促进生物学研究,从而在疾病理解和药物发现等领域开辟新的可能性。
如今,CASP14的结果表明,DeepMind的最新AlphaFold系统在结构预测中达到了无与伦比的准确性。该系统能够在几天之内确定高精度结构。CASP是蛋白质结构预测的关键评估,是始于1994年的两年一次的社区运行评估,也是评估预测技术的金标准。参与者必须盲目地预测刚刚通过实验确定的蛋白质的结构,或者某些情况下尚未确定的蛋白质的结构,并等待将其预测与实验数据进行比较。
CASP使用“全球距离测试(GDT)”度量标准来评估精度,范围为0-100。新的AlphaFold系统在所有目标上的GDT平均得分均为92.4。该系统的平均误差约为1.6埃,大约相当于一个原子的宽度。根据CASP的联合创始人兼主席John Moult教授的说法,大约90 GDT的分数被非正式地认为与通过实验方法获得的结果具有竞争力。
马里兰大学CASP联合创始人兼主席John Moult教授说:
“我们一直致力于解决这一问题-蛋白质如何折叠-近50年了。看到DeepMind为这个问题提供解决方案,他已经在这个问题上进行了很长时间的工作,经过了无数次停顿,并开始怀疑我们是否会到达那里,这是一个非常特殊的时刻。”
为什么蛋白质结构预测很重要
蛋白质对生命至关重要,其形状与功能密切相关。准确预测蛋白质结构的能力使人们能够更好地了解它们的作用及其运作方式。目前,主数据库中有超过2亿种蛋白质,并且仅绘制了其3D结构的一小部分。
一个主要的挑战是蛋白质在理论上可以折叠成最终的3D结构之前可以折叠的天文方法。从根本上说,社会面临的许多最大挑战,例如开发疾病的治疗方法或寻找可分解工业废物的酶,都与蛋白质及其发挥的作用息息相关。确定蛋白质的形状和功能是科学研究的一个主要领域,主要是使用实验技术,每个结构可能要花费数年的艰辛和艰巨的工作,并且需要使用数百万美元的专用设备。
DeepMind解决蛋白质折叠问题的方法
这项突破性突破建立在DeepMind于2018年首次在CASP13上参赛的基础上,该版本的初始版本AlphaFold达到了所有参与者中最高的准确性。现在,DeepMind为CASP14开发了新的深度学习体系结构,从生物学,物理学和机器学习领域以及过去半个世纪蛋白质折叠领域的许多科学家的工作中汲取了灵感。
折叠的蛋白质可被视为“空间图”,其中残基为结点,边缘将残基紧密相连。该图对于理解蛋白质内的物理相互作用及其进化历史非常重要。对于在CASP14上使用的最新版本的AlphaFold,DeepMind创建了一个基于注意力的神经网络系统,端到端进行了培训,该系统试图解释该图的结构,同时对所构建的隐式图进行推理。它使用进化相关的序列,多序列比对(MSA)和氨基酸残基对表示来完善该图。
通过重复此过程,系统可以对蛋白质的基本物理结构进行强有力的预测。此外,AlphaFold可以使用内部置信度量度来预测每个预测的蛋白质结构的哪些部分是可靠的。
该系统接受了来自蛋白质数据库中约170,000种蛋白质结构组成的公开数据的培训,使用的是现代机器学习标准所需要的相对适量的计算-大约运行了128个TPUv3核(大约相当于100-200个GPU)几个星期。
可能对现实世界产生影响
DeepMind很高兴与其他人合作,以了解有关AlphaFold潜力的更多信息,AlphaFold团队正在与几个专家小组一起研究蛋白质结构预测如何有助于理解某些疾病。
还有迹象表明,作为科学界开发的许多工具之一,蛋白质结构预测可能在未来的大流行应对工作中有用。今年早些时候,DeepMind预测了SARS-CoV-2病毒的几种蛋白质结构,实验人员令人印象深刻的快速工作现已证实AlphaFold在其预测中达到了很高的准确性。
AlphaFold是DeepMind迄今为止最重要的改进之一。但是,与所有科学研究一样,还有许多工作要做,包括弄清楚多种蛋白质如何形成复合物,它们如何与DNA,RNA或小分子相互作用以及如何确定所有氨基酸侧链的精确位置。
与早期的CASP13 AlphaFold系统一样,DeepMind计划在适当的时候向同行评审的期刊提交详细介绍该系统工作原理的论文,并同时探索如何最好地以可扩展的方式为系统提供更广泛的访问。
AlphaFold在展示AI作为辅助基础科学发现的工具的惊人潜力方面开辟了新天地。DeepMind期待与他人合作以释放这种潜力。
独立科学家的发言:
诺贝尔奖得主,皇家学会主席Venki Ramakrishnan教授说:“这项计算工作
代表了蛋白质折叠问题的惊人进展,蛋白质折叠问题已有50年历史,是生物学领域的巨大挑战。几十年来,该领域的许多人已经预料到了。看到它将从根本上改变生物学研究的多种方式,将是令人兴奋的。”
EMBL-EBI的名誉主任兼高级科学家Dame Janet Thornton教
授“ DeepMind团队成功实现的目标非常棒,它将改变结构生物学和蛋白质研究的未来。经过数十年的研究,蛋白质提供了所有生物的结构和功能的分子,今天早上我醒来时感到已经取得了进展。”
Arthur D. Levinson博士,Calico创始人兼首
席执行官,Genentech前董事长兼首席执行官这一飞跃表明了计算方法将如何转变生物学研究,并有望加速药物开发过程。
马克斯·普朗克发展生物学研究所所长Andrei
Lupas教授说:“ AlphaFold惊人的精确模型使我们能够解决近十年来所停留的蛋白质结构,重新开始了我们的工作,以了解信号如何跨细胞膜传输。”
EMBL副总干事Ewan
Birney教授,EMBL-EBI主任我知道CASP多么严格-它基本上可以确保计算模型必须执行从头开始的蛋白质折叠这一具有挑战性的任务。看到这些模型能够如此精确地做到这一点,真让人感到遗憾。有很多方面需要理解,但这对于科学来说是巨大的进步。
DeepMind / Alphabet的陈述:
DeepMind博士,创始人兼首席执
行官Demis Hassabis,“ DeepMind的最终愿景一直是建立AI,然后使用它通过加快科学发现的步伐来帮助我们进一步了解周围的世界。对我们而言,AlphaFold代表了该论文的第一个证明点。这一进步是我们在科学领域长期面临的巨大挑战中的第一个重大突破,我们希望它将对疾病的理解和药物发现产生巨大的现实影响。”
DeepMind科学AI负责人Pushmeet Kohli博士说:“这些令人难以置
信的结果证明了DeepMind独特的研究理念—将以任务为中心的多学科团队聚集在一起,以实现雄心勃勃的科学目标。像CASP这样的关键评估对于推动研究进展非常重要,我们期待以此为基础,加深我们对蛋白质和生物学机制的了解,并开拓新的探索途径。”
DeepMind的AlphaFold主管John Jumper博士“蛋
白质生物学异常复杂,无法简单表征。我们团队的工作表明,机器学习技术终于可以满足描述这些令人难以置信的蛋白质机器的复杂性,并且,我们为看到人类健康和基础生物学的新突破感到非常高兴。”
DeepMind科学工程师Kathryn Tunyasuvunakool博士,“使
用AI预测高精度蛋白质结构的能力可能会改变我们处理生物学的方式,并可能在药物设计和生物修复中得到潜在的应用。特别是对于具有挑战性的蛋白质,好的预测技术可能会带来巨大的改变。”
Google和Alphabet首席执行官Sundar Pichai,“这是人
工智能在蛋白质折叠方面取得的令人难以置信的突破,这将有助于我们更好地理解生命中最基本的组成部分之一。DeepMind的这一巨大飞跃具有直接的实际意义,使研究人员能够应对新的难题,包括从未来的大流行应对到环境可持续性。”
阅读DeepMind AI解决方案以应对50年的科学挑战,该解决方案可以“革新医学研究”,以获取更多有关此主题的信息。
关于DeepMind
DeepMind是一个由科学家,工程师,机器学习专家等组成的跨学科团队,致力于研究和构建安全的AI系统,以学习如何解决问题并促进所有人的科学发现。
DeepMind以开发AlphaGo(在复杂的Go游戏中击败世界冠军的第一个程序)而闻名,DeepMind已发表了1000多篇研究论文,其中包括《自然与科学》中的十几篇论文,并在许多具有挑战性的AI领域取得了突破性的成果《星际争霸II》将蛋白质折叠。
DeepMind于2010年在伦敦成立,并于2014年与Google联手加快其工作。从那时起,它的社区扩展到包括阿尔伯塔省,蒙特利尔,巴黎和加利福尼亚山景城的团队。