南都讯 记者陈志芳 新冠病毒席卷全球,阿尔法狗的研究团队DeepMind也出手了。
近日,DeepMind运用新型深度学习系统AlphaFold,发布了与新冠病毒有关的蛋白质结构预测结果。这或有助于科学界研发出新冠病毒的治疗方法。
视频:潘颖欣
“这能帮助科学界分析这一新冠病毒是如何运作的,并能在未来研究新冠病毒的治疗方法时,为实验提供假设生成平台”,DeepMind在发布预测结果的文章中写到。
DeepMind称,在过去的五十年中,研究人员使用冷冻电镜、X射线、核磁共振等实验技术,来确定蛋白质结构,但每种方法都需要大量的试错,耗费的不仅是金钱,还有可能是多年的时间。而AI技术的加入,或能大大缩短研究时间。
据悉,AlphaFold以数十年的大型基因组数据集为基础,使用了一种称为“自由建模”(Free Modeling)的机器学习技术,能在没有可用的相似蛋白质结构时,预测蛋白质结构。
具体而言,AlphaFold通过上述技术,训练了一个深度神经网络来预测蛋白质中每对残基之间的距离分布。这些预测结果会整合起来,得出一个判断蛋白质预测结构的准确性的分数。同时,AlphaFold还训练出另一神经网络,汇总所有残基距离,来分析蛋白质结构预测结构与正确答案有多接近。通过评估分数,DeepMind团队还会继续使用神经网络来找到符合预测结果的蛋白质结构,包括反复替换蛋白质片段、进行较小的增量改进等。
蛋白质结构预测为何重要?DeepMind称,蛋白质是所有生命必不可少的、复杂的大分子。几乎人类身体的所有功能,包括收缩肌肉、感知光线、将食物转化为能量等,都有赖于蛋白质及其移动、变化的方式。而蛋白质发挥的作用取决于不同的、独特的三维结构,比如人类免疫系统中利用的抗体蛋白质是“Y形”。抗体蛋白质能检测、标注和消除引起疾病的微生物。因此,如果体内蛋白质出了问题,可能会导致生物体生病或者死亡。简单地说,蛋白质的三维结构决定了其功能,了解新冠病毒蛋白的三维结构或有助于找出治愈方法。
不过,目前公布的蛋白质结构预测尚未经过实验的验证。文章中写到,“通常来说,我们会等到(投递的)学术期刊经过同行评审后,再发表这一工作。然而,由于现有情况的潜在严重性和时间敏感性,我们先行发布现有的结构预测,同时允许所有人来使用它们。”
DeepMind称,科学界正推动着对新冠病毒疫情的研究。目前,有的实验室在开放访问数据库中公开病毒基因组,有的分享了某些经过实验验证和计算机预测的病毒蛋白结构,有的则提供流行病学数据。
据悉,谷歌于2014年以4亿英镑的价格收购了总部位于伦敦的研究机构DeepMind。此前,该公司曾利用AI技术,开发用于识别眼部疾病和检测颈癌的模型。
DeepMind声明原文:
https://deepmind.com/blog/article/AlphaFold-Using-AI-for-scientific-discovery
编辑:蒋琳