我们如何应对COVID-19:一站式科研数据与信息共享平台

 

GHDDI免费开放三项人工智能在线服务,加速新药研发,赋能制药行业

2020年12月21日

全球健康药物研发中心(GHDDI)于2020年12月21日正式对外开放三个人工智能药物研发(AIDD)平台在线服务,包括:COVID-19 人工智能虚拟筛选平台、ADMET预测评估平台和基于靶点结构的人工智能超高速虚拟平台。这三大平台将免费开放给世界范围的高校和制药行业,为其提供新冠小分子药物虚拟筛选、ADMET成药性综合预测和评估以及基于蛋白质靶点结构的虚拟筛选等在线服务,加速和赋能药物研发。GHDDI 会不断更新并逐步开放更多AIDD模块,整理开放源代码和Github文档博客,以最高效的方式向全球同步分享研发成果和行业知识经验。

早在1月29日,GHDDI人工智能研发团队(GHDDI-AIDD)便紧急上线针对新型冠状病毒(SARS-CoV-2)研究的一站式科研数据与信息共享平台 “Targeting COVID-19”。该团队通过运用人工智能自然语言处理技术对全球范围内的新冠药物研究进展进行采集和整理,并将所采集的信息进行挖掘分析,进而结构化拓充这一领域的知识谱系。基于这种结构化知识谱系,团队利用神经网络算法整合不同维度和尺度的生物医学数据建立预测模型,全面验证并回答从微观到系统整体不同层面的问题,进而助力科研人员加速新冠药物研发。此次推出这三种新的人工智能药物研发平台在线服务是GHDDI的又一抗疫举措。

COVID-19人工智能虚拟筛选平台

该平台是一种小分子药物虚拟筛选平台,目前已上线三个模块:基于配体的虚拟筛选模型,基于网络的虚拟筛选模型和高级搜索引擎。基于“Targeting COVID-19”平台中的70,000多化合物历史数据,COVID-19人工智能虚拟筛选平台已搭建了针对新冠靶标活性、表型活性、抗病毒选择性等不同维度的深度学习模型,为全球新冠科研工作者提供了免费的药物虚拟筛选工具。 

平台链接:http://aidd.ghddi.org/covid19/

1608621896740677.png

▲ 基于多尺度网络的虚拟筛选模型流程示意图

ADMET预测评估平台

药物的ADMET性质(吸收、分布、代谢、清除和毒性),是药物研发管线的关键考量维度。GHDDI-AIDD团队通过汇总不同药物研发管线的成药性经验,针对共同且关键的ADMET性质收集了超55万条高质量实验数据,构建了49个深度学习预测模型,并通过ADMET预测评估平台免费对外开放。新药研发工作者只需上传化合物结构或列表,即可一键式全面预测ADMET性质,并进行系统预测和综合成药性评估。该平台更多模块持续开放中。

平台链接:http://aidd.ghddi.org/admet/1608515497624309.png

▲ ADMET成药性预测评估模型总汇

基于靶点结构的超高速虚拟平台

为有效减少基于物理模型的计算机辅助药物设计中“经典力学力场的理论误差”和“巨大算力消耗”等问题,GHDDI-AIDD自主研发的蛋白质靶点深度学习虚拟筛选模型,利用蛋白靶点3D结构数据和近200万靶点-小分子活性数据,直接使用图神经网络构造蛋白质活性位点和小分子的增广网络代替分子对接,在185个靶点的训练和回溯验证实验中得到平均AUC=0.945的结果,并且在计算效率工程方面有很大突破,为单GPU一天1400万化合物,相较物理分子对接节省近千倍算力。

平台链接:http://aidd.ghddi.org/sbvs/1608523545941029.png

▲ 基于靶点结构的超高速虚拟筛选平台建模方法示意图

自新冠疫情暴发以来,GHDDI始终致力于加速新冠药物研发。截至2020年12月,“Targeting COVID-19”平台已经迭代了600多个版本,除增加中文版功能之外,还随着新冠科研动向增加了每日自动更新的自主进化功能和模块,包括新冠小分子药物体外实验数据模块[1]、基于自然语言自动化算法的新冠临床试验数据汇总和挖掘模块[2]及文献推荐模块[3]。这些模块为科研人员获取新冠药研相关的小分子药物抗新冠活性动态、临床试验数据以及相关文献内容提供了便利。

秉承“科技向善(Tech for Social Good)”的原则和“为了全球更多人的健康”的夙愿,GHDDI积极推动医药结构化知识数据与人工智能算法在开源社区中的自主进化,促进人工智能技术良性发展并最大程度实现制药领域的知识开放与社群协作。未来GHDDI还将开放更多的资源,与创新药研发机构共同助力全球新药研发。

[1]https://ghddi-ailab.github.io/Targeting2019-nCoV/preclinical/

[2]https://ghddi-ailab.github.io/Targeting2019-nCoV/clinical/

[3]https://ghddi-ailab.github.io/Targeting2019-nCoV/research_progress/


使用反馈及交流合作,欢迎洽询:aidd@ghddi.org


致谢:

清华大学工业开发研究院:付小龙

阿里云:孙相征 何万青 李贝

浙江大学智云实验室:陈文智 张紫徽 郭晔 徐锋 张华 郑强 袁书宏 云霞

前端:王超