腾讯量子实验室发起Alchemy竞赛,聚焦机器学习预测分子量子性质

huangliang00 2019-06-13

腾讯量子实验室公开自研的分子量子性质数据集,发起Tencent Alchemy 2019竞赛,关注算法的泛化性能,推动学术界与产业界聚焦化学中分子的量子性质问题,及其AI解决方案。

腾讯量子实验室公开自研的分子量子性质数据集,发起Tencent Alchemy 2019竞赛,关注算法的泛化性能,推动学术界与产业界聚焦化学中分子的量子性质问题,及其AI解决方案。希望该竞赛能激发各类型、各层次人才的创新活力,推动分子科学及应用的加速进展。

腾讯量子实验室希望吸引更多的年轻人加入量子计算和AI的研发的队伍中,帮助整体生态成长,使上中下游的合作伙伴一起把产业从无到有、从有到大发展起来。

竞赛官网:Alchemy Contest - Tencent Quantum Lab

竞赛任务

  1. 使用机器学习模型去预测分子的量子力学性质,具体性质如下图所示

腾讯量子实验室发起Alchemy竞赛,聚焦机器学习预测分子量子性质

这些量子力学性质对于预测分子的行为至关重要,比如HOMO,LUMO可以用来预测分子的化学反应结果。

具体说明:

关联数据库:

使用量子模拟的方法生成分子数据库已经在这个领域有所尝试,不过由于算力的限制,学术界已有的分子数据库集中在较小的分子。在本项目中,腾讯量子实验室使用3,000,000个CPU Hour 来生成Alchemy数据库。下表列出了Alchemy与传统数据库的对比

腾讯量子实验室发起Alchemy竞赛,聚焦机器学习预测分子量子性质

生成流程:

本次实验中,腾讯量子实验室使用PySCF来模拟分子的量子力学性质,分子的3维结果的确定的生成流程由三步组成,分别是OpenBabel, HF/STO-3G和DFT,下图即是分子 CC(O)C(C)C(=O)NC=O 的一个模拟实例

腾讯量子实验室发起Alchemy竞赛,聚焦机器学习预测分子量子性质

在确定完分子的3维结果以后,腾讯量子实验室可以通过积分的手段计算出分子的量子力学性质,其中OpenBabel的时间消耗较少,下图列出了Alchemy数据库生成过程中,不同阶段的时间消耗。平均一个分子的模拟需时25小时。

腾讯量子实验室发起Alchemy竞赛,聚焦机器学习预测分子量子性质

相关推荐