AI驱动量子精修,卡内基梅隆大学等提出AQuaRef,首次用量子力学约束精修蛋白质全原子模型
卡内基梅隆大学、波兰弗罗茨瓦夫大学、佛罗里达大学等高校的联合研究团队提出了一种人工智能驱动的量子精修方法 AQuaRef。该方法基于 AIMNet2 机器学习原子势函数,并针对精修任务进行了定制训练,在接近经典力场计算效率的同时,能够较好地逼近量子力学计算结果,为生物大分子的全原子量子精修提供了新的技术路径。
要理解生命过程的分子机制,首先需要看清生物大分子的三维结构。解析原子级结构是结构生物学的核心任务,也是理解蛋白质功能、揭示遗传调控机制以及开展靶向药物研发的重要基础。无论是蛋白质催化反应、核酸传递遗传信息,还是抗体识别抗原,这些关键生物学过程都依赖精确的结构模型加以解释。
目前,冷冻电镜和 X 射线晶体学是解析生物大分子结构的主要实验技术,已经积累了大量高分辨率结构数据。近年来,以 AlphaFold 和 RoseTTAFold 为代表的计算预测方法也取得显著进展,为结构建模提供了高效工具。但在发现未知结构类型、解析复杂相互作用等方面,实验解析仍然具有不可替代的地位。在实验结构解析流程中,原子模型精修是接近最终阶段的关键步骤,其目标是构建一个既符合立体化学规律、又尽可能拟合实验数据的分子模型。当前主流精修软件,如 CCP4 和 Phenix,主要依赖标准数据库中的立体化学约束,以维持合理的键长、键角并减少原子间冲突。
然而,这类约束体系仍存在明显局限,主要针对共价结构,对氢键、π-堆积等重要的非共价相互作用缺乏系统描述,在低分辨率条件下可能导致模型偏离真实化学状态;当结构中出现新型配体或特殊连接时,还需要手动定义参数才能完成精修。此外,由局部化学环境引起的合理几何偏差,也可能被约束体系误判为异常并被强行修正。理论上,量子力学方法能够更准确地描述分子间相互作用,但生物大分子通常包含数千甚至上万原子,全量子计算成本极高,因此现有研究大多局限于配体结合位点等局部区域。
为解决这一问题,卡内基梅隆大学、波兰弗罗茨瓦夫大学、佛罗里达大学等高校的联合研究团队,提出了一种人工智能驱动的量子精修方法 AQuaRef。该方法基于 AIMNet2 机器学习原子势函数,并针对精修任务进行了定制训练,在接近经典力场计算效率的同时,能够较好地逼近量子力学计算结果,为生物大分子的全原子量子精修提供了新的技术路径。
相关研究成果以「AQuaRef: machine learning accelerated quantum refinement of protein structures」为题,已发表于 Nature Communications。
研究亮点:
* AQuaRef 基于 AIMNet2 机器学习势函数,首次实现全蛋白质原子模型的量子精修
* 在 61 个低分辨率X射线和冷冻电镜模型的测试中,AQuaRef 在 57 个模型中表现更优
* 在 DJ-1 和 YajL 蛋白的短氢键案例中,AQuaRef 无需人工干预即可确定与实验证据一致的质子位置
论文地址:https://www.nature.com/articles/s41467-025-64313-1
面向多肽机器学习势函数训练的 100 万样本数据集
该研究旨在为多肽体系构建机器学习势函数的参数化模型,因此在数据集设计上需要系统覆盖化学组成、构象空间以及分子间相互作用三个维度。
在化学维度上,研究人员以 SMILES 字符串形式构建小肽数据库,涵盖 20 种标准氨基酸、11 种质子化状态、3 种 N 端修饰和 4 种 C 端修饰。在此基础上枚举所有单肽和二肽,并随机选取部分三肽和四肽,同时额外生成含二硫键连接的多肽及其硒代类似物。为充分覆盖构象空间,研究人员利用 OpenEye Omega 软件进行密集的扭转角采样,并未对手性中心施加限制,从而使模型能够适用于 D 型、L 型以及混合立体化学的多肽体系。
同时还构建了由 2-4 个肽段组成的复合物,并随机调整其空间取向,以模拟分子间相互作用。整个数据生成过程未参考天然序列或实验结构,以避免潜在的数据泄露。为控制计算规模,所有肽段及其复合物的原子总数(含氢)均限制在 120 以内。
在获得初始构象后,研究人员首先使用 GFN-FF 力场开展分子动力学模拟,以采样非平衡结构,并通过笛卡尔坐标约束保持整体构型接近初始输入,同时释放扭转角和分子间自由度。
随后引入 query-by-committee 的主动学习策略:首先随机选取 50 万初始样本训练 4 个模型组成的集成体系;随后进行四轮迭代,每一轮根据模型对能量和原子力预测的不确定性筛选样本,并对这些高不确定性结构进行 DFT 计算后加入训练集。最后一轮进一步引入不确定性引导优化,优先选择预测不确定性较高但能量较低的边界结构。通过这一流程,最终获得约 100 万条样本构成的训练集,平均原子数约为 42。
除理论生成的数据外,研究人员还从 RCSB 和 EMDB 数据库中筛选实验结构用于模型验证。筛选标准包括:仅包含蛋白质的单构象模型、非氢原子数在 1000–10000 之间、分辨率 2.5–4 Å、MolProbity 冲突评分小于 50,以及键长和键角偏差不超过标准值的 4 倍。
AQuaRef:向大分子体系的 AI 驱动量子精修方法
AQuaRef 首先对输入的原子模型进行完整性检查。对于结构中缺失的原子,程序会尝试自动补充。但这一过程有时会引入新的空间位阻冲突,尤其是在原模型未包含氢原子的情况下。如果缺失的是主链原子等关键结构,模型将无法继续进行量子精修;若检测到明显的空间冲突或严重几何异常,则会先通过标准立体化学约束进行快速几何正则化,在尽量小幅调整原子位置的前提下消除问题。
对于晶体学数据,精修还需要考虑晶胞对称性及周期性相互作用。具体而言,程序会根据空间群对称算子将模型扩展为超胞,并进行截断,只保留与主拷贝原子距离在设定范围内的对称拷贝。这一处理在冷冻电镜结构中通常不需要。
完成原子补充和模型扩展后,体系进入 Q|R 软件包的标准精修流程。AQuaRef 的核心架构与基础 AIMNet2 模型基本一致,但针对结构精修任务做了几项关键调整。
首先,模型未显式计算长程库仑和色散相互作用,而是直接训练以复现 DFT-D4 总能量。这是因为在 CPCM 隐式溶剂模型下,库仑相互作用难以通过部分原子电荷准确估计,同时长程相互作用已被可极化连续介质显著屏蔽;此外,超过 5 Å 截断半径的长程色散项对精修过程中关键的原子力贡献极小,因此可以忽略而不影响精度。
其次,模型引入了 GFN1-XTB 中的显式短程指数排斥项,从而在处理存在空间位阻冲突的结构时表现出更好的稳定性。模型训练以 B97M-D4/def2-QZVP 方法计算得到的能量、原子力以及赫希菲尔德部分原子电荷为目标。从随机权重初始化开始训练,批次大小为 256,总训练步数为 150 万步,其余超参数均沿用原始 AIMNet2 的设置。
在计算效率方面,如下图所示,AIMNet2 框架中能量和原子力的计算时间以及 GPU 峰值显存占用均与体系原子数呈线性(O(N))增长。对于包含约 10 万个原子的蛋白质体系,单点能量和力计算仅需约 0.5 秒;在单块配备 80GB 显存的 NVIDIA H100 GPU 上,最多可处理约 18 万个原子的模型。
AQuaRef 中 AIMNet2 机器学习原子间势函数的计算缩放规律
41 个冷冻电镜与 20 个 X 射线模型验证,AQuaRef 局部结构优化达 2 Å
为评估 AQuaRef 的性能,研究人员构建了包含 41 个冷冻电镜模型、20 个低分辨率和 10 个超高分辨率 X 射线模型的测试集。其中 61 个低分辨率模型均配有对应的高分辨率同源参考结构。精修过程中设置了三种约束条件进行对比:AIMNet2 量子约束(即 AQuaRef)、标准几何约束,以及在标准约束基础上额外加入氢键和二级结构等限制条件。
结果如下图所示,量子精修后的低分辨率模型在 MolProbity score 和 Ramachandran plot Z-score 等几何指标上均明显优于传统约束方法。同时,模型与实验数据的拟合程度基本保持一致。对于 X 射线结构,过拟合程度略有降低(Rwork 与 Rfree 的差值更小);对于冷冻电镜结构,CCmask 略有下降而 EMRinger 评分基本不变。结合几何质量的整体提升,这一结果提示模型过拟合可能有所减少。
虽然在标准约束中加入额外几何限制也能改善模型质量,但 AQuaRef 仍能得到更合理的几何结构,并与高分辨率参考模型更加接近。在部分案例中,标准约束与量子精修所得结构的局部差异可达 2 Å。
41 个冷冻电子显微镜模型和 20 个X射线模型的优化结果
研究还将 AQuaRef 与多种主流精修方法进行了比较。结果如下图所示,针对 X 射线数据选择 AMBER、Rosetta 和 REFMAC5,对冷冻电镜数据则使用 Servalcat。总体来看,AQuaRef 的 Rfree 略优,且过拟合程度最低。与 Servalcat 相比,两者的 EMRinger 评分相当,但 Servalcat 的 CCmask 略高。
在几何质量方面,AQuaRef 与 Rosetta 表现接近,明显优于 REFMAC5 和 Servalcat;Rosetta 与参考模型的整体契合度略高,这可能与其非梯度优化策略带来的更大收敛半径有关。此外,AQuaRef 与 Rosetta 均能生成合理的氢键几何结构,AMBER 次之,而 REFMAC5 和 Servalcat 基本无法准确恢复这些细节。
AQuaRef、Servalcat(SE)、REFMAC5(RE)、AMBER(AM)和 Rosetta 对 61 个低分辨率模型的优化结果
在短氢键体系的测试中,研究人员以帕金森病相关蛋白 DJ-1 及其同源蛋白 YajL 为例,检验 AQuaRef 对质子化状态的处理能力。传统精修方法受数据库立体化学约束影响,往往会使键长偏离真实值。以对称双质子化结构作为初始模型进行 AQuaRef 精修时,所得质子位置和键几何与无约束精修结果一致;而加入传统约束后,键长则被拉向数据库中的非质子化标准值。当实验数据被截断至 2 Å 分辨率、原子细节明显减少时,AQuaRef 仍能恢复与原始 1.15 Å 数据几乎一致的结构,而传统约束精修则进一步偏离真实构型。AQuaRef 将质子定位于 DJ-1 中 D24 残基的 Oδ2 原子,这一结果同时得到能量计算和差值电子密度图的支持。
野生型 DJ-1 中的键距分析
在 YajL 蛋白中,两处 E14/D23 短氢键的 AQuaRef 精修结果同样与无约束精修一致,表明质子由 D23 与 E14 共同共享,呈现典型的低势垒氢键特征。这一情况与 DJ-1 中质子主要定位于单个氧原子的情形不同。AIMNet2 给出的能量分布呈现较为平坦的势能面,意味着质子位置可以在实验数据的约束下自由调整。同时,差值电子密度图在氢原子附近均出现显著高于 3σ 的峰值,为这一结构解释提供了进一步证据。
氢键沿线的能量分布图
蛋白质量子精修领域的产学研突破
在蛋白质量子精修、机器学习势函数构建以及原子模型优化这一前沿领域,多支研究团队围绕这一方向持续探索,并取得了一系列进展。例如,牛津大学团队开发的神经网络方法 nn-tm fcc,能够以接近全量子力学精度构建高精度残基片段势能面模型,其能量和原子力的均方根误差分别控制在 1.0 kcal/mol 和 1.3 kcal/(mol·Å) 以内。借助该方法,完成 15 种代表性蛋白质的能量与原子力计算仅需 10 至 100 秒,相比传统量子力学计算提速上千倍。
论文题目:Improved protein structure prediction using potentials from deep learning论文链接:https://www.nature.com/articles/s41586-019-1923-7
另一支德国合作团队则提出 BF-DCQO 量子算法,通过非变分迭代策略并结合 IonQ 离子阱量子计算系统,将包含 12 个氨基酸的三维折叠问题计算时间从传统 GPU 集群的 72 小时压缩至约 4.3 分钟,速度提升同样达到千倍量级。
论文题目:Bias-field digitized counterdiabatic quantum algorithm for higher-order binary optimization
论文链接:https://www.nature.com/articles/s42005-025-02270-3
总体来看,量子力学方法、机器学习势函数与实验结构数据的结合,正在为生物大分子结构精修提供一种新的技术路径,有望在低分辨率结构建模、配体结合模式分析以及功能位点研究等场景中发挥更稳定的作用。
本文来自微信公众号“HyperAI超神经”,作者:田小幺,36氪经授权发布。















