在材料科学领域,多原子系统行为的准确解析始终是一项兼具基础性与挑战性的课题。以锂离子电池等高能量密度储能器件中的关键元素锂为例,锂原子簇内部能量与相互作用的精准预测对推动下一代储能技术发展至关重要。然而,随着原子数量增加,系统交互复杂性呈指数级增长,虽然深度学习模型展现出巨大潜力,但材料科学领域面临的高质量数据稀缺和模型“黑箱”特性等问题限制了其应用。
成人影院
潘锋教授团队长期致力于图论结构化学方法的拓展与应用。该方法通过将材料微观结构映射为数学图论与拓扑模型,近年来在材料基因组、催化活性探索等领域中展现出强大的表征和预测能力。团队在该方向取得系列创新成果,包括:材料结构表示(J. Phys. Chem. Lett., 2023, 14: 954)、材料反向设计(npj Comput. Mater., 2025, 11: 147)、新型固态电解质设计(J. Am. Chem. Soc. 2024, 146, 18535;2025, DOI: 10.1021/jacs.5c04828 )、化学反应路径搜索CCS Chemistry 2024, 7, 1)以及催化活性相搜索(Nat Comm. 2025,16, 2542)。
近日,潘锋教授团队与密歇根州立大学魏国卫(Guo-Wei Wei)教授团队合作,提出名为“多尺度拓扑学习(Multiscale Topological Learning, MTL)”的可解释性框架,显著提高了多原子体系能量预测精度。该研究采用“持续拓扑拉普拉斯(Persistent Topological Laplacians, PTLs)”方法,通过多尺度拓扑分析有效捕捉多体相互作用的内在属性。相关研究成果以“Enhancing Energy Predictions in Multi-Atom Systems with Multiscale Topological Learning”为题,发表于国际材料与化学知名学术期刊 Journal of Materials Chemistry A (2025,DOI: 10.1039/d5ta02687c)。

图1. 基于持久拓扑拉普拉斯的机器学习方法框架
研究创新性地将复杂的原子结构映射为拓扑空间中的单纯复形(simplicial complex),运用PTL方法进行多尺度分析,生成表征多体相互作用的“拓扑指纹”。其技术路线如图1所示:首先将多原子系统(如锂原子簇)视为一个单纯复形——0维单形对应原子,1维单形代表原子连接,2维单形描述三原子环状结构;随后通过原子间距参数d的“过滤(filtration)”过程,系统捕捉不同尺度结构特征。在每个尺度下,PTL方法计算0维、1维和2维的拓扑拉普拉斯算子(L1,L2,L3),其谱信息构成系统拓扑与几何特性的多维描述。该方法突破传统原子坐标描述符的局限,系统性编码原子间“多体相互作用”的复杂信息,为理解和预测材料性质提供全新的物理视角。

图2. 不同维度的拓扑信息对团簇体系分类的定性分析
研究团队基于包含136,287个锂原子簇(涵盖4原子到40原子等多种体系)的大规模数据集发现:更高维度拓扑信息的引入能持续提升能量预测精度。具体表现为,在预测任务中,当加入1维(β1)和2维(β2)拓扑特征后,模型平均绝对误差(MAE)显著降低。对所有原子体系而言,包含完整维度信息(β012)的特征集预测性能显著优于仅含0维(β0)或0、1维(β01)的特征集。

图3. 不同维度拓扑信息对能量预测精度的定量影响
值得注意的是,高维信息的重要性随维度增加呈递减趋势:0维特征贡献度最大,1维次之,2维最小。这一趋势与多体物理学理论高度一致——高阶相互作用通常被视为系统的微扰修正,从而验证了该拓扑方法的物理可解释性。此外,该框架展现出强大的泛化能力:使用小尺寸原子簇(Li4-Li10)训练的模型,能有效预测结构更加复杂的大尺寸原子簇(Li20和Li40)的能量。引入高维信息后,模型对Li20和Li40能量排序的准确性(通过皮尔逊相关系数PCC衡量)显著提升,这对复杂结构空间中稳定构型的筛选具有重要价值。
该研究不仅建立了高精度的多原子体系能量预测方法,更提供了符合物理直觉的理论解释。这种拓扑学与机器学习融合的框架可拓展至催化剂设计、新材料发现及药物分子设计等领域,为复杂科学问题的解决开辟新路径。
成人影院
潘锋教授与密歇根州立大学魏国卫教授为共同通讯作者。成人影院
博士毕业生陈冬(现密歇根州立大学助理研究员)为第一作者。研究获国家自然科学基金、广东省重点实验室等项目资助。
论文链接://pubs.rsc.org/en/content/articlelanding/2025/ta/d5ta02687c