近年来,人工智能驱动材料发现已成为国际材料科学的重要发展方向,而如何实现材料结构的高效表征与可解释学习,则是其中最核心的科学问题之一。成人影院
潘锋教授团队长期致力于图论结构化学、代数拓扑与人工智能材料设计研究,围绕材料结构数学表征与智能发现建立了一系列原创方法体系。团队先后发展了基于代数图论与自监督学习的分子表征框架,实现小样本条件下有机分子性质的高精度预测(Nat. Commun. 2021, 12, 3521);建立了基于有向图与路径同调的结构化学理论,实现对构型异构体、手性分子、高熵合金催化剂等复杂体系的数学表征(J. Phys. Chem. Lett. 2023, 14, 954);提出多尺度拓扑学习(Multiscale Topological Learning, MTL)框架,成功发现多种潜在高性能锂快离子导体材料(J. Am. Chem. Soc. 2025147, 20888);进一步发展持续GLMY同调(Persistent GLMY Homology)与生成模型相结合的催化材料逆向设计方法,实现高性能催化活性位点的智能生成与预测(npj Comput. Mater. 2025, 11, 147),以及基于这些基础研究编著了《人工智能材料学-AI4M》。上述研究逐步构建起“图论结构化学—拓扑学习—人工智能材料设计”的完整研究体系,为拓扑学方法在材料科学中的应用奠定了重要基础。
在此基础上,潘锋教授团队联合清华大学丘成桐先生(华人首位菲尔兹奖获得者,Fields Medal,1982)、厦门大学李剑锋教授团队,基于团队的30多篇研究和总结论文对拓扑数据分析(Topological Data Analysis,TDA)在材料科学中的理论基础、机器学习融合方法及应用进展进行了系统总结,以“Topological Data Analysis in Materials Science: Principles, Machine Learning Integration, and Application Landscapes”为题,被国际顶级综述期刊《Chemical Reviews》正式接收(//doi.org/10.1021/acs.chemrev.5c01098)。《Chemical Reviews》是美国化学会(ACS)旗舰综述期刊,也是国际化学领域最具影响力的学术期刊之一。该期刊发表的综述文章通常代表国际学术界对一个研究方向重要性、成熟度及未来发展潜力的高度认可,被广泛视为引领学科发展的风向标。
从拓扑学视角重新理解材料结构
材料结构天然具有多尺度、复杂网络化特征。从原子排列、缺陷分布到离子迁移通道、催化反应网络,大量决定材料性能的关键信息往往隐藏在结构的高阶拓扑特征之中。传统结构描述符主要关注局域化学环境,难以系统刻画材料整体结构中的连通性、孔洞以及空间组织规律。研究团队系统梳理了持续同调(Persistent Homology)、持续GLMY同调(Persistent GLMY Homology)以及欧拉特征曲线(Euler Characteristic Curve)等代表性拓扑分析方法。其中,丘成桐教授团队提出的GLMY理论为复杂材料结构提供了新的数学描述工具,相较于传统持续同调主要刻画无向拓扑结构,GLMY理论能够进一步处理方向性、层次性和复杂关联关系,为研究具有传输、扩散和反应过程特征的材料体系提供了新的数学框架。通过构建拓扑不变量,复杂材料结构能够被转化为可计算、可比较且具有物理意义的数学表征,为揭示材料结构—性能关系提供了新的研究思路。

图1. 持续GLMY同调分析流程:(a)有向图滤波;(b)持续条形码;(c)持续图。
“拓扑学习”:人工智能材料研究的新兴方向
近年来,图神经网络、深度学习等人工智能方法在材料性质预测和材料设计领域取得了显著进展,但现有方法仍面临数据需求量大、模型可解释性不足以及复杂结构信息利用不充分等挑战。拓扑学习的提出,为解决上述问题提供了新的研究思路。其核心思想是在保持材料结构整体拓扑特征的基础上,将连通性、环结构、空腔以及高维关联关系等信息编码为可学习的数学对象,并进一步与机器学习模型进行融合。与传统依赖局域原子环境或经验描述符的方法相比,拓扑学习更加关注材料结构中的全局组织规律,能够有效捕捉跨尺度结构特征与物理性质之间的深层联系。在此基础上,研究团队进一步将拓扑学与机器学习深度融合,系统提出并总结了“拓扑学习(Topological Learning)”这一新兴研究范式。研究团队在综述中总结了拓扑学习的三种典型实现模式,包括基于拓扑不变量的显式特征构建、面向模型训练过程的拓扑正则化策略,以及直接嵌入拓扑信息的拓扑感知神经网络架构。这些方法不仅拓展了材料结构表征的理论边界,也为构建兼具高精度预测能力与物理可解释性的人工智能模型提供了新的技术路径。

图2. 拓扑学习(Topological Learning)的三种典型范式:(a)显式拓扑表征;(b)隐式拓扑正则化;(c)拓扑感知神经网络架构。
构建“TDA+AI+材料科学”新材料知识图谱
在应用层面,综述系统总结了拓扑数据分析在非晶材料、玻璃材料、多孔晶体材料、多相催化以及超离子导体等重要新材料体系中的研究进展,并进一步拓展至分子科学和生物化学领域。不同于以往针对单一材料体系或特定问题的研究,该综述首次从整体视角系统梳理了TDA在材料科学中的应用版图,构建了覆盖结构表征、性质预测、机理解析、材料发现与智能设计等关键环节的应用图谱与知识框架。在基础研究方面,综述总结了TDA在晶体材料缺陷分析、分子构象分类以及复杂结构识别等领域的成熟应用;在前沿研究方向上,重点介绍了TDA在非晶与玻璃材料中程有序结构(MRO)解析、多孔材料孔隙网络表征、电池材料离子扩散通道分析以及催化体系活性位点识别等方面取得的重要进展。相关研究表明,拓扑特征能够有效揭示传统结构描述方法难以捕捉的高阶结构信息,为理解复杂材料体系中的“结构—性能”关系提供了新的理论工具。
通过大量代表性案例分析,研究团队指出,TDA不仅能够有效提取材料结构中的关键拓扑特征,还能够与机器学习模型形成协同作用,为材料发现、性能预测和逆向设计提供新的解决方案。综述进一步总结了TDA在材料信息学中的独特优势,包括良好的鲁棒性、优异的可解释性以及跨尺度结构表征能力。同时,研究团队从数学与材料科学交叉融合的视角,系统分析了当前领域面临的关键挑战,包括大规模原子模拟条件下拓扑计算效率的提升、拓扑特征与宏观性能之间关联机制的解释,以及跨尺度拓扑信息的有效传递与融合等问题。针对上述挑战,综述提出未来应进一步加强拓扑理论与人工智能、生成模型以及多尺度模拟方法的深度融合,推动拓扑数据分析从结构分析工具向材料发现与设计的理论框架演进,为下一代智能材料研发提供更加坚实的数学基础与计算支撑。该综述系统构建了“TDA+AI+材料科学”的理论框架与应用图谱,为未来数据驱动材料研究提供了重要参考,也标志着拓扑数据分析与人工智能驱动材料研究正在发展成为材料科学与材料信息学领域的重要前沿方向。此次成果发表于《Chemical Reviews》,不仅是对相关研究工作的高度认可,也体现了我国学者在拓扑数据分析与人工智能材料设计交叉领域的持续创新能力与国际学术影响力。
成人影院
五.四奖章获得者郑世胜(潘锋团队博士毕业生、现厦门大学助理教授)、成人影院
深圳研究生院王炳胥为论文共同第一作者。潘锋教授、丘成桐先生、李剑锋教授、吴杰教授和赵英汝教授为论文通讯作者。本研究得到国家自然科学基金、广东省重点实验室、深圳重点实验室等项目资助。