近年来,人工智能(AI)已广泛应用于材料科学,极大加速了新材料的发现过程。然而,现实中的材料系统具有多尺度复杂性——涵盖成分、加工、结构与性能等多个层面,且数据往往不完整,尤其是结构表征数据获取代价高昂,常常缺失。这种信息缺失成为多模态AI建模与泛化的最大障碍之一。
近日,浙江大学计剑教授和张鹏研究员团队在期刊《npj Computational Materials》上,发表了最新研究成果“一种融合多尺度知识的多模态学习框架用于材料设计”(A versatile multimodal learning framework bridging multiscale knowledge for material design)。研究者提出了一种多模态学习框架 MatMCL,该方法通过“结构引导的对比学习”策略,在模态不完整的情况下,也能进行高鲁棒性的性能预测,并实现跨模态生成与检索。
图1:MatMCL框架总体流程
研究团队基于静电纺纳米纤维材料,构建了包含加工条件、微纳结构与力学性能的多模态数据集。随后将微结构与加工条件映射到共享潜在空间,并通过对比学习机制,使模型能够识别加工-结构之间的潜在关联关系。
图2:力学性能预测
在结构缺失的情况下,MatMCL依然表现出强大的预测能力,且仍可以感知纤维的结构特征,其效果在多个力学性能指标上显著优于传统方法。
图3:跨模态检索
结果表明,模型可以有效地根据加工条件检索对应的结构,或根据结构检索对应的加工条件。总之,MatMCL 在揭示多模态材料数据中的复杂关联方面表现出了强大的能力,突显了其在推进材料理解和设计方面的潜力。
图4:结构生成
MatMCL 集成了基于扩散模型的条件生成模块,能够根据给定的加工条件可靠地生成高质量的微观结构,其生成效果在视觉上几乎无法与真实样本区分,展现出强大的跨模态理解与结构生成能力,为突破数据库限制、实现智能材料设计提供了新路径。
图5:纳米纤维增强的复合材料设计
研究团队进一步将该框架扩展到纳米纤维增强复合材料设计中,结合多阶段学习策略,在样本极少的条件下依然实现了高准确度预测。这种“少样本+模态缺失”双重挑战下的成功,显示出模型在现实材料设计中的极强适应性和通用性。
该研究为材料科学领域长期存在的多尺度、多模态与数据不完备难题提供了全新、通用的AI解决思路,展现出高度的灵活性与可扩展性。
论文链接:https://www.nature.com/articles/s41524-025-01767-3