如左上方所示,用于训练神经网络的迭代,多步骤过程导致对两个竞争质量之间的权衡进行评估,如中图所示。蓝线代表所谓的帕累托锋线,定义了无法进一步改善材料选择的情况。这样就可以确定有希望的新材料的特定类别,例如右侧分子图所示的类别。
通过搜索数百万种可能性,对电池材料的搜索在5周而不是50年的时间内交付了结果。
在搜索特定用途的可能新材料的理论清单时,例如电池或其他与能源相关的设备,通常会考虑数以百万计的潜在材料,并且需要同时满足和优化多个标准。现在,麻省理工学院的研究人员找到了一种使用机器学习系统显着简化发现过程的方法。
作为演示,该小组从将近300万名候选人中选出了八种最有前途的材料,用于一种称为液流电池的储能系统。他们说,采用传统的分析方法,该剔除过程将花费50年,但他们在五周内就完成了。
麻省理工学院化学工程教授希瑟·库里克(Heather Kulik),乔恩·保罗·珍妮特(Jon Paul Janet)博士19岁,萨哈斯拉吉特·拉梅什(Sahasrajit Ramesh)和研究生Chenru Duan的论文在ACS中央科学杂志上发表了这些发现。
该研究研究了一组称为过渡金属配合物的材料。它们可以以多种不同的形式存在,Kulik说,“它们是真正令人着迷的功能性材料,与许多其他材料相不同。理解它们为什么会如此工作的唯一方法是使用量子力学对其进行研究。”
要预测这些材料中数百万种材料的特性,将需要耗时且资源密集的光谱学和其他实验室工作,或者需要对每种可能的候选材料或材料组合进行耗时且高度复杂的基于物理的计算机建模。每个此类研究可能要花费数小时到数天的时间。
相反,库里克(Kulik)和她的团队采用了少量不同的可能材料,并使用它们来教授高级的机器学习神经网络,以了解材料的化学成分与其物理性质之间的关系。然后将这些知识应用于为下一代可能的材料提供建议,以用于下一轮神经网络的训练。通过此过程的四个连续迭代,神经网络每次都得到显着改善,直到达到一个明显的点,即进一步的迭代不会产生任何进一步的改善。
该迭代优化系统极大地简化了获得满足所寻求的两个冲突标准的潜在解决方案的过程。这种在一种因素趋于恶化的情况下寻找最佳解决方案的过程称为Pareto前沿,表示点的图,这样一个因素的任何进一步改善都会使另一种恶化。换句话说,根据分配给每个因素的相对重要性,该图表示可能的最佳折衷点。
训练典型的神经网络需要非常大的数据集,从数千个到数百万个示例不等,但是Kulik和她的团队能够使用基于Pareto前沿模型的迭代过程来简化该过程并仅使用少数几个就可以提供可靠的结果一百个样本。
在筛选液流电池材料的情况下,所需的特性会发生冲突,通常是这样的情况:最佳材料将具有高溶解度和高能量密度(在给定重量下存储能量的能力)。但是增加溶解度往往会降低能量密度,反之亦然。
神经网络不仅能够迅速提出有希望的候选者,而且还能够通过每次迭代将置信度分配给其不同的预测,这有助于在每个步骤中优化样本选择。“我们开发了一种比同类最佳的不确定性量化技术更好的方法,以便真正知道这些模型何时会失效,” Kulik说。
他们为概念验证试验选择的挑战是用于氧化还原液流电池的材料,这种类型的电池为大型网格规模的电池带来了希望,这些电池可以在实现清洁可再生能源方面发挥重要作用。库里克说,过渡金属配合物是这类电池的首选材料类别,但是用常规方法评估的可能性却太多了。他们首先列出了300万个此类复合物,然后最终将其缩减为8个良好的候选物,以及一系列设计规则,这些规则应使实验者能够探索这些候选物及其变体的潜力。
她说:“通过这个过程,神经网络不仅对[设计]空间变得越来越聪明,而且越来越悲观,认为除我们已经描述的特征之外的任何事物都可以进一步改善我们已经掌握的知识,”她说。
她说,除了建议使用该系统进行进一步研究的特定过渡金属配合物外,该方法本身可能具有更广泛的应用。“我们确实将其视为可以应用于任何材料设计挑战的框架,而在这些挑战中,您实际上是在尝试同时解决多个目标。您知道,所有最有趣的材料设计挑战都是您要改进的一件事,而改进却使另一问题恶化。对于我们来说,氧化还原液流电池氧化还原对只是我们认为可以通过机器学习和加速材料发现而去的一个很好的证明。”
库利克说,例如,针对各种化学和工业过程优化催化剂是另一种此类复杂材料的研究。当前使用的催化剂通常涉及稀有和昂贵的元素,因此基于丰富和廉价的材料寻找相似有效的化合物可能是一个显着的优势。
她说:“我认为,该论文代表了化学科学中多维定向改进的首次应用。”但是这项工作的长期意义在于方法论本身,因为否则这些事情根本不可能实现。“您开始意识到,即使使用并行计算,在这些情况下,我们也不会以其他任何方式提出设计原则。这些线索来自我们的工作,这些线索不一定是文献中已经知道的所有想法,也不一定是专家可以为您指出的想法。”
西北大学化学与化学和生物工程学教授乔治·沙茨(George Schatz)说:“这是统计学,应用数学和物理科学中概念的完美结合,将在工程应用中非常有用。”与这项工作有关。他说,这项研究解决了“有多个目标时如何进行机器学习。Kulik的方法使用最先进的方法来训练人工神经网络,该人工神经网络用于预测过渡金属离子和有机配体的哪种组合最适合氧化还原液流电池电解质。”
Schatz说:“这种方法可以在许多不同的情况下使用,因此它有可能改变机器学习,这是世界范围内的一项主要活动。”
参考:Jon Paul Janet,Sahasrajit Ramesh,Chenru Duan和Heather J.Kulik撰写的“具有神经网络驱动的高效全局优化的数百万种过渡金属配合物的空间中的精确多目标设计”,ACS中央科学,2020年11月。
10.1021 / acscentsci.0c00026
这项工作得到了海军研究办公室,国防高级研究计划局(DARPA),美国能源部,Burroughs Wellcome基金和AAAS Marion Milligan Mason奖的支持。