新型人工智能系统可辅助材料制造

科学家们希望使用一种新的人工智能系统,该系统可以浏览研究论文以推断出生产特定材料的“配方”,科学家希望缩小材料与科学之间的自动化差距。

近年来,诸如“材料基因组计划”和“材料项目”之类的研究工作已经产生了许多计算工具,这些工具可用于设计适用于从能源和电子到航空,土木工程等一系列应用的新材料。

但是生产这些材料的开发过程仍然取决于经验,直觉和人工文献综述的结合。

麻省理工学院,马萨诸塞州大学阿默斯特分校和加州大学伯克利分校的科学家团队希望通过新的人工智能系统来弥补材料科学自动化的空白,该系统将通过研究论文得出结论以推断出“配方”。生产特殊材料。

麻省理工学院材料科学与工程系(DMSE)大西洋里奇菲尔德能源研究助理教授Elsa Olivetti说:“计算材料科学家在“制造什么”上做出了很大的进步,该设计是基于所需特性来设计的。 )。“但是由于获得了成功,瓶颈已经转移到‘好吧,现在我要如何做到?’”

科学家们设想了一个数据库,其中包含从数百万篇论文中提取的材料配方。科学家和工程师可以输入目标材料的名称以及任何其他标准(前体材料,反应条件,制造工艺),并提出建议的配方。

为了实现这一愿景,Olivetti和她的同事开发了一种机器学习系统,可以分析研究论文,推断出其中哪些段落包含材料配方,并根据其在配方中的作用对这些段落中的单词进行分类:目标材料的名称,数量,设备的名称,操作条件,描述性形容词等。

在最新一期的《材料化学》杂志上发表的一篇论文中,他们还证明了机器学习系统可以分析提取的数据以推断出材料类别的一般特征,例如其合成所需的不同温度范围,或者个体材料的特殊特征-例如制造条件变化时它们将采取的不同物理形式。

Olivetti是该论文的资深作者,麻省理工学院DMSE研究生爱德华·金(Edward Kim)也加入了她的行列; DMSE博士后Kevin Huang; UMass Amherst的计算机科学家Adam Saunders和Andrew McCallum;以及伯克利大学材料科学与工程系的总理教授Gerbrand Ceder。

填补空白

科学家们结合了有监督的和无监督的机器学习技术来训练他们的系统。“监督”是指首先馈入系统的培训数据是由人类注释的;系统尝试查找原始数据和注释之间的相关性。“无监督”表示训练数据是无注释的,而是系统根据结构相似性学习将数据聚类在一起。

由于材料配方提取是一个新的研究领域,因此Olivetti和她的同事们没有那么多研究人员多年积累的大型注释数据集。相反,他们必须自己注释数据-最终大约需要100篇论文。

根据机器学习标准,这是一个非常小的数据集。为了改进它,他们使用了Google开发的称为Word2vec的算法。Word2vec研究单词出现的上下文(单词在句子中的句法作用以及它们周围的其他单词),并将趋于具有相似上下文的单词组合在一起。因此,例如,如果一篇论文包含“我们将四氯化钛加热到500 C”的句子,而另一篇论文包含“将氢氧化钠加热到500 C”的句子,Word2vec将把“四氯化钛”和“氢氧化钠”分组。一起。

借助Word2vec,研究人员能够极大地扩展他们的培训范围,因为机器学习系统可以推断出,附加在任何给定单词上的标签很可能会应用于与之聚类的其他单词。因此,研究人员无需再发表100篇论文,而是可以在大约640,000篇论文上训练他们的系统。

冰山一角

但是,要测试系统的准确性,他们必须依靠标记的数据,因为他们没有评估其在未标记的数据上的性能的标准。在这些测试中,系统能够以99%的准确度识别包含食谱的段落,并以86%的准确度标记这些段落中的单词。

科学家们希望进一步的工作可以提高系统的准确性,并且他们在进行中的工作是探索一系列深度学习技术,这些技术可以对材料配方的结构进行进一步的概括,其目的是自动设计未在材料配方中考虑的材料的配方。现有文献。

Olivetti之前的许多研究都集中在寻找更具成本效益和对环境负责的方式来生产有用的材料,她希望该材料配方数据库能够助长该项目。

“这是具有里程碑意义的工作,”加州大学圣塔芭芭拉分校材料科学系Fred和Linda R.Wudl教授Ram Seshadri说。“作者已经接受了艰巨而艰巨的挑战,即通过AI方法获取用于准备新材料的策略。这项工作证明了机器学习的力量,但是准确地说,最终的成功或失败判断将需要说服从业者,这些方法的实用性可以使他们放弃本能的方法。”

这项研究得到了美国国家科学基金会,海军研究办公室,能源部的支持,并通过MIT能源计划提供了种子支持。Kim得到了加拿大自然科学与工程研究委员会的部分支持。

出版物:爱德华·金(Edward Kim)等。“通过文本提取和机器学习从科学文献中获得的材料综合见解”,化学。物质。,2017年,DOI:10.1021 / acs.chemmater.7b03500

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。