关键词:
助熔剂法
晶体生长
机器学习
摘要:
高质量单晶的生长对凝聚态物理的研究具有重要意义。单晶是广泛的科学研究领域的重要先决条件,如凝聚态物理,表面科学,激光和非线性光学。量子霍尔效应/分数量子霍尔效应,Wyle semi-metal等基础研究都依赖于高品质单晶。对单晶的合适生长条件的探索是昂贵且耗时的,特别是对于三元化合物,因为缺乏三元相图。助熔剂生长晶体的方法是晶体生长的一种非常重要的生长方法,对晶体性质的研究有着重要的意义。理论上只要能找到某种适合的的助熔剂或助熔剂组合,就能够用助熔剂法把这种单晶生长出来,而且成功的生长条件有可重复性。利用助熔剂法生长单晶,助熔剂的选择还有生长条件的确定非常重要。本文使用实验室助熔剂生长单晶的实验数据,利用机器学习的方法寻找晶体生长的条件。具体研究如下我们从两个不同的实验室采集了助熔剂法生长单晶的历史数据,分别标记为Group I,Group II。Group I的数据比较充足,生长的样品基本涉及了元素周期表示的所有元素,我们的研究主要针对于Group I,Group II作为讨论机器学习在这个问题研究上的一致性。根据助熔剂法生长单晶的的经验,挑选了对晶体生长可能有影响的生长条件,助熔剂和溶质的物理化学性质。生长条件包括最高温,离心温度,温度差,降温速率,高温停留时间,助熔剂种类,原料单质种类,原料含量。助熔剂和溶质的物理化学性质包括熔点,蒸汽压,原子序数,相对原子质量,电负性,密度,相图。将这些属性作为机器学习训练的特征,将生长结果作为标签,利用决策树,随机森林,支持向量机(SVM),梯度提升决策树(GDBT)四种机器学习算法,寻找最优模型。SVM的效果最好其在测试集的准确81%,f1分数为81%,成功样品的查准率为67%,对比实验数据的准确率30%,通过机器学习训练的模型选择成功生长的条件较人为选择成功生长的条件成功率提高了一倍。模型的阈值可以改变其成功样品的查准率,我们可以根据实际应用的不同需求,调整模型参数,使其符合我们我们的应用需求,模型的性能随着训练数据量增大而增强。助熔剂法生长单晶的机器学习模型可以应用到实验室,帮助实验室更好地生长单晶,本文介绍了将这个模型运用到实验室的方法。方法一是模型独立生长,遍历生长某个晶体的所有可能的特征组合,然后利用训练出来的模型去对这些组合进行拟合,拟合可以得到这些条件生长成功的概率,可以选定一个阈值,把概率在阈值以上的条件按照概率高低优先生长。方法二是模型协助人为经验生长,实验者按照自己的经验挑选条件,模型再判断条件的可生长性。决策树模型具有很好的解析性。通过决策树模型我们发现助熔剂的电负性是描述其作用的一个很重要的物理属性,对生长晶体的其他条件的选择有关键意义。我们从决策树中总结出了一些规则,它们分为两种类型。其中一些人已经很清楚理解了一个明确的理论,但由于有很多因素需要结合,很容易被忽略但是被机器学习(ML)重新发现。而另一个没有明确的理论。前者包括:(a)当冷却速度较低时,需要考虑的因素较少。否则,还有更多因素需要考虑。更好的单晶生长与(a)较低的冷却速率和(b)较低的熔点B较低的熔点更有可能成功相关。ML还发现了一些没有明确解释理论的规则:(a)单晶Ax By Cz的生长,x/z和y/z值都比较大的单晶体生长比较困难。(b)当助熔剂和单晶组分之间的平均液相密度差异很大时,很容易失败。(c)建议选择与单晶组分的平均电负性差别不大的助熔剂。此外,建议选择与A,B和C绝对电负性差最大值较小的助熔剂。