关键词:
量子-电磁计算方法
太赫兹超材料
第一性原理计算
材料建模
不连续伽辽金时域方法
GPU计算
并行计算
稳定性分析
摘要:
随着太赫兹技术与电磁超材料的快速发展,结合物态可调控材料与金属人工微结构的太赫兹超材料成为了研究热点,为太赫兹波的自由调控提供了切实可行的科学道路。近年来太赫兹波产生与探测仪器的发展给很多材料与器件带来了新的实验见解,但相关的理论研究依然缓慢。一方面,很多物态材料在外部激励下的太赫兹响应仍是凝聚态物理领域尚未明晰的问题。另一方面,结合物态材料的太赫兹超材料阵列器件是大规模多尺度的复杂结构,如何快速准确地对其建模对传统的电磁计算方法提出了挑战。除了太赫兹超材料,国防与工业界电磁设备的规模与复杂度日益提升,对电磁算法的精度与效率都提出了更高的要求。
针对以上科学问题,本论文基于新兴的不连续伽辽金时域(DGTD)电磁算法,提出了低内存方案与GPU并行加速技术,以及时间步预估方法与MPI+MPI CPU并行算法,对于大规模多尺度电磁问题实现了出色的内存压缩性能、精确的时间步估计和快速准确求解;基于第一性原理提出了光控砷化镓(Ga As)、温控二氧化钒(VO)的太赫兹等效色散模型,有效分析了其太赫兹特性,并结合高效的DGTD并行算法实现了物态调控太赫兹超材料的高精度仿真。论文给出大量的数值仿真和实验测试,验证了提出的量子-电磁计算方法的正确性和有效性。具体的研究内容和创新点包括:
1、提出了混合DGTD(HDGTD)方法的低内存方案。首先对HDGTD方法的基本矩阵进行矢量叠层基函数展开与线性映射,把每个四面体单元几何相关的基本矩阵分解为参考四面体单元内几何无关的通用矩阵。在对矩阵进行内存分析之后,分类推导了所有基本矩阵的展开表达式及通用矩阵的定义,使每个网格单元从存储矩阵转变为只需存储少量还原系数,从而显著降低内存消耗。数值算例表明,应用通用矩阵技术,内存占用与传统HDGTD相比大大降低,内存压缩率随着基函数阶数升高而提升,最高能压缩到传统HDGTD的1/18。
2、提出了两种基于局部时间步进(LTS)HDGTD算法的GPU并行加速技术,即1D线程块和2D线程块并行框架。当问题规模较小,内存占用小于GPU显存时,采用1D线程块框架,预处理时重组矩阵传输到GPU端,时间步进时每条线程负责矩阵与向量的乘加操作,加上并行归约算法的应用降低了计算时间复杂度,使得1D线程块框架有极高的加速比。当问题规模较大,内存占用大于GPU显存时,采用2D线程块框架加速低内存方案,每条线程负责矩阵重组与矩阵向量乘,减少数据传输量的同时适当增加计算时间,使得一边传输数据一边计算的时间重叠率高,在降低内存消耗的同时获得可观的加速效果。数值算例表明,与传统的全局时间步进HDGTD方法相比,中小规模复杂问题实现了590倍以上的杰出加速比,大规模复杂问题实现了150倍以上的加速比和13倍的内存压缩性能。
3、提出了基于麦克斯韦方程组的DGTD(DGTD-ME)方法的时间步准确预估方案,通过局部谱半径分析建立了高效的逐单元求解的时间步预估方案。经过与时域有限差分(FDTD)方法类似的稳定性分析,对DGTD-ME方法进行全局谱半径分析,得到解析的时间步界限;分析DGTD-ME的局部系统特性,将全局矩阵的谱半径分解到局部系统中,从而获得逐单元的时间步预估方案;选取权重系数时忽略第二层相邻单元的影响,进一步降低局部矩阵维度,提高预估效率。由于仅在全局矩阵分解时引入1次不等式放缩,提出的方法有杰出的预估准确度。数值算例表明,与精确的时间步长相比,该方法预估的最大时间步长准确度高达0.95;与广泛应用的局部能量预估方法相比,该方法的预估准确度提高到3.83倍。
4、提出了DGTD-ME-LTS方法的MPI+MPI大规模CPU并行算法,以及对应的双层负载平衡与双层通信技术。将同一节点内的CPU核心绑定成组,通过MPI共享内存窗口实现数据的直接访问,而节点间采用优化的MPI点对点通信,大大提高了信息交互速度。对应于双层通信架构,提出了双层网格分区策略以及对应的双层负载平衡方法。MPI+MPI通过节点内的核心共享内存机制大大减少了分区数量,使得核心间的负载平衡转变到节点间的负载平衡,提升了负载平衡度,从而显著提高了LTS方法的并行效率。数值结果表明,针对大规模多尺度复杂问题,该方法在6400核的并行效率高达94%;即便网格尺度比高达3个数量级,并行效率仍在90%以上,极大地提高了并行可扩展性。
5、提出了光控Ga As的量子-电磁太赫兹等效色散模型,有效提高光控Ga As材料及其太赫兹超材料的仿真精度。采用密度泛函理论(DFT)与杂化泛函计算Ga As绝缘态的能带结构与带隙,利用密度泛函微扰理论(DFPT)计算其介电常数,并通过实验验证结果的正确性;光激发Ga As呈现金属态时,应用电声耦合方法计算不同激发强度下的电子输运特性,结果与已发表的测试数据一致。基于第一性原理分析的