关键词:
结构方程模型
地学数据
建模与分析
大数据分析
摘要:
结构方程模型是一种建立、估计和检验因果关系的方法。它可以替代多重回归、路径分析、因子分析、协方差分析等方法,清晰分析单项指标对总体的作用和单项指标间的相互关系,是一种主要应用于验证性模型分析的多元统计建模技术。由于能够通过可观测变量来度量潜变量得分以及分析不同子模型下潜变量之间的协同效应等优点,结构方程模型被广泛应用在心理学、行为学、市场学等领域的数据建模分析研究中,提供了从提出概念—设计模型—获取数据—验证模型的成熟应用路径。地学数据的建模技术一直是地学研究的热点之一,其目的是在海量、多元、高维、多时态的地学数据中,提取出有价值的模型结构以及潜变量,研究不同地学变量以及潜变量之间的交互关系,从而支撑环境治理、灾害防治、资源勘察、生态评价等相关应用和研究。随着地学数据规模变化和建模工具的不断发展,地学数据建模的样本逐渐从抽样建模变为全样本建模,建模方式从有地学模型指导下的建模变为无约束/弱约束建模,建模依据从基于变量因果关系建模变为基于变量相关性的建模,模型复杂度从单模型/单过程建模变为多模型/多过程的综合建模。结构方程模型作为一种综合的建模方法,其可以同时包含因子分析、潜变量估计、路径分析等多种多元分析技术,这种多层次、多分支的建模方法融合了知识驱动建模和数据驱动建模的特点。结构方程模型在地学数据建模中主要面临以下三个方面的挑战,一是从主要面向验证性建模分析的方式向探索性建模分析的方式转变;二是从有完整地学模型约束的建模型方式向弱模型/无模型约束的地学数据建模方式转变;三是从无空间属性的统计变量建模向空间统计变量建模的转变。这对模型本身和数据建模的方法都提出了新的要求。针对以上三个问题,文章在回顾结构方程模型的概念和发展历程的基础上,介绍了三个结构方程模型在地学数据建模中的应用案例,一是利用湖泊沉积物地球化学数据在弱约束条件下提取地球化学金矿内生控矿因子的建模案例;二是利用结构方程模型的综合参数优化方法,通过计算后验概率与观察后验概率的匹配约束来弱化、校正证据权模型中证据独立性问题在计算金矿找矿后验概率中的影响;三是利用结构方程模型来研究墨西哥马格达莱纳流域森林保护策略,通过对不同区域的森林区块进行编号,将空间分布数据转变为传统的无空间属性的统计变量,并分析了不同环境策略对森林保护的影响。