关键词:
地中海贫血筛查
FTIR/ATR光谱
Savitzky-Golay平滑
移动窗口PLS
等间隔组合移动窗口MLR
摘要:
地中海贫血是危害极为严重的单基因遗传病,在我国广西、广东等南方地区具有较高发病率,目前尚无有效的治疗手段,地贫筛查是防止地贫症患儿出现的主要预防手段。血红蛋白浓度(HGB)、平均红细胞血红蛋白含量(MCH)、平均红细胞体积(MCV)是其中主要指标,但现有测定方法需要对不同指标用不同的化学试剂进行化学反应,不利于大人群筛查。本课题采用傅立叶变换红外光谱(FTIR)结合衰减全反射(ATR)技术,建立无需化学试剂、精度适中、直接快速同时测定上述指标的定量分析方法。
首先随机抽取部分全血样品分别加入蒸馏水,溶为2倍、3倍、4倍、5倍、6倍的溶血样品,连同全血样品一起共得到6个样品组,分别进行FTIR/ATR光谱实验,探讨利用FTIR/ATR光谱分析HGB、MCH、MCV等指标可行性和样品的光谱测定方法。经分析,确定采用2倍溶血的形式测定样品,然后对其余的全部样品进行FTIR/ATR光谱测定实验。采用光谱数据结合常规测定方法得到的HGB、MCH、MCV的参考值(化学值)分别建立各指标的光谱定标预测模型。基于定标集和预测集的不同划分,分别采用单波数回归、直接偏最小二乘法(PLS)、基于Savitzky-Golay (SG)平滑的PLS、移动窗口PLS(MWPLS)和等间隔组合移动窗口MLR (ECMWMLR)等方法系统深入的进行光谱预处理模式的优选、分析波段(或波数组合)的选择,模型的稳定性分析等,最后对优选的模型进行再次检验。
主要结果如下:
1)考虑到定标集和预测集的不同划分会造成模型预测效果的波动,为了得到稳定可靠的结果,本文提出了一种新的定标和预测集的划分方法,并构建计算机算法平台将全体样品做50次定标和预测集的划分,计算50次不同划分的模型预测均方根偏差(RMSEP)和预测相关系数(RP)的平均值(RMSEPAve、RP,Ave)等,然后基于RMSEPAve优选稳定可靠的模型;
2)把SG平滑模式由原来的117个扩充为540个,将全部540个SG平滑模式与PLS模型结合,构建基于SG平滑的PLS算法平台,可以大范围同时优选SG平滑模式与PLS因子数。HGB、MCH、MCV三个指标的全谱模型结果都表明,其最优SG-PLS模型的预测效果明显优于直接PLS模型的预测效果,并且筛选出的SG平滑模式和PLS因子数是稳定的,从而建立了一种有效的光谱预处理模式筛选方法;
3) MWPLS方法是著名的光谱分析波段的优选方法,但是本文发现基于定标集和预测集的不同划分,MWPLS方法的最优波段会变化,为了得到稳定的结果,本文基于50次不同划分分别建立MWPLS模型,按照RMSEPAve优选最优波段,同时得到稳定可靠的模型。这里还编写了起点波数(B)、采用波数点数(N)和PLS因子数(F)都任意可变的MWPLS算法程序平台,并设置合理的参数范围,使得筛选的最优波段达到全局最优。其中,HGB、MCH和MCV的最优MWPLS模型参数(B,N,F)分别为(1178cm-1,12,2)、(1549cm-1,9,6)和(3098cm-1,310,5),它们的(RMSEPAve, RP,Ave)分别为(5.334g/L,0.968)、(1.794pg,0.910)和(4.299fl,0.869),明显优于全谱的最优PLS模型,并且采用的波数点个数很少,大大的降低了模型的复杂性。
4)采用本课题组新近提出的ECMWMLR方法分别建立HGB、MCH和MCV的最优等间隔离散模型,构建了起点波数(B)、采用波数点数(N)和采用波数点的间隔(G)都任意可变的ECMWMLR算法平台,并设置合理的参数范围,使得筛选的最优波数组合达到等间隔的全局最优。其中,HGB、MCH和MCV的最优ECMWMLR模型参数(B,N,G)分别为(1952cm-1,4,68)、(3568cm-1,8,69)和(3964cm-1,13,109),它们的(RMSEPAve,RP,Ave)分别为(5.036g/L,0.972)、(1.662pg,0.919)和(3.929fl,0.892)。最优ECMWMLR模型的预测效果比最优MWPLS模型还要好一些,它克服了光谱的共线性,同时还保留MLR的简单性,比MWPLS方法更进一步降低了模型的复杂性。
本文率先建立了基于FTIR/ATR光谱的地贫筛查指标HGB、MCH和MCV的同时定量分析方法,并进行了模型优选和稳定性分析,该方法具有精度适中、直接快速的优点。基于MWPLS、ECMWMLR方法得到的最优波段、最优波数组合分别为连续型、离散型的小型专用红外光谱仪器的高信噪比分光系统的设计提供重要依据,也为FTIR/ATR应用于人体血液地贫筛查指标的同时定量分析提供稳定可靠的模型。论文所提出的系统方法也能够应