关键词:
拉曼数据库
表面增强拉曼光谱
农药残留
机器学习
优选特征变量
摘要:
柑橘是我国种植面积大和年产量高的重要果蔬经济作物之一,其种植过程中存在着农药使用不合理和滥用现象,导致严重农药残留问题。啶虫脒广泛应用于柑橘类水果的病虫害防治,而咪鲜胺常用于柑橘的保鲜,防止其贮存过程中腐烂。农药经典化学方法检测灵敏度高,但仪器费用昂贵、成本高、前处理复杂,需要专业人员操作。表面拉曼光谱检测技术(SERS)检测速度快,检测灵敏度高,广泛用于食品农产品中质量安全快速检测,而SERS光谱中存在大量与待测对象相关的特征信息。因此,本文提出采用表面拉曼光谱检测技术结合机器学习方法分析柑橘中啶虫脒和咪鲜胺农药残留,使用特征变量筛选方法从全光谱中优选出与啶虫脒和咪鲜胺相关的特征谱峰信息,建立柑橘中啶虫脒和咪鲜胺农药残留快速检测方法。主要研究内容如下:
(1)开发拉曼光谱特征数据库管理系统。本研究首先开发农药标准品拉曼光谱特征数据库,对所建数据库进行需求分析,明确系统的功能及性能要求。采用JAVA语言,在Eclipse开发环境中,结合面向对象程序设计和客户机/服务器架构,建立系统的整体框架。数据库分用户管理模块、光谱数据库管理模块、系统安全模块等,适合于各种不同标准品拉曼光谱数据分析,能对不同光谱和各类分析算法做一个调配,方便科研人员及各工作人员对光谱的分析操作;数据库可实现标准品拉曼光谱文件在线进行谱图显示、操作和数据分析,上传光谱文件到系统,系统根据文件数据显示相应谱图,对谱图进行放大、缩小、标峰等操作,对光谱文件进行算法分析和数据处理,对上传后的光谱文件和操作中的光谱文件进行收藏,保存到系统。
(2)采用表面增强拉曼光谱结合机器学习算法优选柑橘中啶虫脒农药特征谱峰。本研究探索基于SERS的柑橘果肉中啶虫脒农药的特征峰优选方法,以金纳米为增强基底,采集柑橘果肉中啶虫脒农药残留SERS光谱数据集,结合机器学习方法优选特征谱峰,建立柑橘果肉中啶虫脒农药残留PLS预测模型。使用MA、SNV、MSV和S-G 1st等四种预处理方法对原始光谱进行预处理,并进行对比,确定SNV作为本研究原始光谱的预处理方法。分别运用CARS、SPA和GA三种特征变量筛选方法从全谱中筛选特征光谱,建立PLS预测模型。结果表明,GA特征优选方法所建模型性能最好,将特征维数从原始的751个降低到25个,选择3个主成分因子,简化了模型,提高了运算效率。模型对校正集的Rc2为0.9950,RMSECV为0.8344;对预测集样本的Rp2为0.9865,RMSEP为1.2776。
(3)提出柑橘果肉中啶虫脒和咪鲜胺混合农药残留SERS同时检测方法。运用上述最佳实验条件,采集SERS光谱,对柑橘果肉中啶虫脒和咪鲜胺混合农药进行检测。同样运用CARS、SPA和GA三种特征变量筛选方法分别从全谱中出筛选出啶虫脒和咪鲜胺混合农药特征谱峰,建立柑橘果肉中混合农药啶虫脒和咪鲜胺的PLS预测模型,并对比各特征变量筛选方法的优化效果。结果表明,对柑橘果肉中混合农药啶虫脒的特征谱峰筛选,SPA筛选出23个特征变量,所建模型性能最好,模型对校正集的Rc2为0.9824,RMSECV为1.7035;对预测集样本的Rp2为0.9567,RMSEP为2.4293。对柑橘果肉中混合农药咪鲜胺的特征谱峰筛选,GA筛选出21个特征变量所建模型性能最好,模型对校正集的Rc2为0.9736,RMSECV为1.9769;对预测集样本的Rp2为0.9693,RMSEP为1.9282。