关键词:
水稻
花期和穗粒相关性状
自动化图像处理
深度学习
经济型表型分析
摘要:
水稻生产对保障中国粮食安全具有重要意义,进一步提高其产量是应对潜在粮食短缺风险的关键举措。水稻产量同时受基因和环境因素影响,是一个高度复杂的性状。因此深入研究水稻关键生育时期对解析水稻产量形成具有重要意义。花期和穗粒相关性状是对水稻产量形成和评估的重要依据,二者有明确的联系,且在高产水稻遗传育种和栽培管理中均扮演着重要角色。
高通量基因组学是科学家们精准鉴定水稻关键农艺性状基因位点、设计优良品种的利器之一。然而,基因组学研究需要大规模、高质量的表型数据作为支撑,受到基于人工的传统表型方法掣肘,因此亟需自动化、高效率的水稻表型方法。受限于技术和硬件成本,当前对水稻花期和穗粒相关性状的表型鉴定仍主要依靠人工,限制了表型统计的监测频率、规模和数据可靠性。计算机视觉、图像处理和深度学习技术已在水稻花期和穗粒表型分析方面取得了一定进展,在减少人工干预的同时,有望提高数据采集和表型分析的准确度。本研究与上海市农业生物基因中心和中科院国家基因研究中心合作,构建了水稻花期及穗粒表型图像集的获取方法,并从图像特征量化提取和自动化分析角度出发,自主设计了一套经济性高、实用性强的水稻花期及穗粒表型数据分析方法。
花期性状分析方面,本研究设计了半自动工作流程以辅助人工标注稻穗、构建了稻穗分割数据集、训练了稻穗分割模型。在前期工作的基础上,本研究提高了花药对象检测算法的准确度和泛化能力,并结合花药和稻穗对象进一步发掘了与开花关键时段相关的性状。算法分析结果与人工统计数据对比结果为:(1)基于图像分析花药数和花药面积的决定系数(R)分别为0.90、0.86(n=150张图像,P<0.001);(2)算法基于开花穗区面积分析始花时刻的平均相对误差(MRE)为3.92%,R为0.72;(3)算法基于花药数和花药面积分析盛花时刻的MRE分别为3.76%、3.59%,R分别为0.76、0.77(n=1683次测量,P<0.001)。穗粒分析方面,根据本研究提取的花期相关性状表型组数据,由合作团队挑选了18个开花特征相近的品种进行穗粒相关性状分析。本研究设计了一种无需脱粒、直接通过稻穗图像考察每穗粒数和多种穗粒相关性状的智能表型解析算法,可从图像中快速提取完整穗粒并量化分析其粒长、粒宽、长宽比、圆形度和颜色等多种穗粒相关性状。在室内定点拍摄的18个水稻品种中,算法对每穗粒数分析结果的MRE和R分别为5.48%、0.95(n=4930粒,P<0.001;基于图像)和9.02%、0.88(n=4191粒,P<0.001;基于实际稻穗);长宽比分析结果与人工统计的MRE和R为8.36%、0.84(n=1454粒,P<0.001;基于图像)。此外,通过聚类分析可将所试18个品种在欧式距离3.8处分为4类,与人工聚类分析结果相似,可高效区分不同水稻品种间的穗粒性状差异。
结果表明,本研究构建的分析算法使用便捷、成本较低、易于推广,性状分析结果具有生物学意义。因此,本研究适用于对精确度和泛化性要求较高的花期和穗粒性状快速鉴定工作,改进了以往表型研究在这一领域的不足,以期在提高当前水稻育种及栽培中品种对比效率的同时,提供标准统一、获取成本较低的表型组数据,辅助育种学家制定更精准有效的育种策略。