关键词:
单细胞数据
细胞分化轨迹
RNA速度
深度神经网络
常微分方程
摘要:
细胞分化是基因表达的基本生物过程,探究细胞分化的内在机制具有极其重要的生物学意义。特别是研究细胞分化过程中命运决策、推断细胞分化轨迹,将有助于理解细胞分化的内在机制。同时,细胞分化与细胞发育、疾病治疗等密不可分。本文拟基于单细胞测序数据,通过推断细胞分化轨迹,研究细胞命运决策,进而揭示细胞分化机制,文章结构安排如下:
第一章,绪论部分,主要介绍细胞分化的研究背景以及研究现状,将着重介绍利用单细胞转录组学数据研究细胞分化的研究现状。在此基础上,我们着重介绍细胞轨迹推断方法和RNA速度方法,并讨论了两者之间的优缺点。
第二章,主要介绍有关细胞转录分化、RNA速度的理论背景知识、相关算法,比如线性回归算法、EM算法、深度神经网络等。为后续的研究工作提供理论基础和算法模型。
第三章,主要研究几类重要的RNA速度数学模型方法,并对这些模型方法进行分析讨论。分析发现现有方法的缺陷,如极度依赖对未剪接和剪接的m RNA的估计测量,无法真正估计未剪接和剪接的m RNA的丰度,从而导致对RNA速度估计的影响,进而影响细胞分化轨迹推断以及下游分析。
第四章,通过引入额外的信息,完整利用单细胞基因表达数据,我们提出一种新的RNA速度模型方法称为WF-velo,能够克服现有数学模型方法的缺陷。建模方面,通过构建微分方程组来表示细胞分化中基因RNA转录的动态过程。利用深度神经网络和Adam优化算法对模型的参数进行求解,以揭示基因随时间RNA速度的动态变化。数字模拟方面,利用WF-velo RNA速度模型方法对单细胞数据进行模拟。成功获得细胞沿着伪时间分化的轨迹图,并分析基因沿着伪时间RNA速度的变化。数字模拟的结果验证了所建模型的准确性,为进一步深入理解了细胞命运决策的内在机制提供了重要的参考。
第五章,对本文进行总结和展望。希望通过本文的研究,发展新的RNA速度模型方法,更好地研究细胞分化机制。