关键词:
概率论
统计学
遗传学
相关及回归理论
摘要:
十九世纪八十年代以前,由于无法对实验设计和实验条件进行控制,因此,以概率论为基础的统计方法没有得到广泛的应用。然而自十九世纪八十年代开始,一批学者将统计学的应用领域由天文学向遗传学、社会学领域拓展,于是以概率为基础的统计方法得到快速的发展。在这方面做出突出贡献的几位学者分别是高尔顿、埃奇沃思、卡尔.皮尔逊以及约尔,他们共同完成了统计学上突破性的进展——相关与回归的发现。这不仅为统计研究提出了新的方法,同时也成为二十世纪上半叶统计学发展的契机。论文的第二章,首先对拉普拉斯在概率理论方面的工作进行了介绍,尤其是拉普拉斯的概率思想对十九世纪产生的影响,包括拉普拉斯概率思想的广泛流行以及对概率应用领域的拓展。其次介绍了凯特勒对拉普拉斯概率思想的继承和应用,对凯特勒正态分布的拟合及应用过程进行了详细地阐述。第三章,考察了高尔顿在遗传学研究过程中发现相关及回归理论的历史过程。由正态分布的演示解释了人的身高或者其他性状服从正态分布的遗传现象,通过甜豌豆实验发现了子代性状有向母代平均回归的现象,最后,高尔顿在他的论文中提出了 "相关指数"的概念,用于刻画两个变量之间的紧密程度。第四章,重点介绍了埃奇沃思对相关回归理论的贡献。一方面,他超脱了高尔顿研究重点的实际背景,将其作为一个独立的要素突出出来,成为一个纯粹的数学定义,并给出了多元正态密度函数的矩阵形式;另一方面,他在论文中首次给出了"相关系数"这一术语,并推导出样本相关系数的计算公式。第五章,介绍了皮尔逊、约尔对相关回归理论的推广,即:皮尔逊关于怎样由样本相关系数估计总体相关系数的问题的研究,以及对于该问题,他与费舍产生的分歧和误解;约尔给出了偏相关系数的最小二乘估计,把相关回归理论与最小二乘法联系起来,为多元相关及回归方法的应用又提供了一个有利的工具。