生物统计(shengwu tongji,biostatistics,biometry,biometrics)含义 应用于中的数理统计方法。即用数理统计的原理和方法,分析和解释生物界的种种现象和数据资料,以求把握其本质和规律性。最早提出生物统计思想的是比利时数学家L.A.J.凯特莱,他试图把统计学的理论应用于解决生物学、医学和社会学中的问题。
生物统计发展概况
1866年,揭示了遗传的基本规律,这是最早运用数理统计于生物实验的一个成功的范例(见)。1889年,在《自然的遗传》一书中,通过对人体身高的研究指出,子代的身高不仅与亲代的身高相关,而且有向平均值“回归”的趋势,由此提出了“回归”和“相关”的概念和算法,从而奠定了生物统计的基础。高尔顿的学生K.皮尔逊进一步把统计学应用于生物研究,提出了实际测定数与理论预期数之间的偏离度指数即卡方差()的概念和算法,这在属性的统计分析上起了重要作用。1899年,他创办了《生物统计》杂志,还建立了一所数理统计学校。他的学生W.S.戈塞特对样本标准差作了许多研究,并于1908年以“Student”的笔名将t-检验法发表于《生物统计》杂志上。此后,t-检验法就成了生物统计学中的基本工具之一。英国数学家指出,只注意事后的数据分析是不够的,事先必须作好实验设计。他使实验设计成了生物统计的一个分支。他的学生G.W.斯奈迪格把变异来源不同的均方比值称为F值,并指出当值大于理论上 5%概率水准的值时,该项变异来源的必然性效应就从偶然性变量中分析出来了,这就是“方差分析法”。上述这些方法对于农业科学、生物学特别是的研究,起了重大的推动作用,20世纪20年代以来,各种数理统计方法陆续创立,它们在实验室、田间、饲养和临床实验中得到广泛应用并日益扩大到整个工业界。70年代,随着计算机的普及,使本来由于计算量过大而不得不放弃的统计方法又获得了新的生命力,应用更为广泛,并在现代科技中占有十分重要的地位。
生物统计非参数统计
大多数统计分析方法都建立在“数据服从某一分布(假设正态分布的较多)“这一基本假定之上,通过样本统计量来估计总体参数,而真实情况大多并非如此。有很多数据并没有其相应的理论分布。这时,一般采用不依赖布法的统计方法进行分析,这类方法往往比较直观,而且计算简便。常见的,如基于秩次的统计推断方法,即将观测结果并不能直接用数据表示,而用反映大小或程度的等级或秩次表示(即秩转换)。例如,观测结果是“-”,“±”,“+”及“++”以上,排序后的等级便是1,2,3,4……许多很有效的无分布法就是基于数据或观测结果的大小顺序的。由于无分布法通常并不涉及数据分布的参数的估计和推断,所以称为非参数方法,有些文献中亦称之为”不依赖分布“(Distribution free)的统计分析方法。
生物统计生存分析
许多生物现象的动态观察结果都比一次性的横断面观察更能说明问题。例如:恶性肿瘤患者接受手术治疗的效果,要看他们术后经过一段时间的生存率,或者有必要描绘出在不同条件下的生存率曲线(以时间为横轴,生存率为纵轴),以便进行分析与比较;器官移植的效果,要看异体器官在体内正常工作和不被排斥的时间等。生存分析的用途是广泛的。
生物统计多元分析
又称多指标或多变量分析,是对多个观测指标同时进行综合性分析,所以比普通的一元统计分析更为全面、有效。这是40年代就已出现的一系列好方法。由于涉及较深的数学知识和很复杂的计算,妨碍了它们的普及,随着计算机和统计软件包的日益完善,预料多元分析不久将会成为生物科学研究的常规武器。多重回归是指多个自变量和一个因变量的回归;而多元回归是指不止一个因变量的回归。但二者常被混淆使用。它们可用于预测、指标的综合或自变量的筛选。判别分析是利用形如多重回归方程的判别函数来进行个体种类的判断或诊断。聚类分析是将许多个体或指标按它们的相似程度来归类。对个体进行聚类称为Q型聚类;对指标进行聚类称为R型聚类。Q型聚类和判别分析是数量分类学的两种基本方法。趋势面是以地理上的经、纬度为自变量的高次方程,可用于绘制研究对象在地理上的分布密度的等高线图,亦可用于预测。主成分分析的目的在于将许多彼此相关的指标变换成少数几个彼此独立的综合指标,而且它们包含了原来那些指标的几乎全部统计信息。因子分析的计算程序与主成分分析类似,但它不是研究指标的变换,而是分析个体间的内在联系,此法为心理学家所首创,也可用于研究复杂的疾病。
生物统计工具
目前,从全球范围来看,JMP Clinical, Matlab(Bioinformatics Toolbox), R语言, SPSS, PRIMER等软件的使用较为普及,主要用户有生物统计学家、生物信息学家、基因学家以及学生等。这些软件能提供丰富强大的分析功能以及动态图形分析,为苗头化合物寻找、临床前研究、临床试验、流行病研究、疾病控制、公共卫生、生物统计教学等领域提供前所未有的强大、便捷、高效的分析能力。、
生物统计应用
农业科学从过去的定性研究到现在逐渐趋向于定量化研究, 这一过程中不可缺少的是数学工具。 生物与数学相互融合产生的生物统计学在农业科学的多方面研究中发挥着巨大作用。
为了提高农产品的品质与产量,我国新引进多种粮食品种。 但新品种适宜在什么样的环境下生长、 利于作物生长的肥料品种以及施肥量的多少等问题都需要事先用生物统计学进行分析研究。除此之外,农田生态系统中的各种害虫、杂草的生长也会对作物产生不利的影响, 农业劳作者一般通过简单喷洒农药的方法来控制。 而施用何种农药以及药剂量的多少, 既能有效消灭作物天敌又能尽量降低对农作物的损害, 同时降低经济损失等等问题, 也要依靠生物统计学进行预测和预报。
另外还有学者发现, 具备生物统计学知识可以预测一些生物现象的发生,而且准确率较高, 然而很多人对此却并不了解。 因此在相关人群中普及生物统计学的知识势在必行。