第四节 概率与可信限
作者:徐荣祥 出书社:中国科学技术出书社 刊行日期:2009年7月概率又称几率,是指总体某事件理论发生率巨细的数值,或称作是预计某事件发生的可能性巨细的一种变量指标,用符号P体现。概率这个名词虽然在日常事情中直接使用者较少,但是对于这一看法的应用却非常广泛,例如,医生凭据自己的诊治经验,认为“这个病人十有八九会死于急性肾功衰竭”。若从概率论的角度分析,就是说这个病人致死的原因80%~90%可能是急性肾功衰竭。有文献记载,烧伤病人的半数致死烧伤面积(LD50)为87%,如果统计的数量相当大,我们就可以把这个频率看作概率,是说87%烧伤面积者的治愈率在50%左右。又如,某动物室存有牝牡各半的一大群动物,我们随意抽取2只,虽然不能预言其牝牡,但是凭据统计学原理可以推算出,取一只为雄性的发生率为50%(即05);连取两只均为雄性的发生率为025(05×05),其规律性可用05体现,(即连取n只均为雄性的发生率应为05)。一般情况下,总体中某事件的概率是未知的,可以通过多次重复视察样本,从样本中的雄性发生率来判断总体的概率。所以,概率也可以认为是无数次重复时该事件的发生率。
概率可用小数或百分数体现,如P<05(005),或写作50%(5%)。P值颠簸在0~1之间。若某一事件一定不发生,则该事件发生的概率为0;某一事件一定发生,则该事件发生的概率为1。概率越接近0,体现发生的可能性越小,概率越接近1,发生的可能性越大。我们经常遇到说明概率事件的情况有三种:①一定事件指的是一定发生的事件,如人体皮肤与100℃沸水接触1min,一定会发生Ⅲ度烧伤,一定事件的概率P=1;②不行能事件如1%烧伤面积的成人患者不会发生早期低血容量休克,肯定不会发生,不行能事件的概率P=0;③随机事件指的是在一定条件下可能发生,也可能不发生,如病人发生了条件致病菌熏染,是否会发生败血症?回答是可能发生,也可能不发生,随机事件的概率P在0与1之间。
概率也是某事件泛起的可能性巨细的度量,它与频率差异,概率是对总体而言,频率是对样本而言。在相同条件下进行n次重复实验,事件发生数a小于或即是n(a≤n),则a与n的比(a/n)为事件A的频率。如n逐渐增大,则事件A的频率则越来越接近概率P。统计学上常以n充实大时事件A的频率作为该事件概率的近似值。
二、可信区间
前边已经提到,可以用样本均数预计总体均数,样本率可以预计总体率。每种预计如果仅是一个值,称为净值预计,或点预计。它们都是无偏预计,因为它们的数字期望就即是各自的总体值。从变异的意义上讲,样本均数(或率)仅是对一份样本而言,是总体均数(或率)的最好预计。样本均数包罗了一份样本用于预计总体均数的所有信息。因此,样本均数或样本率具有预计的优越性。但是,样本均数与在各样本之间是纷歧样的,对于一个连续性的变量来讲,样本均数可取无穷多个值,即样本均数未必恰好即是总体均数。样本率也是如此,因为在研究事情中所视察到的百分率或均数,究竟是从数量有限的样本中得到的,它仅仅是接近而不是即是总体的概率或均数。为解决这个问题,从而发生了区间可信限这个看法:用一个区间而不是一个点来预计总体参数。凭据统计学原理,我们可以在百分率或均数的上下扩大一定范围,使总体均数(或率)处于该范围内的可能性为95%,这就是“95%的可信限”,或称95%的可信区间。
事实上,我们并未测定总体的均数(或率),但是凭据统计分析原理,有95%甚至99%的掌握可以推导出总体均数所在的范围。如果样本例数很大,重复次数又很多,我们推断总体的准确性也就愈大。统计学常用样本均数加减95%可信限,或99%的可信限来体现总体均数的预期范围。