第八章假设检验.docx
第八章假设检验第01讲假设检验的基本思想和概念第一节假设检验的基本思想和概念1.1 基本思想1.2 统计假设的概念1.3 两类错误1.4 假设检验的基本步骤1.5 基本思想首先,假设总体分布参数(如H)为某个确定值,这个假设被称为“原假设”,记作.其次,在假设H。为真的条件下分析通过统计抽样得到的样本信息.结合样本信息,根据“小概率事件在一次试验中几乎不可能发生”这个特点,判断是否拒绝Ho.引例:味精厂用一台包装机自动包装味精,已知袋装味精的重量XN(P,0.0152),机器正常时,其均值口=0.5.某日开工后随机抽取9袋袋装味精,其净重(单位:kg)为0.497,0.506,0.518,0.524,0.498,0.511,0.520,0.515,0.512.问这台包装机是否正常?注意到:抽取的实际重量和标准重量不完全一致.两种原因:一是偶然因素(例如,电网电压的波动、金属部件的不时伸缩、衡量仪器的误差)的影响,它会造成随机误差;二是条件因素的影响(如生产设备的缺陷、机械部件的过度损耗),会产生条件误差.若只存在随机误差,我们就没有理由怀疑标准重量不是05kg;如果我们有十足的理由判断标准重量己不是0.5kg,那么造成这种现象的主要原因是条件误差,即包装机工作不正常.那么,怎样判断包装机工作是否正常呢?正确答案已知袋装味精的重量XN(u,0.0152),假设现在包装机工作正常,即提出假设:H。:“=从=05这是两个对立的假设,我们的任务就是要依据样本对"作出是否拒绝的判断.选取样本均值作为参数的估计量,当H。为真时,声一OSI应很小.当代-0.5|过分大时,我们应当怀疑H。不正确而拒绝Ho.对于给定的很小的数,O<<l,由P=确定拒绝域.1.6 统计假设的SE念在许多实际问题中,常需根据理论与经验对总体X的分布函数或其所含的一些参数作出某种假设H0,这种假设H。称为厚假设:与其对应的假设Hl称为备择假设或对立假设,两者称为统计假设(简称假设).当统计假设用仅仅涉及总体分布的未知参数时,称之为望低逡,而当统计假设H。涉及分布函数的形式(例如假设H。:总体X服从泊松分布)时,称之为非参数假设.统计假设与假设检验的一般思路:设总体X服从正态分布且XSN(11,。2),且。2已知,作假设H0:=0(PD己知)给定(a为小概率),可得U0,进行一次样本抽样得到样本均值了.若H。为真,则U-N-勺并且样本平均值应在<1的附近两侧取值,否则应视为小概率事件已经发生.Jn也就是说,HUlXJg喘枷卜“故认为原假设H。有问题、应被拒绝.根据以上分析,可知假设检验可以归结为通过分析U统计量的取值范围判断是否拒绝原假设:如果Ql拒绝H。,否则不拒绝Ho.用于假设检验的随机变量M称为检验统计量,称区域氏一,xju稣j为拒绝7yjn三域,简记为用=Q但2在假设检验中,小概率Q常取0.05,0.01或0.10,Q称为显著性水平.作为拒绝域的边界的数值,称为临界值,即当Wr=IUIN*时,临界值为一uwUa2.K=0.052时,临界值分别为-1.96与1.96.1.7 两类错误通过样本去推断总体有可能出现的两类错误.一类错误:在成立的情况下,样本值落入了拒绝域也因而H。被拒绝,这种错误被称为第一类错误或拒真错误,一般记犯第一类错误的概率为a(即显著性水平).另一类错误:在H。不成立的情况下,样本值未落入拒绝域也因而H。被接受,称这种错误为第二类错误或取伪错误,并记犯第二类错误的概率为.两类错误对照表表8T真实情况判断接受HO(X”X2>,Xn)W)拒绝Ho(X1,X2,,X11)W)HtI成立正确第一类错误Hl成立第二类错误正确【例题填空题】设,B分别是假设检验中犯第一、第二类错误的概率,且H。与Hl分别为原假设和备择假设,则(1) P接受HOlHO不真=;(2) P拒绝HJHo真=;(3) P拒绝HOlHO不真=;(4) P接受HOlP真=.正确答案(1)P接受H(IlHO不真=£;(2) P拒绝HolHo真=:(3) P拒绝HJHO不真=1B;(4) P接受HOlHO真=1.两类错误的关系:(5) 两类错误的概率是相互关联的,当样本容量n固定时,一类错误的概率减少将导致另一类错误的概率的增加;(6) 要同时降低两类错误的概率,需要增大样本容量n.在此背景下,只能采取折中方案.先控制住的值(即事先选定的值),再尽可能减少B的值.并把这一假设检验方法称为显著性水平为的显著性检验,简称水平为a的检验.1.4假设检验的基本步骤(1)根据实际问题提出原假设及备择假设Hi.这里要求Ho与Hl有且仅有一个为真.(2)选取适当的检验统计量,并在原假设H。成立的条件下确定该检验统计量的分布.(3)按问题的具体要求,选取适当的显著性水平a,并根据统计量的分布表,确定对应于a的临界值,从而得到对原假设H。的拒绝域W.(4)根据样本值计算统计量的值,若落入拒绝域W内,则认为HO不真,拒绝H。,接受备择假设H1;否则,接受Ho第02讲正态总体均值的假设检验第二节正态总体均值的假设检验2.1u检验2. 2t检验2.3*大样本情况总体均值检验(U检验续)2.1 u检验设计出服从标准正态分布的检验统计量(U统计量)并据此进行假设检验的方法称为U检验.L方差已知时,单个正态总体均值检验设X”X2,,Xn是从正态总体中抽取的样本,b;是已知常数,欲检验假设:":"二用H中国其中口。为已知数.选取检验统计量其服从N (0, 1).拒绝域为K=(fFq)U(%+oo)若由样本观测值计算出U的值落在W内,则作出拒绝Ho的判断,否则接受Ho.【例题计算题】某种产品的重量XSN(12,1)(单位:g),更新设备后,从新生产的产品中,随机地抽取100个,测得样本均值,=12.5g,如果方差没有变化,问设备更新后,产品的平均重量是否有显著变化(取Q=0.1)?正确答案根据题意,设计统计假设如下:Ho:=Po=12H1:12,拒绝原假设即说明产品的平均重量有显著变化.2.方差已知时,两个正态总体均值检验设XN(AQ>y-N20>其中bj。;为已知常数,X”Xi,,儿和匕,Yz,Yn分别是取自X和Y的样本且相互独立,欲检验假设Ho:乂=外;Hzi1.检验假设L=II2,等价于检验假设L-L=O.而又一尸是】一以2的一个好估计量,可设计出相应的U统计量对假设进行检验.l7sjTzF选取检验统计量u-2,其服从N(0,1).匕今拒绝域为犷=(r°,-%)U(%,X>)若由样本观测值计算出U的值落在W内,则作出拒绝H。的判断,否则接受H。.由上述讨论可知,由服从标准正态分布的检验统计量作检验的方法称为u检验法.2.2t检验设计出服从t分布的检验统计量(t统计量)并据此进行假设检验的方法称为t检验.1 .方差未知时,单个正态总体均值检验设X”X2,Xn是从正态总体N中抽取的样本,其中b*未知,欲检验假设:Hq3=内Hx.z.其中口。为己知数.选取检验统计量T=A4,其服从t(n1).SIGWTF=Pf毅叶"拒绝域为:=(F<("T)U(L51)55若由样本观测值计算出t的值落在W内,则作出拒绝Ha的判断,否则接受Ho.【例题计算题】某水泥厂用自动包装机包装水泥,每袋水泥重量X(单位:kg)服从N(0,。与,已知u°=50kg,某日开工后随机抽取9袋,测得=49.9kg,样本标准差s=0.3kg.问当日水泥包装机工作是否正常(=0.05)?(附:to.025(8)=2.306)正确答案根据题意设计统计假设如下:Ht:i=-50;H1:/50.已知x=49.9?a=0.05»$=03n=9t=50.f00,j(8)=2.306设计t统计量、计算其绝对值,有由于根据样本数据计算出来的I统计量数据小于临界值,所以在显著性水平0.05下接受Hd,即认为水泥包装机工作正常.【例题计算题】车辆厂生产的螺杆直径X(单位:mm)服从正态分布N(,2),现从中抽取5支,测得直径为22.3,21.5,22.0,21.8,21.4.如果。2未知,试问直径均值u=21mm是否成立(=0.05)?(附:to.025(4)=2.776)正确答案根据题意构造统计假设:H1z21.由样本观测值算得i=21.8mm,s3=(K135(mm2)W I.l355=4.87 >2.776.由于t检验统计量的值超过了临界值,所以在显著性水平0.05下应拒绝H0,即螺杆直径均值不是21mm.2.方差未知时,两个正态总体均值检验设X-W>W)hMid),XcX2,,尤和丫”丫2,,Yn分别是取自X和Y的样本且相互独立.12=2(2欲检验假设:Z0:a=四;H/izX-Y构造检验统计量f11,当HO为真时,S七十7X-Y= 丁 一 ISv LUl忒*1必、加一14÷- 2) URZ t(w + - 2 +n给定显著性水平,通过查询教材P242的t分布表可得到临界值%(7+-2),使得P)>f(w+-2)=,若由样本观测值计算出t的值落在W内,则作出拒绝H(I的判断,否则接受H0.【例题计算题】在漂白工艺中考察温度对针织品断裂强度的影响,现在70与80C下分别作8次和6次试验,测得各自的断裂强度X和Y的观测值.经计算得x=204j=193167,(m-l=62STR=5.0283.根据以往的经验,X和丫均服从正态分布,且方差相等.在给定=0.10时,问70与80C对断裂强度有无显著差异?正确答案由题设,可假定XN(d,。2),YN(U2,o2)写出统计假设=;Hlxiz.T及一GT=/构造检验统计量S1,经查表,对应a=0.10的t分布的临界值为Q("''"一2)=4M(14=1782IrI=/XrJ三g+.包=2.0737>1,782,+(-1)>;VW所以在a=0.1下拒绝Ho,即70与80对断裂强度有显著差异.(2)a;*W且都未知,但m=n(配对问题).构造并检验统计假设H0:典=幺;Zf1:4.令4=-K,i=L,n,即视两个正态总体样本之差来自一个正态总体的样本.记E(Z)=E(Xj-K)=A-M=%D(ZJ=D(Xi)÷D(F1)=÷=2(未知).此时,原检验就等价于下述假设检验:Ho:rf=O;Hxxd1.选取检验统计量=Z册,其服从t(n-l).S其拒绝域为"一(Ya-I(一-1)U(r。("-1),XO)TI若由样本观测值计算出t的值落在W内,则作出拒绝Ho的判断,否则接受Ho.【例题计算题】有两台仪器A、B,用来测量某矿石的含铁量,为鉴定它们的测量结果有无显著的差异,挑选了8件试块(它们的成分、含铁量、均匀性等各不相