欢迎来到优知文库! | 帮助中心 分享价值,成长自我!
优知文库
全部分类
  • 幼儿/小学教育>
  • 中学教育>
  • 高等教育>
  • 研究生考试>
  • 外语学习>
  • 资格/认证考试>
  • 论文>
  • IT计算机>
  • 法律/法学>
  • 建筑/环境>
  • 通信/电子>
  • 医学/心理学>
  • ImageVerifierCode 换一换
    首页 优知文库 > 资源分类 > DOCX文档下载
    分享到微信 分享到微博 分享到QQ空间

    第04讲列联表与独立性检验(解析版).docx

    • 资源ID:962497       资源大小:319.68KB        全文页数:30页
    • 资源格式: DOCX        下载积分:7金币
    快捷下载 游客一键下载
    账号登录下载
    微信登录下载
    三方登录下载: QQ登录
    二维码
    扫码关注公众号登录
    下载资源需要7金币
    邮箱/手机:
    温馨提示:
    快捷下载时,如果您不填写信息,系统将为您自动创建临时账号,适用于临时下载。
    如果您填写信息,用户名和密码都是您填写的【邮箱或者手机号】(系统自动生成),方便查询和重复下载。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP,免费下载
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    第04讲列联表与独立性检验(解析版).docx

    备战2024年高考解读突破强化一轮复习讲义(新高考)第04讲列联表与独立性检验【考试要求】1 .掌握分类变量的含义.2 .通过实例,理解2X2列联表的统计意义.3 .通过实例,了解2X2列联表独立性检验及其应用.知识点一分类变量与列联表(1)分类变量:变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量;(2)列联表:列出的两个分类变量的频数表,称为列联表.假设有两个分类变量X和匕X表示相互对立的两个事件=0和=I,Y表示相互对立的两个事件y=0和y=1,其中内b,C,d是事件X=x,Y=y(x,y=0,1)的频数,是样本量,其样本频数列联表(称为2X2列联表)如表所示:XY合计Y=Oy=X=OahabX=Cdc+d合计a+cb+d=+6+c+d知识点二独立性检验(1)小概率值。的临界值:对于任何小概率值。,可以找到相应的正实数总,使得关系P(2xJ=。成立.我们称Xa为的临界值,这个临界值可作为判瞰2大小的标准.概率值夕越小,临界值Xa越大;(2)炉的计算公式:* =Mad-be?(。+力(c*Xo+c)(6+<)'(3)独立性检验:利用炉的取值推断分类变量X和y是否独立的方法称为必独立性检验,读作“卡方独立性检验”,简称独立性检验;(4)基于小概率值的检验规则:当222%时,我们就推断办不成立,即认为X和丫不独立,该推断犯错误的概率不超过防当时,我们没有充分证据推断Ho不成立,可以认为X和y独立(其中Xa为的临界值);(5)应用独立性检验解决实际问题的主要环节:提出零假设“0:X和y相互独立,并给出在问题中的解释;根据抽样数据整理出2X2列联表,计算犬的值,并与临界值Xa比较;根据检验规则得出推断结论;在X和Y不独立的情况下,根据需要,通过比较相应的频率,分析X和丫间的影响规律.(6)独立性检验中几个常用的小概率值和相应的临界值:a0.10.050.010.0050.001Xa2.7063.8416.6357.87910.8281 .下列判断正确的是()A分类变量中的变量与函数的变量是同一-概念.()B等高堆积条形图可初步分析两分类变量是否有关系,而独立性检验中炉取值则可通过统计表从数据上说明两分类变量的相关性的大小.()C独立性检验的方法就是用的反证法.()D/的大小是判断事件力与B是否相关的统计量.()【答案】BD2 .观察下面各等高堆积条形图,其中两个分类变量关系最强的是()【答案】B【解析】通过等高堆积条形图可知,选项B中川,力的差异最大,故两个分类变量关系最强.故选B.3 .(多选)若在研究吸烟与患肺癌的关系中,通过收集、整理、分析数据得“吸烟与患肺癌有关”的结论,并且有99%以上的把握认为这个结论是成立的,则下列说法中正确的是()A.在犯错误的概率不超过0.01的前提下,认为吸烟和患肺癌有关系B.1个人吸烟,那么这个人有99%的概率患有肺癌【答案】AD【解析】独立性检验的结论是一个统计量,统计的结果只是说明事件发生的可能性的大小,具体到一个个体,则不一定发生.4.下面是一个2×2列联表:XY合计yy2.Vla2173X2222547合计h46120则表中的“=,h=.【答案】5274【解析】.Z+21=73,=52.又+22=b,Z>=74.X,丫,由它们的样本数据计算得到z24.328,z2的部分临界值表如下:aXa则最大有的把握说变量X,Y有关系(填百分数).【答案】95%【解析】因为4.328>3841=x,所以在犯错误的概率不超过的前提下认为变量X,Y有关系.所以最大有95%的把握说变量X,丫有关系.考点一等高条形图例12018年12月28日,广州市地铁14号线开通,在一定程度上缓解从化到广州市区交通的拥堵,为了了解市民对地铁14号线开通的关注情况,某调查机构在地铁开通后的某两天抽取了部分乘坐地铁的市民作为样本,分析了其年龄和性别结构,并制作出如下等高条形图:根据图中(35岁以上含35岁)的信息,下列结论不一定正确的是()A.样本中男性比女性更关注地铁14号线开通B.样本中多数女性是35岁以上C.样本中35岁以下的男性人数比35岁以上的女性人数多D.样本中35岁以上的人对地铁14号线的开通的关注度更高【答案】C【分析】作出列联表,通过分析即可得出结论.【详解】由题意,做出等高条形图对应的列联表如下:35岁以上35岁以下总计男性aCa+c女性bdb+d总计a+bc+da+b+c+d根据第1个等高条形图可知,35岁以上男性比35岁以上女性多,即35岁以下男性比35岁以下女性多,即c>d根据第2个等高条形图可知,男性中35多以上的比35岁以下的多,即>c;女性中35岁以上的比35岁以下的多,即6>d.对于A,男性人数为+c,女性人数为人+d,因为a>b,e>d,所以+c>6+d,所以A正确;对于B,35岁以上女性人数为6,35岁以下女性人数为",因为6>d,所以B正确;对于C,35岁以下男性人数为35岁以上女性人数为6,无法从图中直接判断6与C的大小关系,所以C不一定正确;对于D,35岁以上的人数为+>,35岁以下的人数为c+d,因为>c,b>d,所以Q+b>c+d.所以D正确.故选:C.【对点演练1】(多选)根据如图所示的等高堆积条形图,下列叙述正确的是()A.吸烟患肺病的频率约为0.2B.吸烟不患肺病的频率约为0.8C.不吸烟患肺病的频率小于0.05D.吸烟与患肺病无关系【答案】ABC【解析】从等高堆积条形图上可以明显地看出,吸烟患肺病的频率远远大于不吸烟患肺病的频率.A、B、C都正确.【对点演练2】(2022下山东临沂高二统考期中)某校为研究该校学生性别与体育锻炼的经常性之间的联系,随机抽取100名学生(其中男生60名,女生40名),并绘制得到如图所示的等高堆积条形图,则这100名学生中经常锻炼的人数为.【答案】68【分析】根据等高堆积条形图进行数据分析,即可得到答案.【详解】由等高堆积条形图进行数据分析,这100名学生中经常锻炼的人数为:60×0.8+40×0.5=68.故答案为:68知识点二列联表例2.(2022下海南高二统考期末)为考查某种营养品对儿童身高增长的影响,用一部分儿童进行试验,根据100个有放回简单随机样本的数据,得到如下列联表:由表可知下列说法正确的是()身高合计有明显增长无明显增长食用该营养品a1050未食用该营养品b3050合计6040100参考公式:其中 = + b + c + d.2n(ad-hc)"(+b)(c+d)(+c)(b+d)参考数据:A. a = b = 30B.z2«12.667c.从样本中随机抽取1名儿童,抽到食用该营养品且身高有明显增长的儿童的概率是ID.根据小概率值a=0.001的独立性检验,可以认为该营养品对儿童身高增长有影响【答案】D【分析】根据列联表求出。、bf即可判断A,再计算出卡方,即可判断B、D,最后根据古典概型的概率公式判断C.【详解】解:由题可知。=50-10=40,6=50-30=20,所以A错误.10(40x30-10x20)16667>10828,所以根据小概率值=0.001的独立性检验,50×50×60×40可以认为该营养品对儿童身高增长有影响,所以B错误,D正确.从样本中随机抽取1名儿童,抽到食用该营养品且身高有明显增长的儿童的概率是七=,所以C错误.故选:D方法总结分类变量的两种统计表示形式(1)等高堆积条形图:根据等高堆积条形图的高度差判断两分类变量是否有关联及关联强弱;(2)2X2列联表:直接利用2X2列联表中的数据进行计算分析,用定量的方式判断两分类变量是否有关联及关联强弱.【对点演练1】(2023云南昆明校联考一模)考查棉花种子经过处理跟生病之间的关系得到如表数据:项目种子处理种子未处理总计得病32101133不得病192213405总计224314538根据以上数据,则()A.种子是否经过处理决定是否生病B.种子是否经过处理跟是否生病无关C.种子是否经过处理跟是否生病有关D.以上都是错误的【答案】C【分析】根据表格提供的数据作出判断.【详解】由列联表中的数据可知,种子经过处理,得病的比例明显降低,种子未经过处理,得病的比例要高些,所以可得结论:种子是否经过处理跟是否生病有关.故选:C【对点演练2】(2024高三课时练习)如表是一个2x2列联表,则表中6的值分别为()必y2合计a2173X?222547合计b46120A.94,72B.52,50C.52,74D.74,52【答案】C【分析】根据2x2列联表中的数据,即可求解.【详解】由题意,根据2x2列联表,可得=73-21=52,=a+22=52+22=74.故选:C.考点三独立性检验角度1独立性检验思想的辨析例3(2023上全国高三专题练习)下列关于独立性检验的说法正确的是()A.独立性检验是对两个变量是否具有线性相关关系的一种检验B.独立性检验可以100%确定两个变量之间是否具有某种关系C.利用/独立性检验推断吸烟与患肺病的关联中,根据小概率值。=0.01的独立性检验,认为吸烟与患肺病有关系时,则我们可以说在100个吸烟的人中,有99人患肺病D.对于独立性检验,随机变量/的值越小,判定"两变量有关系”犯错误的概率越大【答案】D【分析】根据独立性检验的意义分别判断各选项.【详解】对于A,独立性检验是通过卡方计算来判断两个变量存在关联的可能性的一种方法,并非检验二者是否是线性相关,故错误;对于B,独立性检验并不能100%确定两个变量相关,故错误;对于C,99%是指"抽烟"和"患肺病”存在关联的可能性,并非抽烟人中患肺病的发病率,故错误;对于D,根据卡方计算的定义可知该选项正确;故选:D.【对点演练1】(2022上广东东莞高三校考阶段练习)根据分类变量X与V的观测数据,计算得到/=3.974.依据=0.05的独立性检验,结论为()a0.10.050.010.0050.001a2.7063.8416.6357.87910.828A.变量X与N不独立,这个结论犯错误的概率不超过0.01B.变量X与N不独立,这个结论犯错误的概率不超过005C.变量X与N独立,这个结论犯错误的概率不超过0.05D.变量X与N独立,这个结论犯错误的概率不超过0.01【答案】B【分析】根据a=005找出对应的4的值,并比较/与卡方值得大小,进而由卡法的定义推出相应结论即可.【详解】因为=0.05时/=3.841,所以/=3.974>%=3.

    注意事项

    本文(第04讲列联表与独立性检验(解析版).docx)为本站会员(王**)主动上传,优知文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知优知文库(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    copyright@ 2008-2023 yzwku网站版权所有

    经营许可证编号:宁ICP备2022001189号-2

    本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。优知文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知优知文库网,我们立即给予删除!

    收起
    展开