大数据时代下的数据挖掘试题及答案.docx
《大数据时代下的数据挖掘试题及答案.docx》由会员分享,可在线阅读,更多相关《大数据时代下的数据挖掘试题及答案.docx(27页珍藏版)》请在优知文库上搜索。
1、?海量数据挖掘技术及工程实践?题目一、单项选择题(共80题)1)(D)的目的缩小数据的取值范围,使其更适合于数据挖掘算法的需要,并且能够得到和原始数据相同的分析结果.A.数据清洗B.数据集成C.数据变换D.数据归约2)某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购置尿布,这种属于数据挖掘的哪类问题(八)3) A.关联规那么发现B.聚类4) C,分类D.自然语言处理5)以下两种描述分别对应哪两种对分类算法的评价标准(八)6) (a)警察抓小偷,描述警察抓的人中有多少个是小偷的标准.7) (b)描述有多少比例的小偷给警察抓了的标准.8) A.Precision,RecallB.Recall
2、,Precision9) A.PrecisionzROCD.RecaIIzROC10)将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务(C)11)A.频繁模式挖掘B.分类和预测C.数据预处理D.数据流挖掘12)当不知道数据所带标签时,可以使用哪种技术促使带同类标签的数据与带其他标签的数据相别离(B)13)A.分类B.聚类C.关联分析D.隐马尔可夫链14)建立一个模型,通过这个模型根据的变量值来预测其他某个变量值属于数据挖掘的哪一类任务(C)15) A.根据内容检索B.建模描述16) C.预测建模D.寻找模式和规那么17)下面哪种不属于数据预处理的方法(D)18)A.变量代换B
3、.离散化C.聚集D估计遗漏值19)假设12个销售价格记录组已经排序如下:5,10,11,13,15,35,50,55,72,92,204,215使用如下每种方法将它们划分成四个箱.等频(等深)划分时,15在第几个箱子内(B)20)A.第一个B.第二个C第三个D.第四个21)下面哪个不属于数据的属性类型:(D)22)A标称B.序数C.区间口相异23)只有非零值才重要的二元属性被称作:(C)24)A.计数属性B.离散属性C.非对称的二元属性D.对称属性25)以下哪种方法不属于特征选择的标准方法:(D)26)八.嵌入B.过滤C.包装口抽样27)下面不属于创立新属性的相关方法的是:(B)28)A.特征
4、提取B.特征修改C.映射数据到新的空间D.特征构造29)下面哪个属于映射数据到新的空间的方法(八)30)A.傅立叶变换B.特征加权C.渐进抽样D.维归约31)假设属性income的最大最小值分别是12000元和98000元.利用最大最小标准化的方法将属性的值映射到0至1的范围内.对属性income的73600元将被转化为:(D)32)33)一所大学内的各年纪人数分别为:一年级200人,二年级160人,三年级130人,四年级110人.那么年级属性的众数是:(八)34)A.一年级B.二年级C三年级D.四年级35)以下哪个不是专门用于可视化时间空间数据的技术:(B)B.饼图36)A.等图线图C.曲面
5、图D.矢量场图37)在抽样方法中,当适宜的样本容量很难确定时,可以使用的抽样方法是:(D)38)A.有放回的简单随机抽样B.无放回的简单随机抽样C.分层抽样D渐进抽样39)数据仓库是随着时间变化的,下面的描述不正确的选项是(C)40) A.数据仓库随时间的变化不断增加新的数据内容41) B.捕捉到的新数据会覆盖原来的快照42) C.数据仓库随事件变化不断删去旧的数据内容43) D.数据仓库中包含大量的综合数据,这些综合数据会随着时间的变化不断地进行重新综合44)下面关于数据粒度的描述不正确的选项是:(C)45) A.粒度是指数据仓库小数据单元的详细程度和级别46) B.数据越详细,粒度就越小,
6、级别也就越高47) C.数据综合度越高,粒度也就越大,级别也就越高48) D.粒度的具体划分将直接影响数据仓库中的数据量以及查询质量49)有关数据仓库的开发特点,不正确的描述是:(八)50) A.数据仓库开发要从数据出发51) B.数据仓库使用的需求在开发出去就要明确52) C.数据仓库的开发是一个不断循环的过程,是启发式的开发53) D.在数据仓库环境中,并不存在操作型环境中所固定的和较确切的处理流,数据仓库中数据分析和处理更灵活,且没有固定的模式54)关于OLAP的特性,下面正确的选项是:(D)55) (1)快速性(2)可分析性多维性信息性共享性56) A.(2)57) B.(2)58)
7、C.59) D.(2)60)关于OLAP和OLTP的区别描述,不正确的选项是:(C)61)主要是关于如何理解聚集的大量不同的数据.它与OTAP应用程序不同62)B.与OLAP应用程序不同QLTP应用程序包含大量相对简单的事务63)的特点在于事务量大,但事务内容比拟简单且重复率高64)是以数据仓库为根底的,但其最终数据来源与OLTP一样均来自底层的数据库系统,两者面对的用户是相同的65)关于OLAP和OLTP的说法,以下不正确的选项是:CA)66)事务量大,但事务内容比拟简单且重复率高67)的最终数据来源与OLTP不一样68)面对的是决策人员和高层治理人员69)以应用为核心,是应用驱动的70)设
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 时代 挖掘 试题 答案
