欢迎来到优知文库! | 帮助中心 分享价值,成长自我!
优知文库
全部分类
  • 幼儿/小学教育>
  • 中学教育>
  • 高等教育>
  • 研究生考试>
  • 外语学习>
  • 资格/认证考试>
  • 论文>
  • IT计算机>
  • 法律/法学>
  • 建筑/环境>
  • 通信/电子>
  • 医学/心理学>
  • ImageVerifierCode 换一换
    首页 优知文库 > 资源分类 > DOCX文档下载
    分享到微信 分享到微博 分享到QQ空间

    大数据技术导论期末复习题2023-5(附参考答案).docx

    • 资源ID:924578       资源大小:103.83KB        全文页数:92页
    • 资源格式: DOCX        下载积分:9金币
    快捷下载 游客一键下载
    账号登录下载
    微信登录下载
    三方登录下载: QQ登录
    二维码
    扫码关注公众号登录
    下载资源需要9金币
    邮箱/手机:
    温馨提示:
    快捷下载时,如果您不填写信息,系统将为您自动创建临时账号,适用于临时下载。
    如果您填写信息,用户名和密码都是您填写的【邮箱或者手机号】(系统自动生成),方便查询和重复下载。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP,免费下载
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    大数据技术导论期末复习题2023-5(附参考答案).docx

    一、选择题1可视分析是一种O?A.交互式用户界面模型B.结构化用户界面模型cl非结构化用户界面模型D.1独立式用户界面模型【答案】A2数据科学的研究对象是O?A.药品成分B.1文学作品C.数据界的数据D.人类历史【答案】C3下面不是研究数据方法的是O?A.统计学B.机器学习C.心理分析D.数据挖掘【答案】C4下面是数据科学的主要研究内容的是O?A.数据泄露B.数据交易C数据盗窃D.数据分析【答案】D卜面不是数据产品开发的特征的是O?A.多样性B.无竞争性(Cl增值性D.层次性【答案】B下面不属于互联网大数据的是O?A.视频B.图片cl音频D.心情【答案】D下面不属于大数据的特性是O?A.数据量大B.多样性1.c.真实性差D.具有价值【答案】C下面属于结构化数据的是O?A.表格数据B.图形C.1图像D.HTML文档【答案】A下面不属于大数据的处理过程的是O?A.数据获取、储存B.数据清洗c.1数据分析D.)数据安全【答案】D10下面不属于大数据离线处理特点的是O?A.数据保存时间短B.数据不会发生改变C.可进行复杂的批量计算D.方便查询计算结果【答案】A11下面不属于大数据处理模式的是O?A.离线处理B.在线处理cl手动计算D.1交互处理【答案】C12下面仅属于大数据在线处理模式的是O?A.批量计算【B.】流式计算cl手动计算D.交互处理【答案】B13下面不属于流式数据源的是O?A.硬盘数据B.传感器数据1.c.图像数据D.流媒体传输【答案】A下面不属于流式数据的特点的是O?A.实时性B.1层次性cl易失性D.突发性【答案】B15下面不属于大数据计算模式的类型的是O?A.批量计算B.手动计算C.1流式计算D.交互式计算【答案】B16下面不属于数据流技术应用的方式是O?(A.指定查询B.模糊查询C.)即席计算D.中间计算【答案】B17下面不属于判断大数据应用成功的指标是O?A.创造价值B.具备高速度c.1在本质上提高【D.】低性能【答案】D18基于任务的定义和分类,下列不属于可视分析关注点的是O?A.以用户价值为关注点B.以用户意图为关注点(Cl以同户行为为关注点D.以软件操作为关注点【答案】A19下面不属于企业大数据应用成功的考虑因素是O?A.成本B.客户满意度C.附加收益D.工人满意度【答案】D20下面不属于大数据在通讯行业的应用是O?A.预测客户行为B.1市场监控cl智能电表D.市场预警【答案】C21MaPRedUCe以什么方式进行分布式计算()?A.文本B.函数cl数据集D.矩阵【答案】B22在HadooP中,将每一次计算请求称为一个()?A.文本B.1函数cl数据集D.作业【答案】D23在HadOOP中,将每个作业拆分为若干个O?A.文本B.Map任务cl数据集D.RedUCe任务【答案】B24在Had。P中,作业服务器被称为()?A.JobB.MapC.MasterD.Reduce【答案】C25下列不属于一个作业的计算流程的是O?A.作业开始【B.】作业修改C.Map任务分配D.RedUCe任务执行【答案】B26下列不属于MaP任务的执行的子步骤的是O?A.输入准备B.输入修改cl算法执行D.输出生成【答案】B在MaPRedUCe模型编程中,不属于其步骤的是O?A.遍历数据B.映射键值C.数据分组D.数据插补【答案】D28Hadoop的核心是()和MapReduce0A.NTFSB.GFSC.HDFSD.FS【答案】C29下列不属于单词计数的MaP过程的是O?A.按列分割文件B.分词处理cl按行分割文件D.排序与合并【答案】A30WordCount完成的功能是统计()?A.按列分割文件数B.输入文件中单词频数cl按行分割文件数D.输入文件中单词频率【答案】B31HadooP开发环境部署内容不包括O?A.安装SSH协议B.HadooP系统部署【C.】伪分布式HadOOP环境部署(D.J电脑断网【答案】D32Reduce任务目标是()?A.输入文件B.输入数据cl输入图表【D.】将若干个M叩任务生成的中间文件汇总到最后的输出文件【答案】D33HadOOP作业服务器不负责O?A.接受用户提交的作业B.任务的分配cl执行具体的任务D.管理所有的任务服务器【答案】C34下列不属于文本数据语义特征的是O?A.词频B.逻辑结构C.1动态演化规律D.数据结构【答案】D35文本数据是典型的O?A.结构化数据B.半结构化数据C.非结构化数据D.混合结构数据【答案】CMapReduce模型将数据集的大规模操作分发给网络上的各节点,每个节点将已完成的工作和状态更新,周期性地报告给()。A.作业B.任务C.)作业服务器D.任务服务器【答案】C37MaPRedUCe模型的最大优点体现在()?A.输入方便B.分布式处理cl各类型数据输入D.算法简单【答案】B38MapReduce模型适用场景的特点()?A.数据可实时处理B.1任务不可分解C.任务可分解D.任务需要顺序执行【答案】C39MapReduce将计算过程分解的最大好处是()?A.复杂化B.快捷化cl并行化【D.】低成本【答案】CF列不属于MaPRedUCe模型的限制因素的是O?【A任务要求BJ数据不可无限分割(Cl通信开销D.集群规模【答案】A41下列不属于信息可视化的分类的是O?A.一维信息可视化B.三维信息可视化cl截面数据可视化D.1时序信息可视化【答案】C42下列属于传统数据获取的特点的是O?A.数据源多种多样B.1数据量巨大(C.)结构单一D.结构化、半结构化和非结构化数据【答案】C43下列不属于大数据获取的特点的是O?A.数据源多种多样B.数据量巨大(C.结构单一D.结构化、半结构化和非结构化数据【答案】C44下列属于大数据获取的特点的是O?A.数据源单一B.数据量较小(Cl结构单一D.包括结构化、半结构化和非结构化数据【答案】D45气泡图由什么演化而来是O?A.直方图B.条形图cl散点图D.1折线图【答案】C46下列不属于文本数据的是O?A.广告B.1音频C杂志D.图书【答案】B47下列不属于文本数据的获取特点的是()?A.灵活度高B.速度快cl按需获取D.易处理【答案】D48下列属于意见建议类用户反馈的特点的是O?A.反馈量大B.反馈速度快C.针对性强D.传播快【答案】C卜列不属于空间数据的特性的是O?A.定位B.定量(cl定性D.时空关系【答案】B50下列不属于网站内部数据库中的数据的是O?A.用户信息数据B.野外实测数据C网站产品数据D.网站运营数据【答案】B51下列不属于网站数据采集的数据的是()?A.非结构化数据B.半结构化数据cl结构化数据D.实验测试数据【答案】D52下列不属于网络爬虫工作过程的是O?A.获取网页【B.】修改网页C解析网页【D.】储存数据【答案】B卜.列不属于通用网络爬虫的特点及要求的是O?A.数量巨大B.范围较小(cl存储空间要大D.爬行速度要快【答案】B54下列不属于通用网络爬虫的结构的是O?A.页面爬行模块B.页面分析模块C.页面数据库D.页面修改模块【答案】D55下列不属于网页的爬虫策略的是O?A.深度优先搜索策略B.精确选择搜索策略cl广度优先搜索策略D.最佳优先搜索策略【答案】B56下列不属于通用网络爬虫的局限性的是O?A.无用网页较多B.对非结构化数据获取相对容易C.难以支持基于语义信息的查询D.有限的网络爬虫服务器资源与无限的网络数据资源之间的冲突【答案】B57下列属于聚焦网络爬虫的特点的是O?A.数量巨大B.范围较大cl精准筛选D.爬行速度慢【答案】C58下列属于浅聚焦网络爬虫的核心特点的是O?A.数量巨大B.范围较大C.精准筛选D.选定URL种子【答案】D59下列不属于爬虫对抓取目标的定义原则的是O?A.目标网页特征B.目标数据量cl目标数据模式D.领域概念【答案】B60下列不属于网络爬虫的数据抓取方式的是O?A.预先给定的初始抓取种子样本B.预先给定的网页分类目录和与分类目录对应的种子样本C.通过用户行为确定的抓取目标样例D.自行编写种子样本【答案】D61下列不属于NOSQL数据库的特点的是O?A.需预定义数据模型B.支持透明横向扩展cl将数据进行分区D.1保证最终一致性【答案】A下列不属于NOSQL数据库的存储方式的是O?A.行式存储B.键值式存储C.图形式存储D.文档式存储【答案】A63下列不属于NOSQL数据库的键值式存储的常见形式的是O?A.临时型【B.】附加型cl混合型D.永久型【答案】B64下列不属于数据库架构混合应用模式的是O?A.OldSQL+NewSQL混合模式B.OIdSQL+NoSQL+NeWSQL混合模式ClOIdSQL+NoSQL混合模式D.NewSQL+NOSQL混合模式【答案】B65下列不属于大数据抽取方式的是O?A.同构同质数据抽取B.异构同质数据抽取cl同构异质数据抽取D.文件型数据抽取【答案】B下列不属于增

    注意事项

    本文(大数据技术导论期末复习题2023-5(附参考答案).docx)为本站会员(王**)主动上传,优知文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知优知文库(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    copyright@ 2008-2023 yzwku网站版权所有

    经营许可证编号:宁ICP备2022001189号-2

    本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。优知文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知优知文库网,我们立即给予删除!

    收起
    展开