南开大学《大数据导论》20春期末考核(答案).docx

上传人:scccc 文档编号:12935880 上传时间:2021-12-07 格式:DOCX 页数:8 大小:18.38KB
返回 下载 相关 举报
南开大学《大数据导论》20春期末考核(答案).docx_第1页
第1页 / 共8页
南开大学《大数据导论》20春期末考核(答案).docx_第2页
第2页 / 共8页
南开大学《大数据导论》20春期末考核(答案).docx_第3页
第3页 / 共8页
南开大学《大数据导论》20春期末考核(答案).docx_第4页
第4页 / 共8页
南开大学《大数据导论》20春期末考核(答案).docx_第5页
第5页 / 共8页
点击查看更多>>
资源描述

《南开大学《大数据导论》20春期末考核(答案).docx》由会员分享,可在线阅读,更多相关《南开大学《大数据导论》20春期末考核(答案).docx(8页珍藏版)》请在三一文库上搜索。

1、南开大学大数据导论20春期末考核(答案)大数据的特点不包含()A.数据体量大B.价值密度高C.处理速度快D.数据不统一PaaS是()的简称A.软件即服务B.平台即服务C.基础设施即服务D.硬件即服务IaaS是()的简称A.软件即服务B.平台即服务C.基础设施即服务D.硬件即服务购物篮问题是()的典型案例A.数据变换B.关联规则挖掘C.数据分类基础设施即服务的英文简称是()A.IaaSB.PaaSC.SaaS数据清洗的方法不包括()A.缺失值处理B.噪声数据清除C.一致性检查D.重复数据记录处理以下哪项不是数据可视化工具的特性()A.实时性B.简单操作C.更丰富的展现D.仅需一种数据支持方式即可

2、下列哪个工具常用来开发移动友好地交互地图()A.LeafletB.Visual.lyC.Pizza Pie ChartsD.GephiSAN是一种()A.存储设备B.专为数据存储而设计构建的网络C.光纤交换机D.HBAGFS中的文件切分成()的块进行存储A.32MBB.64MBC.128MBD.1G数据预处理的过程主要是()A.数据清洗B.数据集成C.数据变换D.数据规约大数据时代预测人类移动行为的数据特点是()A.多样化B.数据量大C.维数高D.变化快下列属于传统统计学展示方法的是()A.柱状图B.饼状图C.曲线图D.网络图百度大数据引擎主要包含三大组件()A.开放云B.数据工厂C.百度大脑

3、去除噪声使得数据光滑的技术主要有:()A.分箱B.回归C.离群点分析大数据存储的特点与挑战有()A.容量问题B.延迟问题C.安全问题D.成本问题大数据在医疗中的应用有()A.流行性疾病预防B.慢性病健康管理C.临床决策支持D.医疗器械研发医疗大数据的来源主要包括()A.制药企业/生命科学B.临床医疗/实验室数据C.费用报销/利用率D.健康管理/社交网络数据分析的类型根据数据分析深度可以分为()A.描述性分析B.预测性分析C.规则性分析数据处理的两种方法是(),()A.批处理B.流处理C.单个处理D.交叉处理所有关系型数据中的数据全部为结构化数据。半结构化数据就是介于完全结构化数据和完全无结构化

4、的数据之间的数据。()A.正确B.错误关联分析是从有噪声的、模糊的、随机的海量数据中,挖掘出隐藏的、事先不知道、但是有潜在关联的信息或知识的过程。()A.正确B.错误数据的大量聚集,使得黑客一次成功的攻击能够获得更多的数据,无形中降低了黑客的进攻成本,增加了“收益率”。()A.正确B.错误数据隐私和安全是大数据发展面临的挑战。()A.正确B.错误用户可以感知不同属性之间的相关性,过滤掉噪声和不相关的轨迹,用于进一步调查有趣的案例。分析人员可以交互式地逐步优化设置以改进结果。()A.正确B.错误在未来掘金社交数据的道路上,一方面要为用户提供更加精准便捷的良好服务,另一方面也要注重对用户隐私的保护

5、。只有符合用户需求和用户安全的商业利益,才能成为可持续的商业利益。()A.正确B.错误频繁项集的子集是频繁项集,非频繁项集的超集是非频繁项集。()A.正确B.错误Twitter作为主流社交网络平台,不仅仅是一个海量公共数据集,它还是一个带有时间刻度的海量公共数据集用于捕捉特定时间中(在一些情况下,也是在特定空间中)数百万人关于所有主题事项的想法。()A.正确B.错误Spark的亮点是充分利用内存承载工作集,而且能保证容错。()A.正确B.错误Apriori算法扫描数据库的次数等于最大频繁项集的项数。()A.正确B.错误高质量的数据是能够满足应用需求的数据。()A.正确B.错误离群点检测的任务是

6、识别特征显著不同于其他数据的观测值。()A.正确B.错误数据分析是大数据发展面临的挑战。()A.正确B.错误百度地图春节人口迂徙大数据在业界首次实现了全程、动态、即时直观地展现中国春节前后人口大迁徙的轨迹与特征。()A.正确B.错误用一个函数拟合数据来光滑数据称为回归。()A.正确B.错误简述云计算的体系架构分层及每层的含义。简述数据可视化的流程和步骤。聚类分析(名词解释)云存储(名词解释)NoSQL(名词解释) 参考答案:D参考答案:B参考答案:C参考答案:B参考答案:A参考答案:D参考答案:D参考答案:A参考答案:B参考答案:B参考答案:ABCD参考答案:BCD参考答案:ABC参考答案:A

7、BC参考答案:ABC参考答案:ABCD参考答案:ABCD参考答案:ABCD参考答案:ABC参考答案:AB参考答案:A参考答案:A参考答案:A参考答案:A参考答案:A参考答案:A参考答案:A参考答案:A参考答案:A参考答案:A参考答案:A参考答案:A参考答案:A参考答案:A参考答案:A参考答案:云计算可以按需提供弹性资源,它的表现形式是一系列服务的集合。结合当前云计算的应用与研究,其体系架构可分为核心服务、服务管理、用户访问接口三层。1)核心服务层将硬件基础设施、软件运行环境、应用程序抽象成服务,这些服务具有可靠性强、可用性高、规模可伸缩等特点,满足多样化的应用需求。2)服务管理层为核心服务提供

8、支持,进一步确保核心服务的可靠性、可用性与安全性。3)用户访问接口层实现端到云的访问。参考答案:数据可视化是对数据的综合运用,其操作包括数据获取、数据处理、可视化模式和可视化应用4个步骤。1)数据获取数据获取的形式多种多样,大致可以分为主动式和被动式两种。主动式获取是以明确的数据需求为目的,利用相关技术手段主动采集相关数据,如卫星影像、测绘工程等;被动式获取是以数据平台为基础,由数据平台的活动者提供数据来源,如电子商务网站、网络论坛等。2)数据处理数据处理是指对原始的数据进行分析、预处理和计算等步骤。数据处理的目标是保证数据的准确性、可用性等。3)可视化模式可视化模式是数据的一种特殊展现形式,

9、常见的可视化模式有标签云、序列分析、网络结构、电子地图等。可视化模式的选取决定了可视化方案的雏形。4)可视化应用可视化应用主要根据用户的主观需求展开,最主要的应用方式是用来观察和展示,通过观察和人脑分析进行推理和认知,辅助人们发现新知识或者得到新结论。可视化界面也可以帮助人们进行人与数据的交互,辅助人们完成对数据的迭代计算,通过若干步,数据的计算实验,生产系列化的可视化成果。参考答案:聚类分析(Cluster rnanalysis)简称聚类(Clustering),是把数据对象划分成子集(类)的过程,每个子集称为一个簇(Cluster),同一个簇中的数据之间存在最大相似性,不同簇之间的数据间存在最大的差异性。参考答案:云存储是在云计算(cloud rncomputing)概念上延伸和发展出来的一个新的概念,是一种新兴的网络存储技术。它是云计算的重要组成部分,也是云计算的重要应用之一。云存储是指通过集群应用、网络技术或分布式文件系统等功能,将网络中大量各种不同类型的存储设备通过应用软件集合起来协同工作,共同对外提供数据存储和业务访问功能的一个系统。参考答案:NoSQL是泛指非关系型、分布式和不提供ACID的数据库,它不是单纯地反对关系型数据库,而是强调键值存储和文档数据库的优点。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 社会民生


经营许可证编号:宁ICP备18001539号-1