题目内容
(请给出正确答案)
[判断题]
数据挖掘是指从大型数据库或数据仓库中提取隐含的、未知的、非平凡的及有潜在应用价值的信息或
答案
查看答案
第4题
A.数据采集是通过传感器、移动互联网、观测设备等获得种多类型的海量数据
B.数据预处理是数据分析和挖掘的基础,是将接收数据进行抽取、清洗、转换、归约等并最终加载到数据存储中的过程
C.数据存储过程需要将采集到的数据进行存储管理,在大数据场景下,只能使用非关系型数据库进行存储
D.数据分析是指利用相关数学模型以及机器学习算法对数据进行统计、预测和文本分析。数据的主要分析方法有探索性数据分析方法、描述统计法、数据可视化等
第8题
A.Hive:一个基于Hadoop的数据仓库工具,用于对Hadoop文件中的数据集进行数据整理、特殊查询和分析存储
B.Zookeeper:针对谷歌Chubby的一个开源实现,是高效可靠的协同工作系统
C.HDFS:分布式文件系统,是Hadoop项目的两大核心之一,是谷歌GFS的开源实现
D.HBase:提供高可靠性、高性能、分布式的行式数据库,是谷歌BigTable的开源实现
第9题
A.云数据迁移服务CDM
B.实时流计算CS
C.数据仓库服务DWS
D.表格存储服务CloudTable
第10题
B.OMPP系统可共享资源,所以在决策支持和数据挖掘方面显示了优势
C.MPP系统因为要在不同处理单元之间传送信息,它的效率要比SPP要差一点
D.以上都不对