第1题
A.基于网络的数据访问流量迅速增长
B.相对于网络技术的发展,服务器处理速度和内存访问速度的增长却远远低于网络带宽和应用服务的增长
C.大部分网站(尤其电子商务等网站)都需要提供不间断24小时服务
D.单机模式不会成为网络故障点
第4题
此题为判断题(对,错)。
第6题
B.大规模并行计算:在分布式并行环境中将一个任务分解成更多份细粒度的子任务,这些子任务在空闲的处理节点之间被调度和快速处理之后,最终通过特定的规则进行合并生成最终的结果。典型技术为MapReduce
C.结构化分布式数据存储:类似文件系统采用数据库来存储结构化数据,云计算也需要采用特殊技术实现结构化数据存储,典型技术为BigTable/Dynamo等
D.分布式文件系统:可扩展的支持海量数据的分布式文件系统,用于大型的、分布式的、对大量数据进行访问的应用。它运行于廉价的普通硬件上,提供容错功能(通常保留数据的3份拷贝),典型技术为GFS/HDFS/KFS等
第7题
A.Hive:一个基于Hadoop的数据仓库工具,用于对Hadoop文件中的数据集进行数据整理、特殊查询和分析存储
B.Zookeeper:针对谷歌Chubby的一个开源实现,是高效可靠的协同工作系统
C.HDFS:分布式文件系统,是Hadoop项目的两大核心之一,是谷歌GFS的开源实现
D.HBase:提供高可靠性、高性能、分布式的行式数据库,是谷歌BigTable的开源实现
第10题
A.NoSQL数据库因为不受schema的限制,可以获得比传统关系型数据库更好的读写性能,因此,所有应用都可以使用NoSQL数据库替代关系型数据库。
B.NoSQL数据库类型可以分为键值型NoSQL数据库,文档型NoSQL数据库,列存储型NoSQL数据库和图NoSQL数据库
C.Redis是单纯的内存数据库,不提供数据持久化功能,因此可靠性很低。
D.Spark分布式计算框架可以支持多种计算模式,包括批处理、流处理和SQL查询。