题目内容
(请给出正确答案)
[主观题]
MapReduce中输入数据或计算量非常大,造成作业用时太长,调优哪项参数?()
A.map.task.timeout
B.mapreduce.task.timeout
C.reduce.task.timeout
D.yarn.task.timeout
答案
查看答案
A.map.task.timeout
B.mapreduce.task.timeout
C.reduce.task.timeout
D.yarn.task.timeout
第1题
A.表
B.视图
C.资源
D.项目空间
第2题
A.一个reduce的输入数据可能来自于多个map的输出
B.一个MR处理可以不包括任何map
C.一个MR处理可以不包括任何reduce
D.一个map的输出结果可能会被分配到多个reduce上去
第4题
A.将数据进行拆分
B.对映射后的数据进行排序,然后输入到Reducer
C.经过映射后的输出数据会被排序,然后每个映射器会进行分区
D.通过实现自定义的Partitioner来指定哪些数据进入哪个Reducer
第5题
A.冲程
B.冲次
C.平衡状态
D.节能状态
第6题
A.Hadoop不仅可以运行在企业内部的集群中,也可以运行在云计算环境中
B.Hadoop被视为事实上的大数据处理标准
C.Hadoop为海量数据提供存储的HDFS和对数据进行计算的MapReduce
D.Hadoop提供整个HDFS文件系统的命名空间管理,块管理等所有服务
第10题
A.输入的文件尽量使用大文件
B.合理的分配map和reduce的任务的数量
C.压缩中间数据,减少1/0
D.在map之后先进行bine处理,减少1/0