关于Hadoop Map Reduce,以下描述中正确的是()。
A.reduce()函数的输入是value集
B.reduce()函数将最终结果写到HDFS系统中
C.用户可以自己定义reduce()函数
D.reduce()函数的输入数据是经过map()函数处理之后的数据
A.reduce()函数的输入是value集
B.reduce()函数将最终结果写到HDFS系统中
C.用户可以自己定义reduce()函数
D.reduce()函数的输入数据是经过map()函数处理之后的数据
A.600600
B.3000600
C.3000300
D.300300
A.Map/Reduce把待处理的数据集分割成许多大的数据块
B.大数据块经Map()函数并行处理后输出新的中间结果
C.reduce()函数把多任务处理后的中间结果进行汇总
D.reduce阶段的作用接受来自输出列表的迭代器
A.合并value值,形成较小集合
B.采用迭代器将中间值提供给reduce函数
C.map()函数处理后结果才会传输给reduce()
D.内存中不会存储大量的value值
A.sqoop可以将HQL/SQL的执行结果导入到Oracle或者Hive
B.不能大于1M
C.sqoop使用参数-m(即--num-mappers)进行导数时,分布在每一个map上的数据是均匀的
D.sqoop将数据导入Oracle时遇到值的长度超长,sqoop会继续将正常的数据导入Oracle
A.io.sort.mb
B.mapred.compress.map.output
C.mapred.map.output.compression.codec
D.io.sort.spill.percent
A.<"hello",1,1>、<"hadoop",1>和<"world",1>
B.<"hello",2>、<"hadoop",1>和<"world",1>
C.<"hello",<1,1>>、<"hadoop",1>和<"world",1>
D.<"hello",1>、<"hello",1>、<"hadoop",1>和<"world",1>