A.主控程序Nimbus
B.集群调度器Zookeeper
C.工作节点控制程序Supervisor
D.工作进程Worker
A.分布式文件存储系统(HDFS)
B.分布式计算框架(MapReduce)
C.分布式资源调度系统(Yarn)
D.数据处理方法(DPW)
A.HadoopYARN的目的是使得Hadoop数据处理能力超越HDFS
B.HadoopMapReduce也是YARN上的一个应用
C.YARN的另一个目标就是拓展Hadoop
D.有了YARN各种应用就可以互不干扰地运行在同一个Hadoop系统中
A.HDFS是Hadoop技术体系中数据管理的基础,是一个高容错的系统,能检测和应对硬件故障
B.Sqoop数据同步工具,它是SQL TO Hadoop的缩写,主要用于关系型数据库和Hadoop之间的数据传输
C.Sqoop数据导入和导出本质上还是一个MapRuduce程序,充分利用了MapRuduce的并行化和容错性
D.Kafka主要用于处理活跃的流式数据,在web网站上非常常见,包括网站的pageview