A.数据处理框架(MapReduce),集群管理(YARN),分布管理控制(ZooKeeper)
B.Spark高效数据处理架构
C.安全管理组件
D.Hadoop的客户端
A.访问单一文件系统时,用户需要关注特定的数据存储位置
B.在系统启动时自动创建一个统一的文件系统
C.在单一文件系统中,文件集合以目录方式呈现
D.系统提供了一个统一的文件系统,用于访问所有可用空间
A.11
B.21
C.31
D.41
B.大规模并行计算:在分布式并行环境中将一个任务分解成更多份细粒度的子任务,这些子任务在空闲的处理节点之间被调度和快速处理之后,最终通过特定的规则进行合并生成最终的结果。典型技术为MapReduce
C.结构化分布式数据存储:类似文件系统采用数据库来存储结构化数据,云计算也需要采用特殊技术实现结构化数据存储,典型技术为BigTable/Dynamo等
D.分布式文件系统:可扩展的支持海量数据的分布式文件系统,用于大型的、分布式的、对大量数据进行访问的应用。它运行于廉价的普通硬件上,提供容错功能(通常保留数据的3份拷贝),典型技术为GFS/HDFS/KFS等
A.自研分布式文件系统OceanStorDFS支持海量非结构化数据存储,实现全局统命名空间。
B.提供对象存储服务,兼容AmazonS3接口、兼容OpenStackSwift接口。
C.支持对接由开源Hadoop组件封装而来的FusionInsightHadoop/ClouderaHadoop,让用户轻松构建企业级大数据分析平台。
D.分布的元数据管理,支持3~4000个节点的线性扩展。
A.分布的元数据管理,支持3~4000个节点的线性扩展。
B.自研分布式文件系统OceanStorDFS支持海量非结构化数据存储,实现全局统一命名空间。
C.提供对象存储服务,兼容AmazonS3接口、兼容OpenStackSwift接口。
D.支持对接由开源Hadoop组件封装而来的FusionInsightHadoop/ClouderaHadoop,让用户轻松构建企业级大数据分析平台。