![](https://static.youtibao.com/asksite/comm/h5/images/m_q_title.png)
[多选题]
下列关于spark中的RDD描述正确的有()。
A.RDD(ResilientDistributedDataset)叫做弹性分布式数据集,是spark中最基本的数据抽象;
B.Resilient:表示弹性的;
C.Destributed:分布式,可以并行在集群计算;
D.Dataset:就是一个集合,用于存放数据的;
查看答案
![](https://static.youtibao.com/asksite/comm/h5/images/solist_ts.png)
A.RDD(ResilientDistributedDataset)叫做弹性分布式数据集,是spark中最基本的数据抽象;
B.Resilient:表示弹性的;
C.Destributed:分布式,可以并行在集群计算;
D.Dataset:就是一个集合,用于存放数据的;
A.RDD具有血统机制(Lineage)
B.RDD默认存储在磁盘
C.RDD是一个只读的,可分区的分布式数据集
D.RDD是Spark对基础数据的抽象
A.[0,numPartitions]
B.[0,numPartitions-1]
C.[1,numPartitions-1]
D.[1,numPartitions]
A.dataframe是指定列名称的dataset
B.dataframe提供详细的结构信息
C.dataframe不是面向对象的
D.dataframe在序列化与反序列化时,要对数据和数据结构进行序列化
A.只要有一个HiveServer不可用,整个Hive集群便不可用
B.MotaStore用于提供元数据服务,依赖于DBService
C.在同一时间点、HiveServer只要一个处于Active状态,另一个则处于Standby状态
D.HiveServer负责接收客户端请求.解析.执行HQL命令并返回查询结果