A.RDD具有血统机制(Lineage)
B.RDD默认存储在磁盘
C.RDD是一个只读的,可分区的分布式数据集
D.RDD是Spark对基础数据的抽象
A.RDD(ResilientDistributedDataset)叫做弹性分布式数据集,是spark中最基本的数据抽象;
B.Resilient:表示弹性的;
C.Destributed:分布式,可以并行在集群计算;
D.Dataset:就是一个集合,用于存放数据的;
A.[0,numPartitions]
B.[0,numPartitions-1]
C.[1,numPartitions-1]
D.[1,numPartitions]
A.项目管理的时间范畴通常指项目的全寿命周期
B.项目实施期管理的主要任务是通过管理使项目的目标得以实现
C.费用目标对业主而言是投资目标
D.费用目标对施工方而言是成本目标
E.项目的目标通常需要通过项目策划和项目控制得以实现
A.Hive
B.SparkSQL
C.Spark
D.MapReduce