A.RDD具有血统机制(Lineage)
B.RDD默认存储在磁盘
C.RDD是一个只读的,可分区的分布式数据集
D.RDD是Spark对基础数据的抽象
A.数据可以直接读写,不需要经过操作系统级的缓存,节省了内存资源,避免了内存争用
B.避免了文件系统级的维护开销,比如文件系统需要维护超级块,inode等
C.避免了操作系统的cache预读功能,减少了I/O请求
D.数据管理、空间管理不灵活,需要专业人员来操作,增加了维护成本
A.已缓存域名是否归属网内
B.已缓存域名近期无访问请求
C.已缓存域名在其他省没有其他至白名单
D.已缓存域名增益比较低
A.Flume
B.Zookeeper
C.HIVE
D.Spark