题目内容
(请给出正确答案)
[单选题]
关于DataSet,下列说法不正确的是()
A.DataSet是一个由特定域的对象组成的强类型集合
B.DataSet不需要反序列化就可执行大部分操作
C.DataSet执行sort、filter、shuffle等操作需要进行反序列化
D.ataSet与RDD高度类似,性能比RDD好
答案
C、DataSet执行sort、filter、shuffle等操作需要进行反序列化
如果结果不匹配,请 联系老师 获取答案
A.DataSet是一个由特定域的对象组成的强类型集合
B.DataSet不需要反序列化就可执行大部分操作
C.DataSet执行sort、filter、shuffle等操作需要进行反序列化
D.ataSet与RDD高度类似,性能比RDD好
C、DataSet执行sort、filter、shuffle等操作需要进行反序列化
A.(选两项)
B.在DataSet中,只有一个DataTable
C.修改DataSet中的数据后,数据库中的数据可以自动更新
D.在与数据库断开连接后,DataSet中的数据不会消失
E.DataSet实际上是从数据源中检索的数据在内存中的缓存
A.RDD(ResilientDistributedDataset)叫做弹性分布式数据集,是spark中最基本的数据抽象;
B.Resilient:表示弹性的;
C.Destributed:分布式,可以并行在集群计算;
D.Dataset:就是一个集合,用于存放数据的;
A.dataframe是指定列名称的dataset
B.dataframe提供详细的结构信息
C.dataframe不是面向对象的
D.dataframe在序列化与反序列化时,要对数据和数据结构进行序列化