题目内容
(请给出正确答案)
[多选题]
常见的开源的文本数据标注工具包括()。
A.doccano
B.YEDDA
C.Chinese-Annotator
D.IEPY
E.DeepDive
查看答案
如果结果不匹配,请 联系老师 获取答案
A.doccano
B.YEDDA
C.Chinese-Annotator
D.IEPY
E.DeepDive
A.基础设施提供数据计算、数据存储、数据加工(DataWrangling或DataMunging)等服务
B.流处理、统计工具、日志分析都属于常用的开源工具
C.数据资源代表的是生成数据的机构
D.数据源与APP为数据科学和大数据产业生态系统提供数据内容
A.Hive是基于Hadoop的数据仓库工具
B.Hive可以将结构化的数据文件映射为一张数据库表
C.最初,Hive由Google开源,用于解决海量结构化日志数据统计问题
D.Hive的主要应用场景是离线分析
A.flume是cloud开源的日志收集系统,具有分布式、高可靠、高容错、易于定制和扩展的特点
B.flume将数据从产生、传输、处理,并写入目标路径的过程抽象为数据流
C.在具体的数据流中,数据源在支持flume中定制数据发送方,从而支持收集各种不同的协议数据
D.为了保证配置数据的一致性,Flume引入了ZooKeeper,用于保存配置数据