A.关键词提取是指用人工方法提取文章关键词的方法
B.TF-IDF模型是关键词提取的经典方法
C.文本中出现次数最多的词最能代表文本的主题
D.这个问题设计数据挖掘,文本处理,信息检索等领域
A.数据挖掘是大数据数据分析的基础
B.数据挖掘是从大量数据中提取出有价值的信息和知识的过程
C.数据挖掘包括历史性分析与预测性分析
D.对于同一组数据的数据挖掘结果,不同的人有不同的认知角度与使用价值
A.从数据中移除停用词(stopwords)将会影响数据的维度
B.数据中词的归一化将会减少数据的维度
C.转化所有的小写单词将不会影响数据的维度
A.电子出版物存储容量大,一张光盘可存储几百本书
B.电子出版物可以集成文本、图形、图象、动画、视频和音频等多媒体信息
C.电子出版物不能长期保存
D.电子出版物检索慢