题目内容
(请给出正确答案)
[单选题]
将两篇文本通过词袋模型变为向量模型,通过计算向量的()来计算两个文本间的相似度。
A.正弦距离
B.余弦距离
C.长度
D.方向
查看答案
如果结果不匹配,请 联系老师 获取答案
A.正弦距离
B.余弦距离
C.长度
D.方向
A.文本分类是指按照预先定义的主题类别,由计算机自动地为文档集合中的每个文档确定一个类别
B.文本分类大致可分为基于知识工程的分类系统和基于机器学习的分类系统
C.文本的向量形式一般基于词袋模型构建,该模型考虑了文本词语的行文顺序
D.构建文本的向量形式可以归结为文本的特征选择与特征权重计算两个步骤
A.完成一个主题模型掌握语料库中最重要的词汇
B.训练袋N-gram模型捕捉顶尖的n-gram:词汇和短语
C.训练一个词向量模型学习复制句子中的语境
D.以上所有
A.词袋模型可以忽略每个词出现的顺序
B.词袋模型不可以忽略每个词出现的顺序
C.TensorFlow支持词袋模型
D.词袋模型可以表出单词之间的前后关系
A.从数据中移除停用词(stopwords)将会影响数据的维度
B.数据中词的归一化将会减少数据的维度
C.转化所有的小写单词将不会影响数据的维度
A.语音端点检测(判断录音片段中什么时间点开始有声音)
B.提特征模块(声音波形转换成计算机可以计算的数字序列)
C.声学模型(发音特征的规律统计模型)
D.语言模型(含有上下文语义信息的文本空间构建)