首页 > 其他
题目内容 (请给出正确答案)
[单选题]

将两篇文本通过词袋模型变为向量模型,通过计算向量的()来计算两个文本间的相似度。

A.正弦距离

B.余弦距离

C.长度

D.方向

查看答案
答案
收藏
如果结果不匹配,请 联系老师 获取答案
您可能会需要:
您的账号:,可能还需要:
您的账号:
发送账号密码至手机
发送
安装优题宝APP,拍照搜题省时又省心!
更多“将两篇文本通过词袋模型变为向量模型,通过计算向量的()来计算…”相关的问题
第1题
词袋模型最重要的是构造词表,然后通过文本为词表中的词赋值,但词袋模型严重缺乏相似词之间的表达。()
点击查看答案
第2题
下列关于文本分类的说法不正确的是()。

A.文本分类是指按照预先定义的主题类别,由计算机自动地为文档集合中的每个文档确定一个类别

B.文本分类大致可分为基于知识工程的分类系统和基于机器学习的分类系统

C.文本的向量形式一般基于词袋模型构建,该模型考虑了文本词语的行文顺序

D.构建文本的向量形式可以归结为文本的特征选择与特征权重计算两个步骤

点击查看答案
第3题
以下属于考虑词语位置关系的模型有()。

A.词向量模型

B.词袋模型

C.词的分布式表示

D.TF-IDF

点击查看答案
第4题
在词袋模型中使用单个的单词来构建词向量这样的序列被称为()。

A.1元组(1-gram))

B.单元组(unigram)模型

C.列表

D.字典

点击查看答案
第5题
词袋模型、TF-ID

A.word2vec等模型都有着同样的作用是()。

B.文本情感分析

C.文本特征向量化

D.文本特征离散化

E.文本特征分布式

点击查看答案
第6题
社交媒体平台是文本数据最直观的呈现形式。假设你有一个推特社交媒体完整语料库,你会如何创建一个建议标签的模型?()

A.完成一个主题模型掌握语料库中最重要的词汇

B.训练袋N-gram模型捕捉顶尖的n-gram:词汇和短语

C.训练一个词向量模型学习复制句子中的语境

D.以上所有

点击查看答案
第7题
向量空间模型的缺陷不包括()。

A.维度灾难

B.模型稀疏性

C.语义信息缺失

D.无法计算文本相似度

点击查看答案
第8题
下列关于词袋模型说法正确的是()。

A.词袋模型可以忽略每个词出现的顺序

B.词袋模型不可以忽略每个词出现的顺序

C.TensorFlow支持词袋模型

D.词袋模型可以表出单词之间的前后关系

点击查看答案
第9题
下面属于词袋模型的缺点的是()。

A.词汇表的词汇需要经过精心设计

B.表示具有稀疏性

C.丢失词序忽略了上下文

D.模型复杂,不利于实施;

点击查看答案
第10题
假定你已经搜集了10000行推特文本的数据,不过没有任何信息。现在你想要创建一个推特分类模型,好把每条推特分为三类:积极、消极、中性。通过把每个推特视为一个文档,我们创建一个数据化的文档词矩阵。关于文档矩阵,以下哪项是正确的?()

A.从数据中移除停用词(stopwords)将会影响数据的维度

B.数据中词的归一化将会减少数据的维度

C.转化所有的小写单词将不会影响数据的维度

点击查看答案
第11题
在语音识别中当某个人名效果很差时,通常会用到热词技术激励热词的得分,那么热词技术主要激励了语音识别中哪一模块的分数?()

A.语音端点检测(判断录音片段中什么时间点开始有声音)

B.提特征模块(声音波形转换成计算机可以计算的数字序列)

C.声学模型(发音特征的规律统计模型)

D.语言模型(含有上下文语义信息的文本空间构建)

点击查看答案
退出 登录/注册
发送账号至手机
密码将被重置
获取验证码
发送
温馨提示
该问题答案仅针对搜题卡用户开放,请点击购买搜题卡。
马上购买搜题卡
我已购买搜题卡, 登录账号 继续查看答案
重置密码
确认修改