首页 > 学历类考试
题目内容 (请给出正确答案)
[多选题]

下列哪些是TF-IDF的缺点()。

A.字词的重要性随它在文件中出现的次数成正比

B.将一些生僻字误当作文档关键词

C.只考虑特征词和文本之间的关系,忽略了一个特征项在不同类别间的分布情况

D.没有考虑特征词的位置因素对文本的区分度

查看答案
答案
收藏
如果结果不匹配,请 联系老师 获取答案
您可能会需要:
您的账号:,可能还需要:
您的账号:
发送账号密码至手机
发送
安装优题宝APP,拍照搜题省时又省心!
更多“下列哪些是TF-IDF的缺点()。”相关的问题
第1题
下列哪些属于TF-IDF的应用()。

A.搜索引擎

B.关键词提取

C.文本相似性

D.数据降维

点击查看答案
第2题
以下哪些方法是tf-idf的变种()。

A.TFC

B.EWC

C.ITC

D.IG

点击查看答案
第3题
下列关于自然语言处理中的关键词提取的说法正确的是()。

A.关键词提取是指用人工方法提取文章关键词的方法

B.TF-IDF模型是关键词提取的经典方法

C.文本中出现次数最多的词最能代表文本的主题

D.这个问题设计数据挖掘,文本处理,信息检索等领域

点击查看答案
第4题
下列哪些是传统RDBMS的缺点()。

A.表结构schema扩展不方便

B.全文搜索功能较弱

C.大数据场景下I/O较高

D.存储和处理复杂关系型数据功能较弱

点击查看答案
第5题
关于TF-IDF模型描述正确的有()。

A.TF意思是词频

B.IDF是逆文本频率

C.该模型基于统计方法

D.在信息检索中应用较少

点击查看答案
第6题
下面哪个算法可以将文本数据转换为数值数据?()

A.TF-IDF

B.决策树

C.PCA

D.DBSCAN

点击查看答案
第7题
下列哪些选项属于HDFS组件的缺点?()

A.不支持远程复制特性

B.硬件容错能力低

C.大规模部署下易产生文件系统性能瓶颈

D.容量利用率低,成本过高

点击查看答案
第8题
下列关于5G NSA组网的描述哪些是错误的?()

A.Option3a/7a都是EPC分流,好处是可以针对不同的业务进行分流,缺点是EPC不能根据无线链路状况进行分流

B.Option3,7,4三种组网信令面锚定点不同,无线分别在LTE,eLTE,NR;核心网分别在EPC+,EPC+,5GC

C.Option3/3a/3x组网推荐Option3,原因是不需要对现网LTE进行改造

D.Option4组网,适用于建网初期,LTE覆盖比较弱

点击查看答案
第9题
什么是选配装配法?它有哪些缺点?
点击查看答案
第10题
多电平二进制编码是怎样定义的,它包括哪些编码,有什么缺点?

点击查看答案
第11题
齿轮传动具有哪些缺点是运转过程中有振动、冲击和噪声。齿轮安装要求较高,不能实现无极变速,不适宜用在中心距较大的场合。()
点击查看答案
退出 登录/注册
发送账号至手机
密码将被重置
获取验证码
发送
温馨提示
该问题答案仅针对搜题卡用户开放,请点击购买搜题卡。
马上购买搜题卡
我已购买搜题卡, 登录账号 继续查看答案
重置密码
确认修改