A.文本分类是指按照预先定义的主题类别,由计算机自动地为文档集合中的每个文档确定一个类别
B.文本分类大致可分为基于知识工程的分类系统和基于机器学习的分类系统
C.文本的向量形式一般基于词袋模型构建,该模型考虑了文本词语的行文顺序
D.构建文本的向量形式可以归结为文本的特征选择与特征权重计算两个步骤
A.定义和选择训练数据的特征
B.定义和选择若干标注训练数据
C.定义和选择do算子操作
D.定义和选择某一特定的分类器
A.使用上位词
B.使用位置算符,两个词的间隔在一定范围内
C.选择检索范围较大的字段
D.不限定检索对象的文档类型、时间段、文种及其它特征