排序方式: 共有3条查询结果,搜索用时 0 毫秒
1
1.
本文对分类文档提取主题词,建立按主题划分的主题词库,用于信息提取和主题分类。通过对文档预处理,运用权重计算公式,按权重大小提取每篇文档的主题词,并通过对文档的不断训练,扩充主题词库,最终形成按主题分类的主题词库。通过实验表明,该方法对主题词的抽取具有较高的准确率,建立的主题词库对专业文档的主题词的提取既快速又准确。该词库的建立满足了对专业文档处理的要求,对于信息提取和文本分类提出了新方法和思路。 相似文献
2.
TFIDF是常用的特征提取方法,但是该方法存在着很多不足。首先这个方法忽视了如果某词条仅仅在一个类别的文档集中存在次数多,在其他类别中存在次数少,则能说明该词条可以很好地反映类别特征。再者TFIDF忽视了特征与类别的关系。本文提出了改进的TFIDF策略,并结合简单距离向量分类方法与传统的TFIDF进行分类比较,得到了很好的分类效果,试验证明了其可行性。 相似文献
3.
根据国内外现有的智能答疑系统存在的问题,本文提出了支持自然语言提问的智能答疑系统模型,当用户提出问题时,系统利用相关技术自动理解用户输入的自然语言文本,并与数据库信息进行匹配,返回一组与问题相关的答案,并形成反馈,同时本文将改进文本分类算法应用于答疑系统中,准确快速的对数据库问题进行分类,可以将用户提出的问题快速定位,提高答疑效率。 相似文献
1