首页 | 本学科首页   官方微博 | 高级检索  
文章检索
  按 检索   检索词:      
出版年份:   被引次数:   他引次数: 提示:输入*表示无穷大
  收费全文   3篇
  免费   0篇
综合类   3篇
  2012年   2篇
  2011年   1篇
排序方式: 共有3条查询结果,搜索用时 0 毫秒
1
1.
王夙娟 《科技信息》2012,(14):115-116
本文对分类文档提取主题词,建立按主题划分的主题词库,用于信息提取和主题分类。通过对文档预处理,运用权重计算公式,按权重大小提取每篇文档的主题词,并通过对文档的不断训练,扩充主题词库,最终形成按主题分类的主题词库。通过实验表明,该方法对主题词的抽取具有较高的准确率,建立的主题词库对专业文档的主题词的提取既快速又准确。该词库的建立满足了对专业文档处理的要求,对于信息提取和文本分类提出了新方法和思路。  相似文献   
2.
王夙娟 《科技信息》2011,(10):I0103-I0103,I0105
TFIDF是常用的特征提取方法,但是该方法存在着很多不足。首先这个方法忽视了如果某词条仅仅在一个类别的文档集中存在次数多,在其他类别中存在次数少,则能说明该词条可以很好地反映类别特征。再者TFIDF忽视了特征与类别的关系。本文提出了改进的TFIDF策略,并结合简单距离向量分类方法与传统的TFIDF进行分类比较,得到了很好的分类效果,试验证明了其可行性。  相似文献   
3.
王夙娟 《科技信息》2012,(12):115-116
根据国内外现有的智能答疑系统存在的问题,本文提出了支持自然语言提问的智能答疑系统模型,当用户提出问题时,系统利用相关技术自动理解用户输入的自然语言文本,并与数据库信息进行匹配,返回一组与问题相关的答案,并形成反馈,同时本文将改进文本分类算法应用于答疑系统中,准确快速的对数据库问题进行分类,可以将用户提出的问题快速定位,提高答疑效率。  相似文献   
1
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号