共查询到20条相似文献,搜索用时 31 毫秒
1.
为了解决专利文本特征的提取、专利文本的无监督分类、专利推理规则的生成和搜索等问题,将基于突出特征的类比联想用于专利战略信息检索,以帮助了解分析相关专利的情况. 相似文献
2.
宗萍 《科技情报开发与经济》2012,22(14):19-20
文本检索技术是重要的现代信息检索技术之一。以文本信息检索过程的文本处理、搜索模型、查询处理和用户界面4个主要环节为基础,简单归纳、分析了文本检索各技术环节的具体内容及其特点。 相似文献
3.
基于机器学习的文本分类方法综述 总被引:1,自引:0,他引:1
文本分类是信息检索与数据挖掘领域的核心技术,是机器学习领域新的研究热点。本文对现有的基于机器学习的文本分类方法进行了详细的介绍,分析了各种方法的优缺点,并阐述了文本分类方法未来的发展趋势。 相似文献
4.
文本分类作为机器学习和信息检索之间的交叉学科,涉及到多个领域的技术。该文介绍了文本分类过程中的各个关键技术,讨论了文本表示模型,特征及方法,最后并对今后的发展进行了展望。 相似文献
5.
提出了一种基于机器学习的Web文本自动分类的信息检索解决方案。采用层次约束法完成文本自动抓取功能,文本频度与词条频度相结合的文本特征选择算法实现特征提取,并采用特征加权技术进一步提高文本分类性能。该算法不仅实现中文文本的自动分类,有效地提高Web信息检索的精度,而且能大大降低人工二次浏览筛选的工作量,还可用于电子政务和电子商务信息的自动分类。 相似文献
6.
文本自动分类是文本挖掘的基础,可广泛地应用于信息检索,web挖掘等领域.在分类前首先要将文本表示成计算机能处理的形式,提出了一种将隐含语义索引(LSI)与文本聚类相结合的中文文本自动分类的方法.在挖掘文本的语义信息,提高分类速度上均取得了较好的效果.通过实验验证了方法的有效性. 相似文献
7.
赵鹏 《齐齐哈尔大学学报(自然科学版)》2008,24(1):55-60
文本分类是信息检索与数据挖掘领域的研究热点与核心技术,近年来得到了广泛的关注和快速的发展.其中基于支持向量机的文本分类方法的研究是信息检索领域的一个重要分支.本文首先讨论了该领域的研究状况,接着阐述并分析了在该领域中的主要研究方法以及实例, 最后对该领域研究中存在的问题和方向进行了分析. 相似文献
8.
分析了门户网站全文信息检索系统的功能,对该系统的结构(包括数据采集引擎、索引数据库、索引引擎、文本分析引擎、数据查询引擎)进行了研究,重点讨论了数据采集引擎中的数据库采集器和HTML采集器.统一整合频道后建立的全文信息检索系统,能够提供高效、便捷的信息检索服务,提高用户对网站内容的搜索效率. 相似文献
9.
基于核方法的潜在语义文本分类模型 总被引:4,自引:0,他引:4
在信息检索中,潜在语义索引模型直接应用于文本分类时,由于对分类贡献大的特征可能丢失而效果不佳.而考虑了文本特征及分类信息的潜在语义文本分类模型(LSC)也因为本质上是线性模型而性能不高.为了提高分类性能,通过引入核函数,给出了一种非线性的潜在语义文本分类模型.该模型比LSC模型能更好地表示文档空间的潜在语义结构信息.在Reuter-21578文档集上的实验结果表明,潜在语义文本分类模型有很好的分类性能. 相似文献
10.
本文针对信息检索中的重要问题,即自然语言的智能检索技术进行了研究。应用Ontology的理论方法对文本分类进行概念控制,将信息检索从基于关键词提高到基于知识(概念),从概念层认识和处理用户的检索请求,有效的提高了检索系统的检全率和检准率,在自然语言语义查询、多媒体信息检索中得到较好的实践效果。 相似文献
11.
粒子群算法的改进及其在文本分类上的应用 总被引:3,自引:0,他引:3
孙洋 《中央民族大学学报(自然科学版)》2008,17(3):57-62
本文首先从加强全局搜索能力、提高种群多样性的角度对经典粒子群算法提出二点改进方案,并将改进后的粒子群算法用来作为训练文本分类的分类算法,实现了文本资源的自动分类. 相似文献
12.
在因特网高速发展的信息时代,人们需要快捷、方便地从网上获取有用信息.文章针对因特网上信息庞杂的现状,分析了网上中文文本的特征,介绍了文本内容分析与结构分析的方法,并提出通过两者的有效结合,达到对文本准确分类的目的,从而提高因特网中文文本信息检索的速度和准确度. 相似文献
13.
张华 《中国新技术新产品精选》2012,(23):40-40
用户在搜索引擎上进行信息查询时,并不关注返回结果的多少,而是看结果是否和自己的需求吻合。对于一个查询,传统的搜索引擎动辄返回几十万、几百万篇文档,用户不得不在结果中反复筛选。智能搜索技术,采用了先进的"模式识别"方法,可以根据单词或词语的使用和出现频率来识别不同文本在上下文环境中自己产生的模式。通过判断一条非结构化信息中的一种模式优于另一种模式,可使计算机了解一篇文档与某个主题的相关度。利用这种方法,可以抽取文档中的文本要素,自动识别文本的概念然后对该文本进行自动操作。这种创新的高性能模式识别算法提供了精确的文本上下文分析和概念抽取,可对信息自动分类和相互链接,从而提高信息检索的效率。 相似文献
14.
基于向量空间的信息检索模型VSM,以其简洁直观、检索结果和排序效果良好等优点,在信息检索领域得到普遍的应用。文章结合藏文文本的特点,研究VSM在藏文文本信息检索中的应用方法。 相似文献
15.
针对生物医学文本挖掘中有效特征选择困难的问题,提出了一种新的基于膜粒子群优化和信息熵的文本特征选择方法.该方法以文本信息熵总和为目标函数,以膜系统的层次结构作为框架,以膜系统的消息传递机制作为进化方向,以粒子群优化进化作为进化规则.作为进化规则的粒子群优化算法,分别以局部搜索速率和全局搜索速率搜索得到文本信息熵最大的解,并在不同膜区域之间传递搜索结果,直到膜区域之间的消息传递结束或者达到限定的迭代次数.实验结果表明,利用提出的方法对医学文本特征进行选择后,对其进行分类,能使分类精确度和召回率分别提高2%和3%左右. 相似文献
16.
为了有效地利用信息技术发展而产生的海量信息,信息检索与数据挖掘得到了快速的发展,通过对传统支持向量机的特点分析,针对其在文本分类中的局限性,采用了一种基于二叉树的模糊支持向量机的多分类算法,通过实验证明该算法有更好的抗干扰能力和更好的分类效果。 相似文献
17.
翟中文 《科技情报开发与经济》2005,15(15):45-46
阐述了基于内容的信息检索技术(包括文本信息检索、图像信息检索、音频信息检索、视频信息检索),简述了评价基于内容的信息检索系统的因素。 相似文献
18.
1 前言
随着万维网(World Wide Web)在国际互连网上的推广,文本信息数量日益增加,交换日益频繁,这就需要一个高效率的信息检索系统。目前,在Internet上有数百万个Web服务器日夜不停地向人们提供着各式各样的信息服务。现有的著名搜索引擎,如Yahoo!,Looksmart等,都是利用人工分类方法将网络信息分类,将检索后的结果存入数据库。因此,研究高效率的信息检索系统得到了一些学者的重视。 相似文献
19.
唐朝霞 《太原师范学院学报(自然科学版)》2010,9(4)
随着Internet技术的不断发展,Web信息不断的变化和增长.为有效查找用户所需要的信息,需将传统的信息检索向Web信息检索方向发展.如果预先对网页文本进行分类,则面对用户的检索需求就可以在相应的类别中进行查找,这样大大提高了检索的效率.文章通过对网页进行预处理,中文分词,特征提取,再使用KNN分类算法对网页进行智能分类,并采用了PSO算法快速寻找K近邻.实验结果表明:该方法不仅减少了网页分类时间,准确率、召回率和F1标准也明显提高,有效地提高了网页智能分类的效率. 相似文献
20.
要从信息的海洋中搜索某一特定的软件、图片、甚至一小段文字。你该如何让“搜”更快,更准?细阅本文,你可以了解信息检索的方方面面。 相似文献