首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
在互联网信息检索中,多样化排序方法力求在排序结果列表靠前的位置为用户提供多样的结果文档.文中提出一种基于聚类和用户点击的在线多样化排序算法CRBA,通过结合文档的相似性以及用户的点击反馈,在与用户的不断交互中为用户提供多样化的排序结果.该算法将在线和离线的思想进行融合,既可以利用主题聚类的优点,根据主题对候选文档集合进...  相似文献   

2.
针对当前关键词检索系统中单阶段系统检索速度慢,基于大词汇量连续语音识别(LVCSR)的两阶段系统又不够稳健的现状,提出一种新的基于拼音图的两阶段检索系统以满足快速、稳健检索的需要。两阶段分为预处理阶段和检索阶段。预处理阶段将语音数据识别成具有高覆盖率的拼音图。检索阶段响应用户的频繁查询,在拼音图中查找出与关键词拼音匹配的拼音串,并采用基于N元拼音文法的前后向算法计算置信度以实现对检索结果的筛选。实验表明:系统的二字词召回率及正确率可达72.19%和72.68%,三字词召回率及正确率可达73.51%和82.98%,均优于LVCSR系统,且检索阶段仅需0.01倍实时,具有良好的实用价值。  相似文献   

3.
一种基于名词短语的检索结果多层聚类方法   总被引:2,自引:0,他引:2  
为了对检索结果获取高质量的聚类效果,提取名词短语作为候选类别标签,根据候选类别标签分布情况生成基础类,再使用具有线性时间复杂度的一趟聚类算法对基础类进行多层聚类。与NEC,STC和Lingo算法的对比实验表明:该方法在类别标签的可读性、有效性以及聚类性能上都优于以上3种方法。  相似文献   

4.
为提高关系数据库上的关键词查询系统的准确性和查询效率,采用生成倒排索引文件和查询词的相关结果集相结合的方式建立关键词检索系统,并通过改善权重表以及相关记录的排名进行查询优化.提出的查询系统根据用户输入的关键词,可以动态生成用户表单,以此从不同用户表中返回相关记录来处理关键词.研究结果表明:该系统可以提高用户查询的准确性和查询效率,并对关系数据库中关键词查询的研究与应用具有一定的参考价值和借鉴意义.  相似文献   

5.
信息检索中基于链接的网页排序算法   总被引:5,自引:0,他引:5  
介绍超链接环境下基于链接的网页排序算法,比较和分析了PageRank算法和HITS算法,指出了PageRank算法更适合于搜索引擎的服务器端,而HITS算法更适合于搜索引擎的客户端,还构造并初步实现了在信息检索中,应用超链接环境下网页排序算法的综合模型。  相似文献   

6.
BBS搜索系统是为公安系统等监管部门了解年轻人思想动态,及时发现证据,防止案件发生而建立的.针对如何搜索各BBS上把符合搜索要求的信息检索出来,设计了一个面向BBS的关键词搜索引擎系统.首先从BBS搜索系统的需求分析入手,其次进行技术分析和方案设计,同时提出了一个索引倒排的索引算法,以此并设计了一个检索器将检索结果呈现,最后参考典型搜索引擎的实现,完成了一套小型的针对BBS进行扒取和检索的系统.目前该系统运行良好,结果表明该系统性能高,易于维护,对同类研究有一定借鉴作用  相似文献   

7.
搜索结果页面的去重处理是提高网页检索结果质量的有效途径,笔者结合二叉排序树设计了一种基于文本抽取的网页正文去重算法,本文给出了该算法的具体实现。实验测试结果表明该算法在判断准确率、时间复杂度方面均具有一定优势,可应用于网络信息检索结果优化处理中的页面正文内容去重。  相似文献   

8.
基于概念扩展的关键词检索技术   总被引:2,自引:1,他引:1  
提出了基于概念扩展的关键词检索技术,讨论了概念检索的基本思想,在分析概念间的逻辑关系及其结构的基础,给出了一种高效的概念库数据结构,描述并分析了概念库的各种检索和操纵算法。  相似文献   

9.
关键词在自然语言处理的各个领域有着十分重要的意义.对于中文自然语言处理,一词多义和多词一义问题始终是困扰研究人员的一个重大难题.传统的一些基于统计的方法,诸如KEA只是机械地统计了词频,而没有考虑词之间的关系.文中提出了一种基于同义词的中文关键词提取方法SKEA,并建立一阶隐马尔可夫模型进行词义消歧,将文本从稀疏的词空间映射到语义空间,从而实现了文本的降维.同时改进了KEA的位置权重公式,并提出新的关键词特征选取项.最后对SKEA方法和KEA方法进行比较实验,证明SKEA是一种更优秀的中文关键词提取方法.  相似文献   

10.
基于相邻词的中文关键词自动抽取   总被引:2,自引:0,他引:2  
文档关键词概括了文档的主题和内容,在信息检索、文本分类、文本聚类等领域有着重要应用.在总结前人研究成果的基础上,提出了一种基于相邻词的中文关键词自动抽取算法.在对50篇学术论文自动抽取关键词的实验中,采用精确匹配的评价获得了38.9%的精度和34.9%的召回率,采用近似匹配的评价获得了70.7%的精度和68.8%的召回率,能够为进一步的研究提供帮助.  相似文献   

11.
基于概念分组的Web搜索结果聚类算法   总被引:2,自引:0,他引:2  
为了便于用户浏览搜索引擎返回的搜索结果,快速有效地定位有价值的Web文档,提出了基于概念分组的Web搜索结果聚类算法.首先,建立特征词同现网络,利用概念分组技术挖掘特征词之间的语义关联,形成主题概念类;然后,计算文档与各概念类之间的距离,据此实现Web搜索结果的聚类;最后,综合考虑特征词在类内和文档集中的重要性进行类别标签的选择.实验结果表明本算法具有较好的聚类性能,明显优于k-均值算法,且产生的类别标签容易理解.  相似文献   

12.
本文讨论了 WWW (万维网 )搜索引擎索引信息库的更新维护问题 ,提出了一个增量式的更新方法 ,从而减轻了索引信息库维护的工作负担  相似文献   

13.
利用标签的层次化搜索结果聚类方法   总被引:2,自引:0,他引:2  
为了提高搜索引擎返回结果的可浏览性,满足用户对查询质量的要求,提出了一种层次化搜索结果聚类方法.首先,从搜索引擎的返回结果提取出文档集,并对每一个文档进行词干化、去除停用词等操作.然后,根据词共现信息来发现文档集中的频繁2元组,再将2元组扩展为n元组,对所有元组进行去冗余、重要性排序,从而获得候选聚类标签.最后,基于该标签对返回结果中的文档进行分配与聚集,形成层次化聚类结果.实验结果表明,所提方法可以通过获得的准确、可读性较好的聚类标签,帮助用户有效地浏览搜索引擎返回的结果.与Vivisimo、STC、Lingo算法比较,以及在多个评价指标上的综合实验结果也表明,该方法是有效的.  相似文献   

14.
对分布式信息检索的结果集采用模糊积分进行了融合,推导并给出了分布式信息检索的模糊积分算法.该算法可利用模糊积分的单调性,通过计算各信息源的模糊度量值采融合结果集并且评价排序效果.在实际的Web环境中针对4个搜索引擎算法进行了测试,结果发现,经模糊积分后的算法能较好地平衡合唱效应和黑马效应,并能获得更好的信息融合结果.在相同的条件下,所提算法在前100篇文档的排序中所荻得的相关文档数比Borda Count算法多3~4篇,比ComMIN算法多7~8篇.  相似文献   

15.
构建图像Web搜索器是实现基于内容Web图像搜索引擎系统的关键,运行搜索器可为引擎系统提供Inter-net上的图像数据源.提出了一种基于内容的Web图像搜索引擎的Web搜索器,它从初始URL网址集出发,根据广度优先遍历策略来获取新的URL网址以及互联网中图像文件信息,并建立Web图像特征库.实验表明,当搜索器在设置较多父URL图像网址以及适合的遍历层数时,可获得图像信息检索的最佳性能,可获得较多数量网络图像信息.  相似文献   

16.
矢量相关模型(VCM)是当前流行的信息检索模型之一,本文将模糊集理论和方法引入基于Web的信息系统检索模型的构造,提出了一种模糊矢量相关模型(FVCM),从而对其理论结构及用户检索模式的表达作了模糊化改进,初步实验结果表明,新模型克服了原模型的一些固有缺陷,有利于提高系统查准率和查全率。  相似文献   

17.
Web信息抽取与语义检索框架   总被引:1,自引:1,他引:0  
提出了一种Web信息抽取与语义检索框架,采用定制本体模型,针对Web网页特点设计了抽取与语义标引策略,并在检索过程中引入语义推理机制,从而改善了信息检索的效果.最后介绍了基于Jena实现的该框架的原型系统.  相似文献   

18.
解背包问题的一种直接搜索法   总被引:2,自引:0,他引:2  
对背包问题提出了一种直接搜索方法,此方法简便易行,尤其对求解变数不多的背包问题很有效.  相似文献   

19.
梅森素数与偶完全数有一一对应关系,人类在2300多年中寻找到46个梅森素数.寻找梅森素数之难一是梅森数的巨大,二是其素因数也难找.传统的寻找方法是心算手算和计算机搜索.分析传统方法之后,提出一种新方法,即用无限递缩的区间套和反证法证明若q为素数,Mq为梅森素数,则M Mq也是梅森素数.  相似文献   

20.
利用PowerBuilder开发Web应用的一种方法   总被引:3,自引:1,他引:3  
对PowerBuilder在互联网和企业内部网应用开发中,可采用的几种Web 开发方法的主要特点和不足作了说明,并通过实例说明一种使用Web.PB的分布计算技术开发基于Web的信息系统的方法,采用这种方法建立了三峡工程物资供应信息发布系统。该系统较好地解决了异构环境下信息处理和公用信息发布问题,其数据既有ORACLE的数据又有FOXPROW的数据,为工程建设有关人员及时了解物资供应信息提供了一种方便安全的途径。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号