首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
本文在研究元搜索引擎及排序算法的基础上,提出了一种基于元搜索引擎的加权Borda排序算法,该算法通过权重信息来推荐成员搜索引擎,为元搜索引擎在海量数据搜索中提高查全率和查准率提供帮助。  相似文献   

2.
信息检索的核心问题就是在文档集中为用户检索出最相关的子文档集,并依靠排序算法对检索结果按照相关性进行排序,因此排序算法的优劣直接影响检索的效率.RLR算法改进了正则经验风险模型,大大减少了计算复杂度.通过设定一定范围的允许误差值,采用对称ε-insen-sitive对数亏损函数作为亏损函数,给出对称ε-insensitive对数亏损函数满足的一些特殊性质,进而改进RLR算法.实验表明新算法对文本排序是有效的.  相似文献   

3.
针对传统的以k-means为代表的分割聚类算法认为所有的聚类样本对聚类中心的影响都是相同的这一观点,提出基于样本加权的聚类算法,并采用实际数据集验证算法的有效性.实验表明,该算法比传统的k-means聚类算法具有更高的精确度.  相似文献   

4.
林强 《咸宁学院学报》2012,32(2):154-156
介绍了笔者所设计的一个校园网搜索引擎(SzCompass)中的网页排序算法。首先详细分析了通用搜索引擎常用的PageRank和HITS网页排序算法;通过比较在校园网和Internet上搜索的主要区别,设计了一种适合校园网的多参数加权的网页排序算法,并对利用该算法实现的搜索引擎的检索效率进行了实验分析。  相似文献   

5.
信息检索中基于链接的网页排序算法   总被引:5,自引:0,他引:5  
介绍超链接环境下基于链接的网页排序算法,比较和分析了PageRank算法和HITS算法,指出了PageRank算法更适合于搜索引擎的服务器端,而HITS算法更适合于搜索引擎的客户端,还构造并初步实现了在信息检索中,应用超链接环境下网页排序算法的综合模型。  相似文献   

6.
基于链接文本相关度的超链接算法   总被引:1,自引:0,他引:1  
分析了超链接PageRank算法的不足.采用矢量空间模型计算检索关键词与超链接文本之间的相关度,提出了基于超链接文本相关度的超链接算法.实验结果表明,该算法可以提高PageRank算法的检索精确度.  相似文献   

7.
堆排序算法具有低时间复杂度和低空间复杂度的优点;但对原始序列的有序性不敏感。快速排序算法是在平均情况下公认的高速算法;但有较高空间复杂度。对两个算法扬长避短,设计了一种新的排序算法HQSort;并从理论和实例两个角度分析了该算法的效率,在不同量级的数据集上对该算法和三种经典排序算法进行了对比运行和测试,验证了该算法不仅在时间效率上优于其他算法,而且在辅助存储空间上比快速排序算法减少约50%。  相似文献   

8.
本文给出了一种改进的起泡排序算法.改进后的起泡排序算法与经典的起泡排序算法相比,通常可以减少排序过程中总的比较次数.用PASCAL语言描述的与算法有关的类型定义和变量说明如下:TYPEnode=RECORDkey:integer;info:datat...  相似文献   

9.
一种词汇共现算法及共现词对检索系统排序的影响   总被引:6,自引:0,他引:6  
为了探讨共现词对检索系统排序相关性的影响,提出一种新的共现词汇算法--FDC.算法中考虑了词汇在文档中的共现频度、相对距离和共文档率.从天网搜索引擎查询日志中选取部分查询词,用本算法和潜在语义索引(LSI)方法分别求其共现词汇,并以相同的评分策略改变原始排序结果.Discounted cumulative gain(DCG)评估结果表明,本算法获得的共现词在99%的置信度下对原始排序的相关性有改进;而LSI方法获得的共现词对排序相关性也表现出同样显著的改进效果.结果显示共现词汇能改进检索系统结果排序的相关性,并且不依赖于特定算法.  相似文献   

10.
介绍了一种并行的排序算法:排序网络算法.在比较网络模型的基础上,该算法使用二分法思想,利用双调序列,构造出了一种并行的排序算法:双调排序网络.  相似文献   

11.
传统的排名方法没有考虑用户的喜好、反馈和用户兴趣,很难满足用户的个性化需求.针对这个问题,提出一种新的网页排名方法,将网页的相似度、链接结构信息、用户偏好及用户反馈相结合进行页面排名.实验结果表明,改进的排序算法在一定程度上帮助用户提高检索网页的质量,最大限度地满足用户的需求.  相似文献   

12.
随着电力系统信息化的发展,电网数据具有数量大、类型多、维度高的特点。针对在数据检索时多维度查询效率不高,检索结果无法多维度整体匹配的问题,提出一种基于流形排序的电网截面数据检索方法;该方法将电网截面数据描述成多维向量空间中的对应点,创建加权图模型。通过考虑数据的整体近似流形结构来获得检索结果,使之与源查询之间具有较高的相关性;使用置信传播分配排序分数,提高了检索结果的准确性,有效避免相关性度量对高维数据查询处理的不足。  相似文献   

13.
针对 Web应用挖掘中聚类算法中的问题 ,提出加权 Web访问模式聚类算法 .该算法利用服务器日志库中保存的网页访问次数信息 ,提高了聚类的客观性和准确性 .  相似文献   

14.
为了加强面向领域的搜索技术查询有效性与准确性,在证券领域本体的基础上对检索表达式进行扩展,使检索内容更加相关.对于初始检索集,根据本体进行面向语义排序,提高了检索结果集相关度.对面向证券领域的语义信息检索系统框架数据流与算法效率进行了分析,并对语义排序算法功能进行增强,得到自适应热点算法扩展,使系统可以在特定时间段内根据用户点击率反映阶段性关注热点.  相似文献   

15.
基于相关系数的加权朴素贝叶斯分类算法   总被引:7,自引:0,他引:7  
朴素贝叶斯分类算法的条件独立性假设在很少情况下能够满足,为了克服该问题,提出了一种基于相关系数的加权朴素贝叶斯分类模型.通过计算条件属性和决策属性之间的相关系数,对不同的条件属性赋予不同的权重,从而在保持简单性的基础上有效地提高了朴素贝叶斯算法的分类性能.首先给出了基于相关系数的属性权值求解方法,然后描述了相应的算法,并对算法原理进行了分析与证明.通过在中医小儿肺炎病例数据集和UCI数据集上的仿真实验,验证了该方法的有效性.  相似文献   

16.
使用词汇之间的"相关度"来存储单个用户的个性化信息,提出了能够在用户进行检索的过程中利用用户偏好自动建立针对该用户的"词汇相关度网"的方法,以及3种不同的利用词汇相关度对底层搜索引擎所返回的结果进行重新评估并进行个性化排序的策略.在此基础上,提出了基于词汇相关度模型的个性化信息检索算法.设计了原型系统,对算法的相关性能进行了测试,结果显示,所提出的词汇相关度模型能正确存储和构造词汇之间的相关度,所提出的检索算法正确.  相似文献   

17.
首先, 基于点互信息与信息检索(PMI IR)算法, 提出一种Laplace平滑情感判定(LS-SO)算法, 对情感词典与表情符号情感词典进行自动扩充, 得到了具有一定规模、 高质量的情感词典, 包括基础情感词典、 目标情感词典、 网络用语情感词典、 表情符号情感词典、 否定词词典、 疑问词词典、 程度副词词典和连词词典. 其次, 通过细化文本语义分析规则计算文本情感值. 实验结果验证了该方法的有效性.  相似文献   

18.
根据全信息理论,认识论信息是语法信息、语义信息和语用信息的三位一体.在信息检索的过程中加入语用信息能有效的提高信息检索的质量.基于查询与内容的文档表示模型较好的利用了语用信息,对站内搜索引擎的查准率的提高有着很好作用;Lucene是一个用java语言开发的开源的全文搜索引擎架构.本文利用Lucene设计和实现一个基于查询与内容的文档表示模型的站内搜索引擎,实验结果表明该模型能有效的提高信息检索的查准率.  相似文献   

19.
提出了一种基于形状加权的三维模型特征提取算法,同时考虑采样点与中心点间的距离,以及采样点所在三角面片面积大小,构建直方图获取特征描述符.该算法能够充分利用模型表面信息,提取步骤简单,时间消耗少.实验证明,利用本文算法得到的特征描述符进行检索,查全率和查准率都有明显提高.  相似文献   

20.
搜索结果的合成是元搜索引擎系统中一个重要的技术问题。为了提高元搜索引擎的查询精度,提出了一种改进的元搜索结果合成算法。通过分析搜索结果列表中包含的文本信息,综合考虑搜索结果与查询的匹配完全程度和相关程度给出了文本分析的规范化方法,并结合搜索结果的排序信息计算文档的相关分值,据此实现对局部相似度的调整。利用成员搜索引擎的性能评价,提出了改进的影子文档方法估算非相关文档的相关分值。然后,采用基于群决策的合成方法对搜索结果进行一致性排序。在实际Web环境中进行了测试,实验结果表明采用本算法,搜索结果的相关性比Round-robin、CombSum和CombMNZ三种合成算法有较大提高。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号