首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
以名人网页语料库为基础,研究名人网页的个性化检索设计,实现了名人网页相关度评价的概率模型.从模型的训练策略、相关度计算公式等方面进行实验分析,总结了概率模型的规律,提出了模型的改进方法.实验表明,通过选择合适的训练集、细化用户反馈信息,模型取得了较高的相关度评价准确率.  相似文献   

2.
信息检索涉及到许多技术,涉及多个学科领域,应用更是非常广泛,其中语义相关度的研究一直是研究的热点问题.本文主要针对基于词关联度、基于Wikipedia、基于概念格、基于视觉内容、基于知网、基于中文语义词典、基于领域本体中的概念、基于主题图、基于本体的语义相似度计算方法等,进行比较探讨,特别是对一种新颖的方法使用时语义分析计算单词间相关度的方法进行了详细的阐述说明,并提出了自己的一些想法和下一步的研究方向.  相似文献   

3.
基于词汇相关度模型的个性化信息检索算法   总被引:1,自引:1,他引:0  
使用词汇之间的"相关度"来存储单个用户的个性化信息,提出了能够在用户进行检索的过程中利用用户偏好自动建立针对该用户的"词汇相关度网"的方法,以及3种不同的利用词汇相关度对底层搜索引擎所返回的结果进行重新评估并进行个性化排序的策略.在此基础上,提出了基于词汇相关度模型的个性化信息检索算法.设计了原型系统,对算法的相关性能进行了测试,结果显示,所提出的词汇相关度模型能正确存储和构造词汇之间的相关度,所提出的检索算法正确.  相似文献   

4.
广义相关免疫与相关度   总被引:2,自引:0,他引:2  
讨论了广义相关免疫函数的理论意义和应用价值,发展了相关度的概念,给出了Bent函数的相关度及广义相关免疫阶,证明了Bent函数是一类理想的广义相关免疫函数.  相似文献   

5.
互联网上信息是海量的,并且还在快速的发展.面向主题的Web信息检索已成为当前研究的热点之一.将语义网技术同传统的信息检索技术相结合,给出一个利用本体判断主题相关度的判断算法,通过实验验证了算法的有效性.  相似文献   

6.
交互式Web信息检索技术可根据用户反馈信息,调整和修正查询表达式,自动实现查询重构。在此提出一种基于模糊关联的交互式Web信息检索方法,试验结果表明,使用该方法实现查询表达式的重构,可较大幅度地提高Web信息检索系统的查准率。  相似文献   

7.
提出一种基于句子相关度的文本自动分类模型(TCSC).该模型利用训练样本增量式地自动更新类别语料库,根据句子的位置权值和语料权值计算句子类别相关度,获得用于文本分类的句子相关度矩阵,通过该矩阵实现文档分类.该模型避免了分类阶段待分类文本特别是中文文本的分词,模糊了词的多义问题,且在文本分类的实验中能够达到86%以上的查全率和查准率;随着语料库的不断训练和调整,分类性能还可以进一步提高,具有简单实现的特点.  相似文献   

8.
针对传统局部二值模式(local binary pattern,LBP)算子提取的图像纹理特征不完整、不能全面刻画人脸局部特征的问题,提出一种基于邻域相关度的改进LBP算子.该算子首先计算窗口内每个像素点的邻域相关度;其次利用邻域相关度的均值和方差构造新的NC_LBP算子,进而提取图像局部直方图特征,作为人脸识别的依据;最后利用Chi平方统计法计算直方图的不相似度,并用KNN算法进行分类.仿真实验表明,改进NC_LBP算子在ORL,JAFFE和YALE人脸数据库的识别中效果较好,特征区分度明显,识别准确率较高.  相似文献   

9.
基于链接文本相关度的超链接算法   总被引:1,自引:0,他引:1  
分析了超链接PageRank算法的不足.采用矢量空间模型计算检索关键词与超链接文本之间的相关度,提出了基于超链接文本相关度的超链接算法.实验结果表明,该算法可以提高PageRank算法的检索精确度.  相似文献   

10.
语义相关度计算是信息检索、文档分类和聚类、推荐系统、机器学习等诸多领域的关键技术之一。研究基于地学领域本体,综合考虑了本体层级信息量、本体拓扑结构等基础上,引入约束性本体,实现相关度计算算法。实验结果表明,加入约束性本体条件下实现的算法,相关度计算结果明显提高。  相似文献   

11.
针对工作人员在工作中受工作环境的影响存在的不安全问题,运用人-机-环境系统工程理论,可靠性理论,模糊数学,从内因和外因两个方面分析了人的可靠性影响因素,并进一步给出了人的可靠性计算方法,采用模糊综合评价法评价人的可靠性。因为人与机器、环境相比人的行为具有自由度,人有随机应变处理情况的能力,然而这个自由度也正是人们处理简单的事情会产生失误的原因.  相似文献   

12.
浅谈动态网页技术   总被引:2,自引:0,他引:2  
互联网上许多浏览者常对丰富多彩的网页流连忘返 ,赞叹不已 ,但却不知精彩的动态网页为何种技术所制作。本文试图通过各种动态网页技术特点的简单介绍 ,使想要了解这项技术的读者有一个总体的认识。  相似文献   

13.
模板化网页主题信息的提取方法   总被引:37,自引:0,他引:37  
为了消除网页噪音,有效地提取基于模板的网页主题信息,提出了一种新的信息提取方法.该方法采用机器自动学习方式生成网页集的模板;以网页链接关系中的锚点文本作为提取目标对模板进行标记,生成对应模板的提取规则;依据模板的提取规则对网页主题信息进行提取.对国内2 588个新闻网页进行了检测.实验结果表明,该方法可以快速、有效地提取模板生成的网页集主题信息,准确率达99.5%.将该方法应用于搜索引擎系统(木棉检索)中,与原来的检索系统相比较,索引文件的大小减少约50%,检索的速度和精确度也得到提高.  相似文献   

14.
15.
0Introduction InReengineeringtheCorporation,MichaelHammer andJamesChampyhaveproposedtheconceptof“3C”,namely,Customers,CompetitionandChange,whichrepre sentthethreekindsofprimemoversstrengthsandthenew connotationofenterprisedevelopment[1].Economyglobaliza tionresultsinneversofiercecompetition,andthegreatsci enceprogressesimprovecompetitionlevelgradually.Thenit isnecessarytodevelopaneffectiveenterpriseevaluationsys temthatwillhelpenterprisetoassessitscompetenceandpo sitionitselfinmarket.Iti…  相似文献   

16.
开发 Web交互网页的三种主要技术 CGI、ISAPI、ASP在性能、灵活性、开发的难度、可移植性等方面都各有不同 ,因此从它们的原理出发 ,就以上几个方面进行比较  相似文献   

17.
提出一种利用网页特征进行会话识别的方法.通过分析网页本身的特征,计算站点中所有网页的特征向量.根据这些特征向量,可以计算任意网页之间的相关程度.按照用户请求页面在日志中的时间顺序,可以得到日志中所有直接相邻的页面记录的关联程度曲线.通过设定一个阈值,在关联程度曲线中波动较大的位置形成会话边界.将关联程度大的页面分类到一个会话中,从而完成会话识别.  相似文献   

18.
针对网页篡改问题,设计了一种基于机器学习的批量网页篡改检测方法.以一所综合性大学所有注册网站为研究对象,通过抓取网站首页面的所有信息,对抓取数据进行分类建立对应的检测规则,综合判断网页是否存在篡改.该方法分为学习阶段和检测阶段,学习阶段根据网页历史信息获取各个检测器的标准值,检测阶段对待检测网页的各个参数进行检测,综合多个检测器的输出,反馈检测结果,若结果为误报,则系统进行重新训练修正参数.以实际发生的网页篡改案例为依据,进行网页篡改模拟,并对误报率和漏报率进行了分析,结果表明:当检测数据集窗口大小为11,报警阈值为2时,误报率为1.183%,漏报率为0.878%,获得了最优的效果.  相似文献   

19.
一种基于后缀树的中文网页层次聚类方法   总被引:1,自引:3,他引:1  
为了便于用户浏览搜索引擎产生的搜索结果,结合STC算法和变色龙算法提出了一种中文网页的层次聚类方法-STCC算法。该方法采用雅可比系数修改了STC算法中基本类相似度的计算方法,然后根据基本类相似度矩阵,利用变色龙算法完成网页聚类。实验结果表明:STCC算法与STC算法相比。聚类精度提高将近10%,避免了单链接算法的链式效应,适用于大规模网页聚类。  相似文献   

20.
根据统计结果,从阅读角度对网页页面空间的构成进行了噪声与信息实体的划分与判断,改进了传统的DOM模型,增加了层次与样式等属性作为噪声判断的依据,逐级降噪,并利用新闻的标题、时间等外显特性,提出并实现了一种结合正向直接抽取与反向过滤降噪抽取新闻网页得到结构化数据的方法,并使用这种方法进行了大范围的效果验证。验证结果表明:这种方法信息抽取准确率高,对中英文新闻网页都有良好的适用性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号