首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 328 毫秒
1.
传统的查询扩展技术大都依据单个查询词的相关性来扩展查询词,忽略了查询词之间的相关性以及查询扩展词的不同重要程度,使得扩展效果不佳。针对此问题,提出了一种基于PageRank算法的查询扩展模型,该模型在Markov网络检索模型的基础上,从查询本身出发,将所有与查询相关的词组成Markov查询关联子网,在此子网上应用PageRank算法来计算候选扩展词的权重,由权重序来确定扩展词的选取,排名前列的扩展词进入检索阶段,消除噪音,提高检索效率。在标准数据集上的实验结果表明,本文提出的模型能有效地改善检索效果。  相似文献   

2.
微博搜索主要是计算文档与查询词之间的相关性,通过统计方法确定词量的权重,再用向量空间模型计算相关度.然而使用词量搜索方法,搜索精度并不高,检测到某条微博的信息含量有限,难以保证用户查询的关注度.针对这一问题,提出基于动态步长的微博搜索排序算法.该算法的主要实现过程:首先对微博已有的特征进行分析,然后用信息熵的方法计算微博信息含量,不使用词量为计算单位,而以词性为单位计算微博的相关度.最后把动态步长加入到List Net排序算法中,并用Armijo-Goldstein准则对步长进行优化.通过仿真实验表明,本算法排序效果更优.  相似文献   

3.
基于查询\|概念的用户兴趣模型构建   总被引:1,自引:0,他引:1  
针对查询\|概念二分图因概念抓取和查询词权重设计不足而导致构建的用户兴趣模型不合理的问题, 提出一种基于查询\|概念二分图的用户兴趣建模算法。通过tf×idf公式抓取概念, 并利用用户对查询词的浏览时间计算查询词的权重, 确保改进后的查询\|概念二分图能更准确地表示用户的查询意图。实验结果表明, 该算法构建的用户兴趣更为合理。  相似文献   

4.
在信息检索领域,基于不精确的语义信息进行查询,需要用户多次进行筛选,降低了查询效率,因此,语义相似度计算的精确性至关重要.目前,人们主要利用概念词的距离、内容、属性等信息进行语义相似度计算,其中综合距离,信息内容和概念词属性等因素的混合式语义相似度计算方法是比较热门的方法,但该方法进行语义相似度计算时,权值的确定是根据专家的经验,人为的进行确定,具有一定的主观性,影响了语义相似度计算的准确性和客观性.因此,本文提出了一种新的混合式语义相似度计算方法,采用模糊优化的思想确定混合式语义相似度计算方法中的权值,避免了主观性,使语义相似度的计算更准确,查询结果更符合人们的需求.  相似文献   

5.
基于用户兴趣及术语间关系的查询扩展方法   总被引:1,自引:0,他引:1  
针对传统查询扩展方法无法根据不同用户的需求进行检索的不足,提出一种基于用户兴趣和术语间关系进行查询扩展的方法。通过对用户浏览的网页文档及得到的网页日志进行挖掘得到一系列代表用户兴趣的术语,根据与初始查询词存在同义关系的用户兴趣术语及其权重对初始查询词权重进行调整,利用兴趣术语中与初始查询词存在本体关联关系的术语对初始查询进行扩展。实验结果表明,该方法相对于传统查询扩展方法在一定程度上提高了信息检索的查全率和查准率。  相似文献   

6.
提出了一种基于相似性的加权模糊产生规则计算方法.该方法允许权重与确定因子等参数用普通的语言词来表示,从而提高了模糊产生规则的知识表示力,使其更符合人们的思维习惯,为其应用提供了更大的范围.还提出了一种改进的方法来计算结果的模糊值及其确定因子,从而使计算结果更加合理.  相似文献   

7.
针对基于关键词匹配的搜索引擎存在的问题,提出一种基于语义词典的局部查询扩展方法,首先利用共现分析法和语义相似度选取扩展词,再对原始查询词和扩展词加权,最后计算文档相似度从而获得排序后的扩展查询结果.该方法克服了其它局部扩展方法将大量无关词加入查询的问题.实验表明,该方法有效地提高了查询结果的查准率.  相似文献   

8.
基于特定问题类别的汉语问答系统查询扩展   总被引:1,自引:0,他引:1  
针对汉语问答系统的特点,提出一种通过统计问答对方式获得各种问题类别的关联词,并根据类别关联词进行查询扩展的方法.在计算问题和答案文本相似度时,实现了一种基于最小匹配距离的计算方法,该方法充分考虑了查询词及查询扩展词在文本中的词频及位置分布信息.实验结果说明在汉语问答系统答案文本检索中,按照问题类别关联词进行查询扩展比未进行查询扩展在性能上有很大的改进.  相似文献   

9.
用户在查询XML文档时经常有模糊的或者不精确的查询要求.基于代数操作,提出了一种新颖的查询方法表达用户的模糊查询意图.该方法是定义一个模糊代数操作的集合,能够支持XML模糊查询.模糊查询的结果能够满足用户提出的模糊查询条件.为了处理多查询结果的问题,提出了一种考虑隶属度和用户自定义权重之间相关性的排序方法.进一步有效地计算了模糊查询结果的top-k答案.最后,初步的评估结果表明模糊代数操作方法能够有效地获取用户的模糊查询意图,验证了所提方法的有效性.  相似文献   

10.
基于Dempster-Shafer理论的查询扩展模型   总被引:3,自引:0,他引:3  
查询扩展是提高信息检索召回率的有效方法,已有许多研究者提出了诸多扩展方法,但大多数方法均是简单地把扩展的词添加到查询中.这样如若不加区分原查询词和扩充词,则扩展后的查询就可能偏离原查询的语义.该文基于Dempster-Shafer证据理论,提出了一个查询扩展的计算模型,该模型把原始查询项看作主证据,扩展项为原始查询项的辅助证据,为了能组合这两类证据,该文给出了两个带权重的Dempster-Shafer组合规则,实验表明该方法能有效地提高检索效率.  相似文献   

11.
The Internet presents numerous sources of useful information nowadays. However, these resources are drowning under the dynamic Web, so accurate finding userspecific information is very difficult. In this paper we discuss a Semantic Graph Web Search (SGWS) algorithm in topicspecific resource discovery on the Web. This method combines the use of hyperlinks, characteristics of Web graph and semantic term weights. We implement the algorithm to find Chinese medical information from the Internet. Our study showed that it has better precision than traditional IR (Information Retrieval) methods and traditional search engines.  相似文献   

12.
在实际工程中查找信息时,索引是很重要的指向信息,便于快速有效地查找和定位所需资源的位置。通过在索引中进行检索,快速定位查找对象,筛选不满足条件的数据,减少需要精确计算的计算量,达到提高查询效率的效果。"小世界网络"是一种存在捷径的网络结构,真实世界中的许多网络属于"小世界网络"。利用小世界效应可以帮助我们通过寻找捷径来快速找到真正需要的信息。本文首先对工程信息中的网络信息检索算法进行了一定概括,同时对小世界的相似性方法进行了研究,最终将小世界的链接相似性引入排序算法对索引数据的排序提出了改进。经过优化的算法可以提高返回信息的质量,将最符合用户要求的页面和链接进行返回,从而提高搜索结果的准确性和快速性。  相似文献   

13.
The electromagnetism-like(EM) algorithm is a meta-heuristic optimization algorithm, which uses a novel searching mechanism called attraction-repulsion between charged particles. It is worth pointing out that there are two potential problems in the calculation of particle charge by the original EM algorithm. One of the problems is that the information utilization rate of the population is not high, and the other problem is the decline of population diversity when the population size is much greater than the dimension of the problem. In contrast, it is more fully to exploit the useful search information based on the proposed new quadratic formula for charge calculation in this paper. Furthermore, the population size was introduced as a new multiplier term to improve the population diversity. In the end, numerical experiments were used to verify the performance of the proposed method, including a comparison with the original EM algorithm and other well-known methods such as artificial bee colony(ABC), and particle swarm optimization(PSO). The results showed the effectiveness of the proposed algorithm.  相似文献   

14.
本文针对用GA训练NN权值时 ,花费的代价随精度的提高而剧烈增加的缺陷 ,提出了一种利用IGA较强的全局搜索能力和IBPA较强的局部搜索能力的结合算法 ;先利用IGA优化多层前馈神经网络的权值 ,然后再用IBPA提高搜索精度 ,有效地避免了IBPA易陷入局部极小点和IGA过早收敛的缺点 ,实验结果表明 ,此算法是有效的  相似文献   

15.
为实现沥青混合料骨架细观接触的高通量计算,首先提出了近邻列表法与改进的窗搜索法两种接触计算方法;然后,使用4种(AC13、AC16、OGFC13及SMA13)沥青混合料对比了两种新方法与遍历法、窗搜索法及iPas软件在计算精度与效率方面的差异,采用虚拟试件研究了可实现计算速度与精度均衡的图像分辨率范围;最后,就高通量计算方法的适用性进行了验证。结果表明:近邻列表法可避免遍历法不可能发生接触集料对的冗余接触计算,改进的窗搜索法通过形态学膨胀处理即可完成传统窗搜索法环扫一周的目的;近邻列表法、遍历法、窗搜索法、改进的窗搜索法及iPas软件尽管计算原理存在差异但具有一致的精度;不同计算方法的计算效率排序为近邻列表法>遍历法>改进的窗搜索法>iPas软件>窗搜索法;图像分辨率的降低会提高接触计算的速度但是会降低接触点计算结果的准确性,综合考虑精度与效率的要求,图像分辨率范围处于0.05~0.075 mm/pixel时可实现计算速度与精度的均衡;近邻列表法能有效地实现沥青混合料骨架细观接触的高通量计算。  相似文献   

16.
非线性微分方程很难求得精确解析解,数值方法是求解非线性问题的一种有效手段。针对非线性微分方程,提出一种新的暂态时程积分方法。在暂态时程积分过程中,将非线性项看做非齐次项,在瞬态区间起始时刻处进行Taylor展开,并结合Romberg数值积分进行计算。Taylor展开时,将系统状态方程连续引入到非线性项导数的求解过程中,可简单有效地计算高阶导数。在此基础上,对含有时滞的非线性微分方程数值解法进行了研究,将时滞项同样看做非齐次项,利用线性插值处理后,结合Romberg积分进行计算。实例计算结果表明,该方法对有无时滞的非线性微分方程,均可求得较高精度的数值解。  相似文献   

17.
为了提高脑部肿瘤的磁共振成像(MRI)在肿瘤分割方面的精度和分割效率,提出了自适应阈值蚁群模糊聚类算法(TSAG_PnFCMS)。针对传统的模糊c均值聚类(FCMS)算法对噪声敏感,以及MRI图像中存在属性不同的样本点,在聚类过程中,将不同属性样本点的相关系数作为权重融入到欧氏距离的计算,提高聚类精度;针对蚁群算法容易陷入局部最优,提出一种自适应阈值蚁群算法,提高算法的全局搜索能力,将自适应阈值蚁群算法与改进的模糊聚类算法相结合,提高系统的分割精度和抗噪声性能,使得最终的分割效果达到最优。通过轮廓系数、目标函数收敛结果以及迭代时间进行实验仿真对比,表明改进算法的有效性,可见算法为颅内肿瘤图像的分割提供了可靠的技术手段。  相似文献   

18.
将经典的PageRank算法和汉明距离相似度算法结合,提出一种新的网页排序方法。通过结合汉明距离(Hamming distance)相似度算法,计算检索词和网页文本相似度,提高搜索查准率;在增加检索词的同义词的搜索过程中,通过改进汉明距离相似度算法,提高搜索查全率。实验结果表明,该方法与PageRank算法相比,拥有了更好的效果。  相似文献   

19.
随着高校课程与学生的高速增长,基于计算算法的高校自动排课方法成为目前算法设计研究的重要问题。基于遗传算法机制,提出了一种新的二进制编码机制和教室位置填充方法,用于改善排课的系统负载与效率。该算法摒弃了完全随机搜索的做法,依据适应度函数中各项权重比例的多寡为导向,定向随机生成染色体中的基因,精简了染色体信息量,大大缩短了系统的运行时间。在管理机制上,引入用户干预,高效处理初始化种群和排除冲突。仿真实验数据证明了该算法的收敛性与高效率。此外,在整个系统设计中,运用了基于容器的容器编程技术,实现了不定数据量的便捷处理。  相似文献   

20.
针对大型水电项目建设的特点,提出了水电项目的多目标综合评价方法.该方法采用随机赋权法确定权重,并与Monte-Carlo法模拟相结合,分析权重的变化对综合评价结果的影响,并可进行多方案比较分析.将该方法应用于金沙江乌东德水电站的正常蓄水位选择,结果表明该方法是可行的,可为规划阶段项目方案的选择提供决策依据.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号