首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
如何准确表达用户意图,判断网页与用户需求的相关性是信息检索技术研究的重要方向。本文提出了一种基于网页内容分割的语义信息检索算法。该算法根据网页半结构化的特点,按照HTML标记和网页的内容将网页进行区域分割。在建立HTML标记树的基础上,利用内容相似性和视觉相似性进行节点的整合。根据用户的查询,充分利用区域信息来对相关的检索结果进行排序。实验表明,本文提出的方法可以显著地提高搜索引擎的查询效果。  相似文献   

2.
车间流程的免疫调度算法   总被引:6,自引:0,他引:6  
为了高效地解决车间流程(Flow Shop)问题,提出了一种利用免疫算法求解Flow Shop调度问题的方法.该算法是根据人或者其他高等动物的免疫系统机理设计的,将调度目标和约束条件作为抗原,将问题的解作为抗体,对抗体采用按工件加工顺序进行自然数编码,并把最大流程时间的倒数作为适应度函数,新抗体的繁殖是通过部分匹配交叉算子和按工件顺序互换的变异算子实现的,对抗体产生的刺激和抑制通过抗体浓度来调节,而抗体浓度通过计算抗体之间的最大亲和力获得.通过对Flow Shop问题的基准测试表明,该算法不仅在求解问题的规模上具有很好的可伸缩性,而且在运算时间上也低于遗传算法和模拟退火算法.  相似文献   

3.
求解N最短路径检索问题的传统算法通常比较复杂,计算量较大,针对这个问题提出了一种基于人工免疫的求解算法。借鉴免疫系统的抗体多样性机制、克隆选择、高频变异、免疫记忆以及蚁群算法的信息反馈等原理,通过抗体种群的免疫进化实现对N最短路径检索问题的求解。在多个测试图上与传统Yen方法和基于Dijkstra的方法进行了对比实验,结果表明该算法能以较高的成功率正确地求得全局最优路径集,对图的尺寸和结构以及待求路径数量较不敏感,而且具有很好的时间性能。  相似文献   

4.
一种改进的Lucene语义相似度检索算法   总被引:2,自引:0,他引:2  
 Lucene的基础上,结合检索词项的语义信息,利用外部词典Wordnet分析检索词项与被检索文档中词项的语义相似度,在此基础上实现对文档语义信息的检索。通过分析现有的相似度量函数的核心特征,选择合适的语义相似度量方法,提出了一种新的词项语义相似度检索函数,该函数能够对检索文档按照语义相似度进行排序。实验结果表明,所提出的方法能够有效地提升文献检索的准确度。  相似文献   

5.
搜索引擎是目前最主要的WWW信息检索的工具 ,然而 ,用户对当前搜索引擎的检索效果并不满意。论文给出了基于文档文本内容和文档间超链信息的混合相似度计算方法,并给出了基于混合相似度的模糊(软 )聚类算法HTSC。对HTSC算法进行了理论分析 ,并对其中的核心算法进行了初步的实验验证。该算法可对搜索引擎返回的结果进行模糊聚类 ,以方便用户从中找到真正需要的信息。  相似文献   

6.
为了加强面向领域的搜索技术查询有效性与准确性,在证券领域本体的基础上对检索表达式进行扩展,使检索内容更加相关.对于初始检索集,根据本体进行面向语义排序,提高了检索结果集相关度.对面向证券领域的语义信息检索系统框架数据流与算法效率进行了分析,并对语义排序算法功能进行增强,得到自适应热点算法扩展,使系统可以在特定时间段内根据用户点击率反映阶段性关注热点.  相似文献   

7.
针对维吾尔语Web文档的有效检索问题,提出一种基于相关反馈和文档相似度的检索词加权方法.首先,对维吾尔语文档进行预处理,获得相应的词干集.然后,当用户输入多个检索词时,执行初始检索,并基于局部相关反馈思想提取出排名靠前的N个文档.接着,利用TF-IDF算法计算检索词与反馈文档之间的词频相似度,通过余弦距离计算文档之间的相似度,并以此对检索词进行两次加权.最后,根据加权后的检索词进行文档检索.实验结果表明:该方法能够准确地检索出用户所需的文档,并将其靠前排序.  相似文献   

8.
民办高校的办学目的是培养新型应用型人才,与传统普通高校培养的本科学生相比,具有较强的应用技术能力和实际操作能力.信息检索能力是本科生最基本的操作能力.该文基于本科生利用搜索引擎获得信息这一情况,根据3个不同样本,测量本科生信息检索能力.实证证明学习过文献检索知识的学生信息检索能力强于没有学习过文献检索知识的学生,说明本科院校开设文献检索课程非常必要.但现阶段文献检索方面的学习效果较差,文献检索课程的设置需要改革,应该将专题讲座和课程学习相结合,与信息素养相关的教育应跟随不同年级信息需求的变化"分阶段"循序渐进地实施.  相似文献   

9.
基于Agent的个性化智能Web信息检索   总被引:2,自引:2,他引:0  
介绍了Web信息检索的定义,并对web信息检索的原理、技术进行分析,针对存在的问题,结合智能Agent技术、神经网络、最好优先算法、信息过滤、相关反馈等多种算法,提出了一个基于Agent的个性化智能Web信息检索系统模型。  相似文献   

10.
工程图档中CAD信息的智能提取在PDM(Product Database Management)系统中的地位勿容置疑,这些信息是BOM(Bill of Material)的基础。在分析CAD图档dwg文件所涉及的数据栏(包含标题栏、明细栏)逻辑结构的基础上,提出一种针对基于矩形投影的数据栏信息的批量提取算法。通过实验验证了算法的可行性,该算法为CIMS的自动化生产提供了可靠的数据基础。  相似文献   

11.
网络信息过滤中的固定文章集表达方法   总被引:11,自引:0,他引:11  
为解决在信息过滤(inform ation filtering)中表达用户的信息需求困难的问题,提出了一种新方法——固定文章集法(fixed docum entset, F D S)。在这种方法中,用户可以通过评价一些专门选择的文章来表达自己的信息需求。这避免了用户选择关键词的困难,扩大了用户信息需求表达的空间,同时可以应用于处理多语种信息过滤和社会化过滤问题。选择固定文章集使用选择文章基因法(selectdocum ent'sgene, S D G),实验证明, S D G 的性能较其它方法有明显优势  相似文献   

12.
信息检索中通过网页链接信息提取文档内部关系进行搜索结果重排可以提升检索系统的性能。通过Markov网络来展现文档内部关系,该网络更直观地解释了文档间的语义相关性,利用这种文档内部语义关系计算文档重要性对检索结果进行重排。根据文档分布特征阐述了Markov文档网络的构造算法,讨论了Top-k及其相关文档的重要性评分算法,修正初始检索的文档评分。通过这种方式,既保持了文档图的查询相关性,又丰富了文档内部关系,扩大了重排序范围。实验表明,在多个标准文档集上基于Markov网络的结果重排技术对检索性能有较大的稳定提升。  相似文献   

13.
针对传统自整合信息检索方法在对图书自整合信息进行检索时, 存在检索结果不准确和效率低的问题, 提出一种基于Top-k查询算法的图书自整合信息快速检索方法. 首先利用Top-k查询算法对去噪后的自整合信息进行匹配, 然后建立自整合信息快速检索模型, 根据词意的重要性对图书自整合信息进行快速检索. 仿真实验结果表明, 该方法检索性能较好, 缩短了整体运行所需时间, 提升了检索效率, 且检索结果更准确.  相似文献   

14.
Multi-source information can be utilized collaboratively to improve the performance of information retrieval. To make full use of the document and collection information, this paper introduces a new information retrieval model that relies on the Dempster-Shafer theory of evidence. Each query-document pair is taken as a piece of evidence for the relevance between a document and a query. The evidence is combined using Dempster’s rule of combination, and the belief committed to the relevance is obtained. Retrieved documents are then ranked according to the belief committed to the relevance. Several basic probability assignments are also proposed. Extensive experiments over the Text REtrieval Conference (TREC) test collection ClueWeb09 show that the proposed model provides performance similar to that of the Vector Space Model (VSM). Under certain probability assignments, the proposed model outperforms the VSM by 63% in terms of mean average precision.  相似文献   

15.
适用于P2P的系统查询扩展优化方法   总被引:4,自引:0,他引:4  
P2P系统中,各种文本文档是很重要的共享资源,而传统的信息检索技术无法在此复杂系统中获得良好的效果.通过对隐含语义索引的分析,提出了语义双重查询扩展(SDQE)的方法,它利用各个peer上文档集提供的隐式反馈,通过比较查询的上下文信息,发现用户的隐含偏好,从而找出最符合用户查询需求的文档.实验证明,SDQE是可行的,并能有效地提高P2P系统中文本检索性能.  相似文献   

16.
针对当前定量化的地理信息检索模型无法有效处理自然语义导致检索结果不理想的问题, 以语义匹配为原则, 以定性表达为基础, 以推理方法为手段, 提出基于定性空间推理的定性地理信息检索的方法及其形式化模型, 实现Web文档信息内容与查询请求的定性表达和信息提取, 支持基于语义的检索匹配和结果排序, 并进行原型系统的实验验证。这种定性检索方法符合人类常识性认知和表述习惯的方式, 基于定性知识表达和推理决策技术的地理信息检索问题解决方法可以提高现代地理信息检索技术的有效性。  相似文献   

17.
为实现按部件快速检索汉字,把汉字递归表示为汉字结构、字首部件和字尾部件三元组。以部件为运算对象,字型结构为运算符,将汉字描述为前缀表达式。提出汉字表达式的双链表存储模型,设计双链表生成算法及基于双链表存储的检索方法。与直接采用数组存储相比,使用双链表存储时检索的平均比较次数仅为数组存储的50%,并易于动态提升检索性能。  相似文献   

18.
提出了一种基于机器学习的Web文本自动分类的信息检索解决方案。采用层次约束法完成文本自动抓取功能,文本频度与词条频度相结合的文本特征选择算法实现特征提取,并采用特征加权技术进一步提高文本分类性能。该算法不仅实现中文文本的自动分类,有效地提高Web信息检索的精度,而且能大大降低人工二次浏览筛选的工作量,还可用于电子政务和电子商务信息的自动分类。  相似文献   

19.
基于互信息的Web文档聚类方法   总被引:2,自引:2,他引:0  
由于网络信息的激增,如何充分利用大量的信息,并有效地为Web用户服务成为一个急需解决的问题。相关研究表明利用Web文档聚类的方法可以缩小信息检索的范围,提高查询准确率。通过分析Web文档的特征以及常用Web文档聚类方法的优缺点,提出了一种基于互信息理论的Web文档聚类的方法。在聚类的过程中,计算特征词之间的互信息值,根据阈值判断特征词是否属于同一类别。实验结果表明,该方法与K-Means聚类算法相比较,在准确率和召回率方面均有提高。  相似文献   

20.
基于新型免疫算法的污水处理过程最优控制   总被引:4,自引:0,他引:4  
为提高抗体群分布的多样性,采用抗体浓度与适应度矢量距离相结合的策略,设计了一种新型的免疫选择算子.为了提高搜索效率,将变尺度方法引入到混合变异中,得到了一种变尺度混合变异算子,并对其收敛性、稳定性和复杂度进行了分析.同时将该算法应用到污水处理过程运行费用的最优控制中,结果表明该方法是有效的,并且具有可靠的全局收敛性及较快的收敛速度.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号