首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 203 毫秒
1.
混合语义模型的产品知识文档检索   总被引:1,自引:0,他引:1  
为解决产品知识文档检索过程中遇到的问题,提出一种基于混合语义模型的检索方法.该方法将传统的用户查询需求扩展为用户偏好、语境和用户查询混合而成的语义集合,并对知识文档和用户需求进行基于本体的模糊概念表达.对于知识文档,选择领域本体的叶节点来构造文本概念向量,根据概念在本体图中的深度、携带的信息量,及出现在文档与语料库中的频度来计算权重.同样采用本体表达知识语境与查询语义,建立用户偏好模型.针对检索模型的不同组成,阐述了相应的相似度计算方法,采用概念的语义距离计算用户当前语境和文档语境之间的相似度,用余弦法计算查询语义、用户偏好与文档的相似度.最后用实验验证了该方法的检索效果优于传统的向量空间方法.  相似文献   

2.
用户查询与文档之间语义匹配但词法不匹配现象是影响信息检索效果的重要原因之一。鉴于语义检索受限于本体自身的质量,为了降低其对检索效果的影响,通过分析目前语义查询扩展的研究现状,在已有概念相似度计算算法研究基础上进行改进和融合,提出了一种基于本体的信息检索查询扩展方法,并主要对基于本体技术的概念相似度计算算法进行修正,得到了组合向量空间模型QCR(Q,Ci)=∑k=1,…,Kwk-Sim_Rel(qK,Ci),作为引入查询扩展后的查询结果相关度评价方法。这种方法中,通过建立本体模型并计算本体中概念间的语义相似度来确定扩展查询词,它可以根据用户输入的名称,检索出相关文档并由用户自由设置相似度阈值,并将普通主题检索与语义检索合并,在本体乏力时返回普通检索结果,这在一定程度上弥补了垂直检索系统发展的不足。
  相似文献   

3.
用户查询与文档之间语义匹配但词法不匹配现象是影响信息检索效果的重要原因之一。鉴于语义检索受限于本体自身的质量,为了降低其对检索效果的影响,通过分析目前语义查询扩展的研究现状,在已有概念相似度计算算法研究基础上进行改进和融合,提出了一种基于本体的信息检索查询扩展方法,并主要对基于本体技术的概念相似度计算算法进行修正,得到了组合向量空间模型QCR(Q,Ci)=∑k=1,…,Kwk*Sim_Rel(qK,Ci),作为引入查询扩展后的查询结果相关度评价方法。这种方法中,通过建立本体模型并计算本体中概念间的语义相似度来确定扩展查询词,它可以根据用户输入的名称,检索出相关文档并由用户自由设置相似度阈值,并将普通主题检索与语义检索合并,在本体乏力时返回普通检索结果,这在一定程度上弥补了垂直检索系统发展的不足。  相似文献   

4.
用户查询与文档之间语义匹配但词法不匹配现象是影响信息检索效果的重要原因之一.鉴于语义检索受限于本体自身的质量,为了降低其对检索效果的影响,通过分析目前语义查询扩展的研究现状,在已有概念相似度计算算法研究基础上进行改进和融合,提出了一种基于本体的信息检索查询扩展方法,并主要对基于本体技术的概念相似度计算算法进行修正,得到了组合向量空间模型QCR(Q,Ci)=∑k=1.….K wk*Sim_Rel(qK,Ci),作为引入查询扩展后的查询结果相关度评价方法.这种方法中,通过建立本体模型并计算本体中概念间的语义相似度来确定扩展查询词,它可以根据用户输入的名称,检索出相关文档并由用户自由设置相似度阈值,并将普通主题检索与语义检索合并,在本体乏力时返回普通检索结果,这在一定程度上弥补了垂直检索系统发展的不足.  相似文献   

5.
基于本体的信息检索技术的研究   总被引:2,自引:0,他引:2  
基于关键词处理的传统检索技术会在检索过程中遗漏大量与检索概念相关或同义的内容.针对这种情况,提出了一种基于本体的Web信息检索模型.该模型能够利用本体得到具有语义的索引项,并生成较好的文档逻辑视图和用户需求逻辑视图,从而可以使检索性能大大提高.  相似文献   

6.
为了解决传统检索技术无法为用户提供个性化服务和检索效率低的问题,提出了一种基于领域本体的个性化文本信息检索模型,阐述了该模型的结构和关键算法,并验证了算法的可行性。实验结果表明:基于领域本体的个性化文本信息检索能有效提高信息检索的准确率和效率。  相似文献   

7.
针对信息检索模型检索性能的问题,将本体及本体语义相似度度量方法运用于基于贝叶斯网络的信息检索模型中,通过利用领域本体表达信息的规范性及本体语义推理的准确性对查询需求进行扩展,提高查询的性能。给出了信息检索模型和概念语义相似度计算及查询检索方法与过程,实验证明该方法在一定程度上能够提高检索系统的性能。  相似文献   

8.
为了提高专业领域内信息检索的查准率,使检索结果在语义层面能够重新进行排序以去除非相关条目,利用语义Web中的本体技术和本体标准描述语言OWL建立了证券领域本体,并且基于证券领域本体提出了面向专业领域的信息资源检索系统IRS—SA,该系统有助于机构或者个人投资者获得及时有效的证券信息.系统接受输入检索关键词从而利用查询转化器自动构造或扩展用户查询,将自然语言查询转化为系统内部的格式后,使检索获得的结果按照本体中定义的概念及关系进行语义再排序,并将最后所得结果返回给用户,提高了文档语义相关性程度.  相似文献   

9.
为提高信息检索的准确率和全面性, 在对语义检索技术和领域本体的构建进行充分研究的基础上, 在网络教育资源的检索工作中应用了本体语义的概念, 提出对用户输入的查询条件进行基于本体的查询扩展算法,设计实现了使用Lucene 对扩展后的查询条件进行检索的语义检索模型。实验结果表明, 该检索模型的综合查全率为81郾5%, 综合查准率为83郾1%, 这两项指标均优于传统的关键字检索方法。  相似文献   

10.
针对传统文档表示模型中语义关系缺失、特征词权重计算单一及海量数据的实时处理等问题,基于领域本体概念间的语义关系,结合MapReduce框架,提出一种特征权重自适应增强的文档领域本体模型(EAS-VSM)构建算法。该算法通过构造概念语义关系矩阵,将领域本体中概念之间的语义关系增强至每一个概念特征词中,从而实现概念特征词权重的自适应增强。实验结果显示,算法的加速比和可扩展性两项指标与数据规模呈明显的线性关系,证实模型的并行算法性能良好,且相较于传统的VSM和LSA模型,EAS-VSM模型计算的结果与专家经验更为接近,更能反映文档间的相似程度。  相似文献   

11.
Web2.0为信息检索提供了很多可以使用的资源,其中两种资源对于个性化检索而言非常有益,那就是社会化标注和网页分类信息。用户给出的标签反映了其对于网页的认识和思考,而用户标注过的网页的类别则反映了用户在选择时的偏好和兴趣,两者的结合使用对个性化检索能起到良好的效果。在仅使用社会化标注进行个性化检索的方法上,提出基于标注和网页分类进行个性化检索的方法,通过两者结合筛选出兴趣和偏好相近的用户,进行用户属性的扩展,并在扩展时考虑用户的质量,从而能在个性化检索中取得更好的结果。在真实数据集上的实验表明,本文方法具有一定的优势。  相似文献   

12.
期权定价模型的参数估计问题通常是非线性优化问题,且是非凸优化问题,经典的优化方法已不再适用。为此探寻用交叉熵蝙蝠算法来求解Merton跳-扩散模型、Heston随机波动模型和Bates带跳的随机波动模型的参数估计问题。实证结果表明该方法是有效可行的。  相似文献   

13.
搜索引擎是用户利用网络资源不可或缺的工具,但目前搜索引擎的查准率有待提高。对于不同的用户而言,即便是相同的查询词其期望的查询对象可能不同,那么搜索引擎此时的查准率其实就是让搜索引擎具有个性化搜索的特点。个性化搜索引擎的关键是用户兴趣的确定和文档兴趣值的确定,只有把抽象的个性化兴趣量化成数值类的模型,才可以了解用户真正的需求和量化文档与兴趣的相关程度,从而准确地对网页进行筛选并达到个性化排序的功能。  相似文献   

14.
访问控制是实现OSN隐私保护的有效方法之一,针对已有基于关系的访问控制中存在的控制粒度粗、不够灵活等问题,提出OSN访问控制下的关系度量机制,利用用户间关系强弱进一步区分关系(群组)中不同用户的访问权限。基于OSN用户交互特点,由交互行为分析用户关注度,利用用户关注度相对因子、交互强度、关系强度时间衰减性综合产生用户间关系强度。实验结果证明了所提关系强度度量方法的可行性和有效性。  相似文献   

15.
分析了BSON文档的结构,通过比较类似结构的映射方法,给出了BSON文档树的概念和结构,并提出NoSQL数据库文档到关系数据库的映射策略,在此基础上建立了BSON文档模式和关系模式之间的双向映射模型,并给出了双向映射算法.  相似文献   

16.
信息检索中通过网页链接信息提取文档内部关系进行搜索结果重排可以提升检索系统的性能。通过Markov网络来展现文档内部关系,该网络更直观地解释了文档间的语义相关性,利用这种文档内部语义关系计算文档重要性对检索结果进行重排。根据文档分布特征阐述了Markov文档网络的构造算法,讨论了Top-k及其相关文档的重要性评分算法,修正初始检索的文档评分。通过这种方式,既保持了文档图的查询相关性,又丰富了文档内部关系,扩大了重排序范围。实验表明,在多个标准文档集上基于Markov网络的结果重排技术对检索性能有较大的稳定提升。  相似文献   

17.
Optimal clustering for the web documents is known to complicated combinatorial Optimization problem and it is hard to develop a generally applicable oplimal algorithm. An accelerated simuIated arlneaIing aIgorithm is developed for automatic web document classification. The web document classification problem is addressed as the problem of best describing a match between a web query and a hypothesized web object. The normalized term frequency and inverse document frequency coetficient is used as a measure of the match. Test beds are generated on - line during the search by transforming model web sites. As a result,web sites can be clustered optimally in terms of keyword vectors of corresponding web documents.  相似文献   

18.
流式文档结构识别对于文档自动排版和优化、信息检索等领域有着重要作用.以往针对流式文档结构识别主要集中于学术论文领域,对于其他诸如公文、报告等多类型的文档结构识别研究较少.针对此现状,使用聚类的方法对文档进行分类,在此基础上提出了针对不同文档分类的、基于双向门控循环单元-条件随机场(bidirectional gated recurrent unit-conditional random field,BIGRU-CRF)的文档结构识别方法,以此来解决多类型文档结构识别的问题.实验结果表明,该方法不仅能够提高学术论文结构识别的效果,对其他类型的文档结构也能够进行较好地识别.  相似文献   

19.
文章提出一个office文档和数据库相结合的自动题库管理模型。教师提交试卷文档后,操作员对试卷进行预处理,然后将试卷相关的属性信息保存到数据库,建立与文档关联的数据库,被预处理过的试卷文档采用文档目录存储管理。组卷时系统从数据库中抽取试题有关属性,然后使用组卷算法通过文档结构读取试题,完成最后组卷。  相似文献   

20.
赵新慧 《科学技术与工程》2011,18(18):4232-4236
研究了基于节点兴趣的非结构化P2P自动搜索的机制和算法。节点兴趣由节点所共享的文档的k-高频词向量描述。网络中的节点采用"拉"(pull)通信方式。节点不能把信息"推"(push)给其它节点,这样就保证了节点只会收到它想要的信息。系统中的节点根据用户提供的共享文档自动获知用户感兴趣的文档类型,并且自动和其它具有相似兴趣的节点组成一个覆盖网络。节点定期自动获取覆盖网络中其它节点共享的新文档信息,以方便用户查找和浏览新文档。并且通过仿真实验验证了系统具有可扩展性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号