首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 125 毫秒
1.
面向个性化需求的用户建模技术研究   总被引:1,自引:0,他引:1  
从用户需求多样性和随机性出发探讨了用户建模技术。对模型表示和模型更新两项关键技术进行了研究。基于向量空间模型表示用户模型,采用重心向量分类算法建立用户模型。分析用户浏览行为隐性地获取反馈信息,计算文档反馈度,提出了一种基于Rocchio算法的周期性自适应学习机制更新用户模型。以用户满意度为评价指标,通过实验,验证了对用户需求变化的动态追踪能力。  相似文献   

2.
机构知识库是以资源共享为导向的学术交流渠道,具有很好的研究价值.本研究主要工作如下:①借助RRS的工作原理及技术,实现机构知识库中资源的有效整合;②引入本体概念以构建用户兴趣模型,用基于本体加权向量模型表示RSS源;③给出了显示和隐式两种信息收集的权值估计方式,据此构建了基于RSS的兴趣模型.  相似文献   

3.
采用语义网络技术,提出了基于本体的向量空间模型(VSM),计算学习者的兴趣向量,克服了传统的VSM有术语间语义相关性被忽略的不足,提高了兴趣相似性比较的精确程度,同时提出了一种基于学习者兴趣相似匹配度和学习者兴趣匹配浓度的学习社区自组织分组算法.针对模型使用本体中的概念构造向量空间表现出的巨大维数,运用概念索引降维法对兴趣特征矩阵进行合理降维,大大降低了计算的复杂性.最后通过应用案例验证分析了该模型算法具有较高的分组效率和良好的扩展性.  相似文献   

4.
基于本体的数字图书馆信息过滤研究   总被引:4,自引:0,他引:4  
语义Web的概念正在成为计算机信息处理领域当前研究的热点之一 .本体 (Ontology)将在“语义Web”中起到至关重要的作用 ,它通过提供共享的并精确定义的术语源 ,将语法的互操作扩展到语义的互操作 .信息过滤目的在于依据用户兴趣 ,进行动态信息搜索和匹配以满足用户的需求 ,从而实现个性化服务 .本文提出了一种新的基于本体的数字图书馆信息过滤方法 ,它具有 3个显著的优点 :①采用了混合信息过滤模型 ,克服了基于内容和协作过滤的不足 ;②建立本体驱动的用户模板 ,解决了用户兴趣的获取问题 ;③信息内容采用本体来组织 ,实现语义级查询和高效的匹配机制  相似文献   

5.
为实现无公害农产品认证资源共享的个性化和智能化,促进无公害农产品品牌化销售,提出了一种基于领域本体的用户建模方法.通过无公害农产品认证资源本体的构建实现以领域本体中的概念和实例表示的用户特征模型,增加用户模型语义信息,并提供了模型的更新算法.结果表明,该方法能够提高用户特征模型表达的准确度.  相似文献   

6.
优化分组是计算机支持的协作学习(CSCL)中的一个重要研究内容。兴趣型学习社区建立的重点和难点在于学习者之间兴趣相似关系的判定和计算,采用语义网络技术,提出了基于本体的向量空间模型(VSM),计算学习者的兴趣向量,克服了传统的VSM有术语间语义相关性被忽略的不足,提高了兴趣相似性比较的精确程度,同时提出了一种基于学习者兴趣相似匹配度和学习者兴趣匹配浓度的学习社区自组织分组算法。针对模型使用本体中的概念构造向量空间表现出的巨大维数,运用概念索引降维法对兴趣特征矩阵进行合理降维,大大降低了计算的复杂性。最后通过应用案例验证分析了该模型算法具有较高的分组效率和良好的扩展性。  相似文献   

7.
混合语义模型的产品知识文档检索   总被引:1,自引:0,他引:1  
为解决产品知识文档检索过程中遇到的问题,提出一种基于混合语义模型的检索方法.该方法将传统的用户查询需求扩展为用户偏好、语境和用户查询混合而成的语义集合,并对知识文档和用户需求进行基于本体的模糊概念表达.对于知识文档,选择领域本体的叶节点来构造文本概念向量,根据概念在本体图中的深度、携带的信息量,及出现在文档与语料库中的频度来计算权重.同样采用本体表达知识语境与查询语义,建立用户偏好模型.针对检索模型的不同组成,阐述了相应的相似度计算方法,采用概念的语义距离计算用户当前语境和文档语境之间的相似度,用余弦法计算查询语义、用户偏好与文档的相似度.最后用实验验证了该方法的检索效果优于传统的向量空间方法.  相似文献   

8.
本体广泛应用于语义网、自然语言处理、数字图书馆等领域,而自动构建本体是这些领域的难点之一.全自动的本体构建以及如何令机器自己不断学习并更新已有的本体知识的研究仍然缺乏.提出了一种基于认知算法的中文本体自动构建方法,建立了自动构建本体的概念和物理模型,并根据此模型实现了一个初步的自动构建本体的工具,在此基础上基于某些公理化算子来实现对已有本体的扩充、缩减、修正等操作,实验证明该模型和系统很大程度上降低了在构建本体过程中的人力投入.  相似文献   

9.
个性化推荐系统中,设计用户的兴趣模型是一个关键问题.通过分析web环境下用户的特点和浏览行为,提出了一种新的基于向量空间模型的混合模型,并根据用户对页面的访问次数,浏览速度和驻留时间来更新模型.模型便于实现,且更新及时,简单.  相似文献   

10.
由于现有的经典本体映射方法以及相似度计算方法无法处理模糊信息,因此它们都无法计算模糊概念之间的相似度.为此,提出了一种新的基于向量空间模型的模糊概念相似度计算方法SimFC-VSM(similarityoffuzzyconceptbasedonvectorspacemodel).SimFC-VSM方法首先利用模糊本体中的模糊关系构建向量空间模型;然后将模糊概念表示成此向量空间模型中的向量;最后通过向量运算的方法来计算模糊概念之间的相似度.因此,所提出的方法SimFC-VSM可以有效地利用向量空间模型来计算模糊概念之间的相似度.  相似文献   

11.
为了在个性化搜索过程中能够准确地挖掘到用户的潜在兴趣并进行相应的聚类分析,提出采用潜语义空间的Zipf分布的特性,并结合PLSA(概率潜在语义分析)来获取全文的语义.即先通过Zipf分布原理找到文档的潜在语义空间,在此空间中对用户的兴趣进行聚类,并建立用户兴趣描述文件(user profile),即建立用户兴趣层次树.实验表明,所提出聚类算法的聚类效果明显优于传统的VSM(向量空间模型)的聚类效果,同时,在著名的CTI数据集上的个性化推荐实验结果也充分说明基于潜在语义空间构建的用户兴趣描述与用户真实兴趣相符合.  相似文献   

12.
提出一种加入时间因素的个性化信息过滤技术.在建立用户模型时,根据用户行为动态确定用户兴趣类别的数量并建立(调整)相应兴趣类别的特征向量.通过在表示用户兴趣类别的特征向量中添加时间因素,可以兼顾用户的短期和长期兴趣,跟踪用户的兴趣变迁.在信息过滤时,首先计算文档与用户兴趣类别的相似度,并根据时间参数调整最终得分.本系统每秒钟能学习文档267篇,为402篇文档评分;在召回率为70%时,精确率为57%.  相似文献   

13.
We propose an algorithm for learning hierarchical user interest models according to the Web pages users have browsed. In this algorithm, the interests of a user are represented into a tree which is called a user interest tree, the content and the structure of which can change simultaneously to adapt to the changes in a user's interests. This expression represents a user's specific and general interests as a continuurn. In some sense, specific interests correspond to shortterm interests, while general interests correspond to longterm interests. So this representation more really reflects the users' interests. The algorithm can automatically model a us er's multiple interest domains, dynamically generate the in terest models and prune a user interest tree when the number of the nodes in it exceeds given value. Finally, we show the experiment results in a Chinese Web Site.  相似文献   

14.
在微博社交网络中,微博文本内容短小,主题覆盖较少,同时主题变化快,用户兴趣更新频繁。已有用户模型不能完全准确刻画微博用户变化的兴趣。友邻集由用户认知度高的群体组成,友邻集的主题兴趣可以全面反映目标用户的多样化兴趣。利用目标用户的友邻集,在本体用户模型上构建微博用户的友邻主题兴趣集,计算更新友邻主题兴趣度,提出友邻-用户模型的实现算法。实验表明,在微博社交网络平台中,友邻一用户模型的微博主题推荐精度要优于传统的用户模型。  相似文献   

15.
针对俄文新闻文本的话题检测问题,以俄文文本的自动形态分析、命名实体识别作为辅助手段,设计了一种基于本体描述俄文新闻文本和话题信息并进行相似度计算的方法,随后使用Single-pass算法进行俄文文本的话题检测实验。通过对比基于向量空间模型和基于本体模型的俄文话题检测结果,证明了后者具有相对较高的准确性和有效性。  相似文献   

16.
基于加权概念网络的用户兴趣建模   总被引:5,自引:0,他引:5  
提出了一种基于加权概念网络(WCN)的用户兴趣建模方法,该方法利用动态学习算法,挖掘蕴含在用户反馈文档中的概念及其概念关系,建立WCN的用户模型,从而捕捉和表述用户兴趣偏好.基于WCN用户兴趣模型,提出了检索提问个性化理解以及文档个性化重评价的实现方法.为了检验提出方法的建模性能,设计了信息过滤仿真试验.测试结果表明,WCN有较好的用户建模性能.  相似文献   

17.
目的提高扩展词与用户查询在语义层面上的关联,解决歧义扩展问题。方法基于差分进化算法的语义查询扩展技术先利用领域本体提供的领域背景知识来获取候选扩展词集,然后通过分析用户日志来获取用户检索偏好信息,最后利用差分进化算法确定同用户检索意图最相符的扩展词集。结果比起前沿的局部上下文分析方法,基于差分进化算法的语义查询扩展技术能够确定更高质量的扩展词集。结论利用用户日志和本体中概念间的语义关系作为背景数据来过滤无关的扩展词可以有效提高后续语义扩展过程的效率,差分进化算法能够有效排除同用户检索意图无关的词集并确定高质量的扩展词集。  相似文献   

18.
一种提高文本聚类算法质量的方法   总被引:1,自引:0,他引:1  
针对基于VSM(vector space model)的文本聚类算法存在的主要问题,即忽略了词之间的语义信息、忽略了各维度之间的联系而导致文本的相似度计算不够精确,提出基于语义距离计算文档间相似度及两阶段聚类方案来提高文本聚类算法的质量.首先,从语义上分析文档,采用最近邻算法进行第一次聚类;其次,根据相似度权重,对类特征词进行优胜劣汰;然后进行类合并;最后,进行第二次聚类,解决最近邻算法对输入次序敏感的问题.实验结果表明,提出的方法在聚类精度和召回率上均有显著的提高,较好解决了基于VSM的文本聚类算法存在的问题.  相似文献   

19.
概要介绍了语音识别技术和微软语音开发应用程序接口(Microsoft Speech API,SAPI)。语音识别技术随着计算机技术的发展而逐渐成熟,使计算机能够识别用户的语音输入,记录下用户的语音信息并执行相应的命令。微软的SAPI是Windows操作系统下的语音识别开发平台,它开发快捷,有设计良好的运行机制、识别引擎和调用接口,能够模块化组件开发。其次,利用SAPI,设计实现了应用语音识别技术的数字图书馆检索系统。此系统使用户在使用数字图书馆时检索更加方便,读者说出想查询的内容,系统即可完成整个检索过程并显示查询结果。此系统基于SAPI平台开发,采用了MySQL作为后台数据库。此检索系统分为一站式检索和智能检索。其中,一站式检索为读者提供了通用语音识别框,读者检索时无需使用鼠标和键盘,只需说出自己想要查找内容的关键词即可查询。一站式检索系统不仅能够实现对图书馆数据库的关键词检索,而且在界面上还同步提示出可选关键词、现有馆藏书目、借阅情况等信息,协助用户检索信息。而智能检索是在一站式检索的基础上,结合了中文分词技术,进一步降低搜索难度方便用户使用。用户检索时无需考虑关键词、检索语法,只需像平时一样说出想检索的内容,检索系统会自动识别用户的语音,然后进行智能分词,再通过转换过程,过滤出关键词并生成专业的检索语法进行检索,并最终返回检索结果。整个识别、分词、转换过程由系统自动完成,无需读者干预。随着技术的进步,结合了语音识别的检索系统将使数字图书馆能够更加方便快捷地为读者服务。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号