首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
传统的协同过滤推荐算法主要以评分数据为数据源来计算和反映用户的兴趣偏好和资源相似度,并决定是否对潜在用户进行推荐物品。而忽视了用户、资源本身的特征,用户在不同时间对资源的认识和感兴趣程度是会变的。基于这个问题,本研究对传统算法进行了改进,提出了基于时间加权标签的信息推荐算法。该算法的主要思想是标签可被用户依个人偏好进行资源标注,标签代表用户对资源的兴趣特征,以用户集、时间、标签集及物品资源等4个量形成的多维关系,可以计算出用户和资源之间的标签特征向量,计算在不同时间段,用户对资源的偏好以及资源相似度,并且依据用户的历史行为来预测用户的偏好,并进行推荐。实验结果显示本算法有效地提高了推荐的准确性,获得了更好的推荐效果。  相似文献   

2.
传统的协同过滤推荐算法主要以评分数据为数据源来计算和反映用户的兴趣偏好和资源相似度,并决定是否对潜在用户进行推荐物品。而忽视了用户、资源本身的特征,用户在不同时间对资源的认识和感兴趣程度是会变的。基于这个问题,本研究对传统算法进行了改进,提出了基于时间加权标签的信息推荐算法。该算法的主要思想是标签可被用户依个人偏好进行资源标注,标签代表用户对资源的兴趣特征,以用户集、时间、标签集及物品资源等 4 个量形成的多维关系,可以计算出用户和资源之间的标签特征向量,计算在不同时间段,用户对资源的偏好以及资源相似度,并且依据用户的历史行为来预测用户的偏好,并进行推荐。实验结果显示本算法有效地提高了推荐的准确性,获得了更好的推荐效果。
  相似文献   

3.
综合语义角色标注语料的格式、标签结构、标签内容和用户可信度等多个特征, 实现一种自动的语义角色标注一致性计算方法。实验证明, 该方法对错误标注的召回率高, 并且速度快, 结果稳定, 可以大幅度地提高语义角色标注一致性检查的效率。  相似文献   

4.
基于本体的文档语义标注改进方法   总被引:2,自引:0,他引:2  
在领域本体知识的语义环境和资源文档结构基础上,提出一种文档语义标注改进方法,分析、计算标签一文档的词频相关性和语义环境在局部窗口的共现性,实现对各类文档资源的语义标注.该方法首先提取出文档资源的纯文本内容,并分解出子句、句和段落集合.然后,对于每个具体的领域知识项,在本体知识库中寻找其语义环境信息.最后,按照7条相关度规则,分别计算出这些信息与分解后文档内容的相关度,从而完成整个文档库内和知识库内的综合计算,得到该项知识与文档资源的最终相关度.卖验结果显示,该方法能够依据领域本体,有效地对互联网中大量以网页等形式存在的多种类文档知识资源进行自动语义标注.  相似文献   

5.
基于领域本体的自动化语义标注方法的研究   总被引:1,自引:0,他引:1  
介绍了语义网,本体以及语义标注的基本概念,对现有的语义标注方法以及技术进行了说明和分析.针对目前互联网上含有大量语义信息的HTML文档,提出了一种自动化的语义标注的方法.该方法对HTML文档进行结构分析,并参照词汇数据库Hownet和领域本体对文档进行语义分析,找出文档对应的语义分类树,给文档加上语义标签.以电子消费品领域的HTML文档为实验对象,实验结果证明了该方法具有一定的可行性.  相似文献   

6.
针对目前虚拟协作社区中重视交互行为研究,缺乏协作行为研究的问题,从项目和协作者的角度出发研究社区的标签关系,提出根据协作者与项目的发生关系和项目标签集合获取基于协作者的标签共生信息,并用该共生信息来计算标签之间相似度,然后提出一种新的协作者工作偏好模型。结合协作者工作偏好和标签相似度研究协作者之fg的关系,以及协作者与项目之间的关系,预测可能参与项目的协作者,提出协作者推荐算法。通过使用开源社区www.codeplex.com的数据进行实验,并与其他推荐算法进行比较,证明本文提出的推荐算法能较好地应用于协作者推荐。  相似文献   

7.
尽管深度神经网络算法在标签自动标注领域已取得一定的成果,但对于包含大量噪声标签的真实音乐数据集仍存在自动标注效果差的问题.为此,文中通过对音乐标签进行表示学习,挖掘音乐标签与音频特征之间的潜在关系,提出了基于标签深度分析的音乐自动标注算法.该算法先通过多层级卷积网络提取音频特征,再通过音乐标签向量的表示学习来降低噪声数据对音乐自动标注网络的不良影响.在真实音乐标注数据集上的实验结果表明,该算法能取得更高的平均受试者特征曲线下面积,标注效果优于其他自动标注算法.  相似文献   

8.
针对现有音乐推荐系统中音乐情感分析方法很难满足用户情感需求的问题,提出音乐内涵空间方法分析音乐情感。该方法选取音乐力度、速度、音强等表现要素,基于两极尺度的语义,构建音乐内涵空间。通过音乐内涵空间表示音乐情感,减少了音频特征客观水平与主观情感范围之间的差距,解决了情感标签标注音乐中由于用户情感经历不同造成的对音乐情感标注的主观差异性问题。在10 672条音乐评价数据集上,采用Kendall’s tau距离进行有效性验证,与基于情感标签推荐相比,实验结果表明,基于音乐内涵空间推荐音乐能较好地满足用户的情感需求。  相似文献   

9.
为了提高众包的质量并获取高质量的标注数据,已有许多基于真值推理的众包标注方法被提出.传统真值推理利用多噪声标签作为输入,通过聚合策略推断出真实标签,该过程只考虑了实例的标签而忽略了实例的特征,且忽略了不同工人对不同实例的标注质量.该文引入实例的特征以最大程度地挖掘实例中蕴含的有用信息.通过计算众包实例属于每一个类别的概...  相似文献   

10.
三维点云语义分割方法,是三维视觉环境感知中的重要任务,被广泛应用于自动驾驶、增强现实、机器人等领域.然而,大多数语义分割方法工作在全监督的模式下,为数据标注带来了极大的压力,为了解决对于大规模点云标注数据的依赖问题,许多工作基于有标签数据训练生成伪标签进一步迭代训练模型,但未考虑到错误伪标签累积所导致的确认偏差.针对该问题,本文提出了一种基于组对比学习的弱监督三维点云语义分割方法,在从伪标签中选择的正例组与负例组之间构造对比学习,令伪标签之间相互竞争,减少错误伪标签的梯度贡献,从而缓解确认偏差.实验结果表明,本文所提出的方法在S3DIS、ScanNetV2、Semantic3D等3个公开数据集上,相较于目前最优方法均取得了更优的精度.  相似文献   

11.
多标签文本分类是自然语言处理领域的重要任务之一.文本的标签语义信息与文本的文档内容有紧密的联系,而传统的多标签文本分类方法存在忽略标签的语义信息以及标签的语义信息不足等问题.针对以上问题,提出一种融合标签嵌入和知识感知的多标签文本分类方法 LEKA (Label Embedding and Knowledge-Aware).该方法依赖于文档文本以及相应的多个标签,通过标签嵌入来获取与标签相关的注意力.考虑标签的语义信息,建立标签与文档内容的联系,将标签应用到文本分类中.另外,为了增强标签的语义信息,通过知识图谱嵌入引入外部感知知识,对标签文本进行语义扩展.在AAPD和RCV1-V2公开数据集上与其他分类模型进行了对比,实验结果表明,与LCFA (Label Combination and Fusion of Attentions)模型相比,LEKA的F1分别提高了3.5%和2.1%.  相似文献   

12.
为解决传统的协同过滤算法不能准确理解用户的喜好,影响推荐准确率和推荐效果,提出基于社会化标签语义相似度的协同过滤算法.算法以标签语义相似度为基础,将项目资源和相关标签的语义信息纳入,显著提高了推荐系统的预测性能.研究结果表明:与以具体评分数据为基础的算法相比,该算法较好地解决了词相似度和句子相似度计算问题,推荐准确度和性能较以往的协同过滤算法有明显提高,改善了推荐效果.  相似文献   

13.
序列标注任务是自然语言处理领域的重要问题,包括命名实体识别、词性标注、意见抽取等具有重要应用价值的子任务。目前,长短期记忆网络-条件随机场模型(LSTM-CRF)作为序列标注任务的主流框架,虽然取得了很好的性能并被广泛使用,但仍存在局部依赖性以及受限于序列化特征学习的缺点。为了同步建模句子中每个词的局部上下文语义与全局语义,并将两部分语义进行有效融合,提出基于注意力机制的特征融合序列标注模型。具体地,本模型利用多头注意力机制建模句子中任意两个词之间的语义关系,得到每个词应关注的全局语义。考虑到LSTM学习的局部上下文信息和注意力机制学习的全局语义具有互补性,进一步设计了三种特征融合方法将两部分语义深度融合以得到更丰富的语义依赖信息。为验证模型的有效性,在四个数据集上进行了大量的实验,实验结果表明本模型达到较优的性能。  相似文献   

14.
为了有效地管理和利用网络文本信息,实现文本内容自动标签标注,提出采用多种深度学习模型对多标签文本分类进行研究。采用神经网络词向量模型word2vec获取文本数据的语义特征。对循环神经网络和卷积神经网络进行模型融合,引入注意力机制,形成TextRCNN_Attention神经网络模型。实验结果表明,TextRCNN_Attention模型结构融合了循环神经网络和卷积神经网络模型的优点,能更好地理解语义信息。Attention机制对文本特征提取更加合理,使模型将注意力聚焦在对文本分类任务贡献分值较大的特征上,分类效果更好。  相似文献   

15.
实体集合扩展是指给定某类别下若干示例作为种子,扩展得到属于该类别下的更多实体。传统的实体集合扩展方法主要考虑实体之间的共现关系,根据它们之间的相似程度进行迭代式的扩展,但这会导致语义偏转问题的出现,准确率较差。对此,提出了先根据LDA(latent dirichlet allocation)主题模型获得种子词集合语义信息,再通过标签传播来进行实体集合扩展的方法。该方法通过考虑实体列表整体蕴含的语义信息,避免了单个词可能带来的歧义问题;利用LDA模型,挖掘实体列表的上下文主题,丰富实体扩展过程中的语义信息,解决语义偏转问题。在实际数据集上取得了良好的检测效果,证明了本文方法的有效性。  相似文献   

16.
甘宏  王华武 《江西科学》2024,(1):169-176
为解决目前互联网信息过载问题,推荐系统已经广泛应用于电子商务、新闻资讯和影视音乐网站等。推荐算法目标就是挖掘用户的潜在兴趣,为他们提供个性化的信息推送,最终解决信息过载的问题,从而为用户解决该分类问题,选择合适推荐算法就显得尤为重要,同时也是解决数据挖掘领域的重要方法。但当前推荐模型缺乏对多源头异质数据的有效利用,同时在聚合语义信息的过程中存在信息损失问题。为解决上述问题,提出了一种基于异质信息网络的多维度语义融合推荐算法模型。首先,通过元路径和异质图描述推荐任务内复杂的语义结构,然后,对于元路径所引导的邻域进行划分,并通过基于多层邻域交互捕获多尺度语义信息,最后,通过在低阶、高阶维度下引导多尺度语义信息融合。实验结果表明,该方法具有较高的准确度。  相似文献   

17.
"语义鸿沟"是基于内容图像检索中广泛存在的问题。近年来,人们为减小语义鸿沟开展了许多研究工作,并将半监督学习方法用于其中。目前,多数的检索方法只考虑数据点的结构信息,或关注点集中在低层特征。为了充分利用结构信息缩小低层特征和高层语义之间的语义鸿沟,提出了一种半监督的双映射机器学习图像检索法。该方法在低层特征与标签之间建立双线性映射,最后使用Corel图像库同流行嵌入法进行对比,实验表明所提出的方法在检索过程中可以获得较好的效果,精准率有明显提高。  相似文献   

18.
实体关系抽取作为文本挖掘和信息抽取的核心任务,是知识图谱构建过程中的关键一环。然而人工建立大规模有标签的数据耗时耗力。使用小样本学习来进行关系抽取,仅仅需要少量样本实例就能使模型学会区分不同关系类型的能力,从而缓解大量无标签数据带来的标注压力。本文对中文关系抽取数据集FinRE进行了重构使之适用于少样本学习,并引入了语义关系网络HowNet对实体进行更为精确的语义划分,并在此基础上使用双重注意力机制提高句子编码质量,从而提高了模型在面对噪声数据时的效能,减轻了长尾关系的影响。使用本文的方法在该中文数据集进行了评估,与原始原型网络相比,基于句子级别与实体级别的注意力机制的原型网络在抽取准确率上提升了1%~2%的性能。  相似文献   

19.
针对当前电力文本分类方法中因忽视类别标签之间潜在语义关联关系而导致分类性能低效的问题,提出一种基于层次化分类模型的电力文本分类方法.首先,利用采集的电力成果非结构化文档,采用自动化信息提取技术和标注技术,构建电力文本多标签分类训练集,并结合领域知识分析,构建类别标签之间的层次化关系.然后,提出基于类别结构和标签语义混合...  相似文献   

20.
社会媒体共享网站允许用户上传图片的同时,也鼓励用户对上传图片内容加以标注.不过要对网站中所有图片进行内容标注,将是一项非常费时的任务;而如对同一类型图片统一进行标注则会大大降低内容标注的准确性.因此,文中提出了一个内容标注的新方法.首先,采用仿射传播聚类算法,从同一类型图片中获取一组具有代表性的图像;然后,利用图像内容的视觉信息和语义信息,对能够表示代表性图像内容标签的相关值进行估计,并依据随机游走算法改进标签的相关值;最后,通过半监督学习方法自动为同一类型的其它图片分配标签.基于Flickr图片集的实验结果表明所提方案的有效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号