首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 93 毫秒
1.
为从互联网用户的关注行为中抽离出更有效的用户标签,通过挖掘用户行为的关注特性,对标签进行预测,完善用户画像系统.首先,构建用户和关注行为对象的邻接矩阵,对其进行奇异值分解,得到行为特征矩阵;然后,利用逻辑斯蒂回归模型训练特征矩阵,预测用户行业属性标签;最后,针对微博上673144条用户行为数据进行实验研究.结果表明,利...  相似文献   

2.
提出了一种融合标签局部相关性的标签分布学习(label distribution learning, LDL)算法,该算法分为3个阶段。初始预测阶段构建多层神经网络模型,将样本的原始特征作为输入、初始预测的标签分布作为输出;局部矫正阶段首先利用k-means聚类算法获得不同类所描述的局部信息,然后针对不同类计算对应的协方差矩阵,利用该矩阵来矫正初始预测的标签分布,获得每个类对应的矫正标签分布;标签融合阶段对矫正后的标签分布进行加权,再与初始预测的标签分布进行融合,得到最终的预测分布。在8个公开数据集上与9种常用的LDL算法进行对比实验,结果表明本文的算法能较好地描述标签局部相关性,在多个主流评估指标上排名靠前。  相似文献   

3.
提出一种基于视觉内容语义相关度的图像标签自动排序方法.该方法按照标签与图像内容的语义相关程度对网络共享图像的标签进行排序.首先,算法基于贝叶斯理论给出标签与图像内容语义相关度计算的概率表述.然后,融合多种视觉特征以实现对不同语义的标签与图像内容相关度概率的准确估计,具有较高的可扩展性.实验数据采用149 915幅Flickr网站下载图像,实验结果验证了本文方法的有效性.  相似文献   

4.
针对现有大多数多标签特征选择算法未能有效去除特征空间冗余特征,同时也忽略了标签差异性的现状,提出一种基于相关性分析的多标签特征选择方法,利用特征之间的相关度对特征进行分组,解决了特征之间的相关性问题.根据样本所对应的标签属性对样本做一个正负类的聚类,对于正样本和负样本所构成的正类簇和负类簇单独确定其聚类个数,并计算原特征到正负类簇中各个类中心的距离,如此便产生了标签特定特征空间;将标签共享的特征空间和标签特定特征空间融合,考虑到多个标签之间的个性和关联性,解决了标签的差异性问题.实验测试表明,相较于现有的多标签特征选择算法,提出的基于相关性分析的多标签特征选择方法在各个分类指标上均有较优的表现,充分证明了该方法的有效性.  相似文献   

5.
为了从文本中可以更加准确地分析其蕴含的内容,给人们的生产生活提供建议,在基于深度学习的传统多标签分类方法的基础上,提出一种融合多粒度特征和标签语义共现的多标签分类模型。该模型利用双向长短时记忆网络双向长短时记忆网络(bidirectional long short-term memory network, Bi-LSTM)提取多粒度的文本特征,获得不同层次的文本特征;并通过计算pmi的方式构建标签关系图,利用图卷积网络(graph convolution network, GCN)深入提取标签的隐藏关系,获得具有标签信息的文本表示;最终融合多粒度文本特征,进行多标签文本分类。在AAPD和news数据集上进行实验。结果表明:所提出模型的Micro-F1值分别达到0.704和0.729,验证了模型的有效性。  相似文献   

6.
7.
祝贺 《科技情报开发与经济》2013,23(14):105-107,138
介绍了标签本体的定义及特点,通过对标签本体多元标注形式的分析,总结出了标签构建的准则,并在研究本体构建方法的基础上,提出了骨架法标签本体构建方法,对标签本体的应用扩展作出了相应的理论研究。  相似文献   

8.
随着在线学习平台的不断应用,大量的数字化资源数据被积累。如何利用资源背后的大数据,为教学资源建设和在线学习者学习提供优化服务,已经成为新的研究热点。本文通过对在线平台数据资源的基本属性和行为属性以及在线用户的行为属性等数据信息进行深层次挖掘,提出了一套资源画像和用户画像构建方法,并在两种画像之间建立关联,从而为教学资源建设和在线用户个性化学习提供数据支持,为在线用户推荐个性化学习资源提供数据基础。  相似文献   

9.
多标签文本分类是自然语言处理领域的重要任务之一.文本的标签语义信息与文本的文档内容有紧密的联系,而传统的多标签文本分类方法存在忽略标签的语义信息以及标签的语义信息不足等问题.针对以上问题,提出一种融合标签嵌入和知识感知的多标签文本分类方法 LEKA (Label Embedding and Knowledge-Aware).该方法依赖于文档文本以及相应的多个标签,通过标签嵌入来获取与标签相关的注意力.考虑标签的语义信息,建立标签与文档内容的联系,将标签应用到文本分类中.另外,为了增强标签的语义信息,通过知识图谱嵌入引入外部感知知识,对标签文本进行语义扩展.在AAPD和RCV1-V2公开数据集上与其他分类模型进行了对比,实验结果表明,与LCFA (Label Combination and Fusion of Attentions)模型相比,LEKA的F1分别提高了3.5%和2.1%.  相似文献   

10.
阐述了学科导航在我国的发展现状,分析了制约学科导航发挥作用的几点因素,探讨了社会性标签在改善用户参与性方面的作用,介绍了应用社会性标签改善学科导航系统的问题。  相似文献   

11.
提出一种基于语义关联性特征融合的大数据挖掘算法.对云存储大数据分布式信息流进行高维相空间重构,在重构的相空间中提取大数据的语义关联维特征量,以提取的特征量为测试集进行自适应学习训练.采用模糊C均值算法进行大数据语义关联特征的稀疏性融合和聚类处理,在聚类中心实现对挖掘目标数据的指向性聚敛,输出数据挖掘结果,并采用特征压缩器进行降维处理,降低计算开销.仿真结果表明,采用该方法进行大数据挖掘的特征提取准确性较好,挖掘数据的聚类能力较强,在实时性和准确性方面具有优势.  相似文献   

12.
一种基于语义的恶意行为分析方法   总被引:3,自引:0,他引:3  
提出了一种基于语义的恶意行为分析方法,可以对基于函数调用的攻击进行完整刻画,支持流敏感、上下文敏感且路径敏感的函数间分析。与现有方法相比可以更加准确地描述全局状态中的基于函数调用的攻击行为。针对多个恶意程序和应用程序的分析表明,该方法可以有效地识别代码中的恶意行为。  相似文献   

13.
提出了一种基于语义的恶意行为分析方法,可以对基于函数调用的攻击进行完整刻画,支持流敏感、上下文敏感且路径敏感的函数间分析。与现有方法相比可以更加准确地描述全局状态中的基于函数调用的攻击行为。针对多个恶意程序和应用程序的分析表明,该方法可以有效地识别代码中的恶意行为。  相似文献   

14.
针对传统端到端模型在输入文本语义较复杂情况下生成的问题普遍存在语义不完整的情形,提出一种基于语义特征提取的文本编码器架构.首先构建双向长短时记忆网络获得基础的上下文信息,然后采用自注意力机制及双向卷积神经网络模型分别提取语义的全局特征和局部特征,最后设计一种层次结构,融合特征及输入自身信息得到最终的文本表示进行问题生成.在数据集SQuAD上的实验结果表明,基于语义特征提取与层次结构进行问题生成效果显著,结果明显优于已有方法,并且语义特征提取和层次结构在任务的各评价指标上均有提升.  相似文献   

15.
Current research on metaphor analysis is generally knowledge-based and corpus-based, which calls for methods of automatic feature extraction and weight calculation. Combining natural language processing(NLP), latent semantic analysis(LSA), and Pearson correlation coefficient, this paper proposes a metaphor analysis method for extracting the content words from both literal and metaphorical corpus, calculating correlation degree, and analyzing their relationships. The value of the proposed method was demonstrated through a case study by using a corpus with keyword "飞翔(fly)". When compared with the method of Pearson correlation coefficient, the experiment shows that the LSA can produce better results with greater significance in correlation degree. It is also found that the number of common words that appeared in both literal and metaphorical word bags decreased with the correlation degree. The case study also revealed that there are more nouns appear in literal corpus, and more adjectives and adverbs appear in metaphorical corpus. The method proposed will benefit NLP researchers to develop the required step-by-step calculation tools for accurate quantitative analysis.  相似文献   

16.
针对现有深度学习算法修复壁画图像时,未充分考虑破损区域与完好区域信息的一致性,导致修复结果易出现边界效应和纹理模糊等问题,提出了一种联合特征推理和语义增强的渐进式壁画修复算法.首先,设计区域渐进结构,实现了待修复区域的渐进式收缩修复.然后,利用特征推理模块,对缺失像素的特征值进行迭代推理填充,减小壁画修复重构误差,增强壁画破损区域与完好区域之间的相关性.最后,将各层特征图自适应融合,并采用语义增强模块进行纹理细节迁移,提升壁画补全区域和整体的一致性.敦煌壁画数字化修复实验表明:所提方法修复结果具有更好的纹理细节一致性,在主客观评价指标上均优于比较算法.  相似文献   

17.
射频识别系统在读取标签时,会因碰撞问题而严重影响识别率,导致系统工作效率降低.为此,文中提出一种基于标签信息分组的射频识别防碰撞算法.该算法根据标签信息将标签划分成若干组,按分组顺序依次识别,通过减少同时响应阅读器命令的标签数量来达到降低标签碰撞概率的目的.文中还对算法中的分组效率和时隙选择问题进行了分析、证明和仿真....  相似文献   

18.
现有社会标签推荐技术存在数据稀疏、时间复杂度高以及可解释性低等问题,鉴于此,提出基于概率矩阵分解(PMF)进行潜在特征因子联合分解的标签推荐算法(TagRec-UPMF),它结合用户、资源及标签3方面的潜在特征,联合构建对应的概率形式的潜在特征向量,然后根据它们两两之间的特征向量内积进行线性组合,从而产生Top-N推荐.该算法解决了数据规模大且稀疏情况下的精度问题,算法的线性复杂度使得其可用于大规模数据.实验结果表明,相比于TagRec-CF,PITF,TTD,Tucker,NMF等算法,本文算法既提高了推荐的准确率,又降低了时间损耗.与PITF算法相比较,准确率得到了提高,而处理时间相差不明显;与TTD算法相比较,在准确率相差不明显的情况下,大大降低了时间损耗.因此,本文的TagRec-UPMF算法相比其他算法表现出了一定的优势.  相似文献   

19.
语义Web服务是在分布式环境下构建复杂系统的一种新兴技术。该文阐述了语义Web的核心概念和多Agent系统的主要特点,在此基础上,提出了基于语义Web的多Agent系统的体系模型,并探讨了该结构对于构建开放的、动态的、异构的多Agent系统所具有的优越性。  相似文献   

20.
现有的抄袭检测方法大多根据相似度来判定文档间是否存在抄袭.与常见的复制检测不同,在抄袭检测中,占文档很小比例且未加引用的复制文本也将被认定为抄袭.受文档尺寸、复制篇幅和干扰信息的影响,现有方法的检测效果均不理想.针对这种局限性,文中分析了文本语义与指纹排列顺序的关系,提出了语义匹配方法,将指纹向量投影到一个二进制向量,在降低维数的同时保留了指纹的位置信息.在PAN公用语料集上将该方法与Jaccard和Hamming距离法进行了对比测试,发现文中方法的召回率和准确度均更优.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号