首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 281 毫秒
1.
为了解决跨语言汉越词语相似度计算问题,以维基百科多语言概念页面作为桥梁,利用概念之间存在的翻译对应关系、词语出现在不同概念页面及与其他概念之间存在共现关系,提出了基于维基百科的汉越词语相似度计算方法,该方法首先提取维基百科中汉语越南语具有对应关系的概念集合,构建双语概念特征空间,然后根据词语在相应概念描述文本中出现的词频特征,以及词语与概念在其他概念文本中的共现特征构建词语的概念向量值,最后通过夹角余弦对两个向量进行词语相似度计算。实验结果表明提出的方法在汉越双语词语相似度计算上表现了好的效果,概念共现关系能够提高词语相似度的准确率。  相似文献   

2.
文本序列中各单词的重要程度及其之间的依赖关系对于识别文本类别有重要影响。胶囊网络不能选择性关注文本中重要单词,并且由于不能编码远距离依赖关系,在识别具有语义转折的文本时有很大局限性。为解决上述问题,该文提出了一种基于多头注意力的胶囊网络模型,该模型能编码单词间的依赖关系、捕获文本中重要单词,并对文本语义编码,从而有效提高了文本分类任务的效果。结果表明:该文模型在文本分类任务中效果明显优于卷积神经网络和胶囊网络,在多标签文本分类任务上效果更优,能更好地从注意力中获益。  相似文献   

3.
基于排序学习的文本概念标注方法研究   总被引:1,自引:0,他引:1  
提出一种基于排序学习的方法CRM (concept ranking model), 来实现文档的维基百科概念自动标注。首先人工对一定规模的文档进行概念标注, 建立训练集合, 然后利用排序学习算法在多项特征上得到对概念排序的模型, 利用这个概念的排序模型对任意文档进行概念标注。实验表明, 相对于传统的文档概念标注方法, 此方法在各类指标上都有相当大的提高, 标注结果更加接近人类的概念标注。  相似文献   

4.
垃圾评论者在很大程度上误导潜在消费者和观点挖掘系统。目前检测垃圾评论者的方法主要是基于评论、评论者和商店之间的关系,忽略了评论者之间的关系。针对上述问题,提出了基于评论者多边图的产品垃圾评论者检测方法。首先,以每个评论者为节点,评论者之间的关系为边,构建评论者之间的关系图模型;其次,根据多边图模型,提出了一种基于PageRank的评论者互评估可信度模型来检测垃圾评论者;最后,采用卓越亚马逊和Resellerrating.com平台上的数据进行验证。结果表明:该模型能够更有效地识别出垃圾评论者,在一定程度上解决了难识别仅发表一条评论的评论者的可信度问题。  相似文献   

5.
针对因光照、拍摄角度及图片质量等因素导致的经典深度学习算法难以有效提取人脸特征、人物身份识别准确率难以达到理想精度的问题,提出一种基于人脸强语义的年龄识别算法.首先,通过注意力矩阵增强人脸区域的特征权重,达到提取特征区域的目的;其次,使用级联双向长短期记忆(Bi-LSTM)网络学习时序帧之间的特征依赖关系,弥补部分特征缺失对识别精度的影响.在人脸数据集IMDB-WIKI和数据集Adience上进行测试,该算法的年龄识别准确率分别达到78.34%和77.89%.实验结果表明,相比于其他基于深度学习算法的方法,该算法在基于图片数据集的人物年龄识别任务上具有更高的准确率.  相似文献   

6.
基于依赖结构分析的类重要性度量方法   总被引:1,自引:0,他引:1  
为支持自动识别系统中重要的类,提出了一种基于软件依赖结构分析的类重要性度量方法.该方法首先用一个图模型表达类之间的3种依赖关系,包括类-类继承依赖、类-属性交互依赖和类-方法交互依赖,然后用PageRank, HITS和Betweenness Centrality算法通过对依赖关系结构的全局分析来度量类的重要性.该方法仅使用在软件开发的分析和设计阶段可以得到的信息,因而可用来在软件开发的早期识别系统中重要的类.实验结果表明,在识别重要的类时,该方法产生与简单方法不同的结果.  相似文献   

7.
基于程序行为异常检测的数据流属性分析   总被引:2,自引:0,他引:2  
通过合并静态分析和动态学习,提出了一种两阶段的数据流属性分析方法.该方法不仅考虑系统调用参数值,也学习系统调用参数之间的二元关系,通过数据依赖图识别无关参数和无用关系.给出了新方法的描述,分析了其特点.在Linux程序上的实验表明,该方法效率较高,入侵检测引起的性能负载较低.  相似文献   

8.
为了检测恶意程序中的虚假域名,便于识别僵尸网络和恶意程序,提出一种基于深度学习的虚假域名检测模型;该模型以域名字符串的字符序列为输入,利用一维卷积神经网络和自注意力机制,分别挖掘字符序列中各字符之间的局部依赖信息和全局依赖信息,将两者拼接在一起得到组合特征向量;借助多层感知机,得到待检测域名属于不同域名类别的概率.仿真...  相似文献   

9.
为了有效地识别遗产代码中因横切关注点而导致的零散代码或交织代码,提出了一种基于程序依赖图的Aspect挖掘方法.根据横切关注点的本质特性,考察了横切关注点与核心关注点之间的依赖关系及其在依赖图上的表现形式,对于单个方法体,结合程序的语义信息,在程序依赖图中引入一个虚拟结点表征方法体的核心功能,所有影响核心功能的语句都与之建立依赖关系,然后对依赖图进行拓扑分析,先从虚拟结点开始分离出核心代码,再通过求解连通分量的方式挖掘方法体内横切代码.实例分析表明,该方法不仅能识别出方法体内的零散特性代码,而且还能有效地挖掘出交织特性的代码.  相似文献   

10.
为提高领域本体概念及概念之间关系提取效率和准确率, 提出基于中文文本的领域本体学习模型。在提取候选概念的过程中, 采用修改后的关联规则频繁项计算方法对合
成词进行处理, 并结合位图存储分词处理后术语间的物理相邻关系, 再通过计算领域相关度和领域一致度对候选概念进行筛选, 最后利用关联规则可信度和层次聚类的方法分别提取概念间的非分类关系和分类关系。实验结果表明, 该模型对领域本体学习具有合理性, 提出的算法与基于互信息的本体学习相比较, 在概念和关系的提取
上具有较高的准确性。  相似文献   

11.
从分析面向对象数据库中的数据依赖着手,提出对象函数依赖概念,它反映了面向对象数据库中对象标识符,复杂对象及集合类型的特点,在对象函数依赖基础上,提出了分解为基础为模式规范化方法,并且特别引入语义相关集的概念,最后,给出类模式分解的形式化定义并证明了类模式的任一分解都是无损分解。  相似文献   

12.
互联网大数据的飞速发展对知识库的自动构建提出了迫切需求,互联网定义挖掘是知识发现研究的基础.文章基于N-gram语言模型提出了一种改进的N-gram Plus语言模型,综合了词语、词性、语法依赖关系和定义的语言学模式等多种特征.通过定义挖掘框架生成互联网语料库,在定义抽取研究中引入N-gram Plus特征集和句子最大定义隶属度,将句子转换为多特征向量,比较使用几种分类器进行学习和分类.该方法在实验中取得了较好的F2-measure成绩.  相似文献   

13.
基于概念共现图的多文档自动摘要研究   总被引:1,自引:0,他引:1  
以概念统计为基础,以WordNet为语义资源进行语义消歧和概念归并,提出了一种概念共现图模型并把它应用于多文档自动文摘.该模型利用概念间的共现信息构造概念共现图,抽取多文档集合的主题概念,再根据主题概念构建向量空间模型并计算句子的重要性.由于对概念进行了良好的归纳,该模型能够挖掘蕴涵在文档集中的深层次主题.在DUC2005数据集上评测的结果表明,该方法取得的效果令人满意,可用于实际的应用.  相似文献   

14.
针对传统方法在维基百科信息框中提取本体信息精准率较低的问题, 研究维基百科信息框中的属性结构化信息. 首先定义一组候选特征判定信息框属性之间的关系, 建立与类别、 列表、 文章及维基百科信息框模板之间的关联; 然后借鉴本体匹配方法提取维基百科信息框结构化信息, 计算属性对的相似度, 设置边界限制条件, 在达到一定精确度下构建本体结构描述属性之间的关系, 并构建类层次结构. 结果表明, 所给方法解决了提取本体信息精准率较低的问题, 能高效、 正确地在给定主题文章中将可能的属性结构提取出来, 并发现合理的类关系.  相似文献   

15.
提出一种基于深度学习与一致性表示空间学习的方法,针对图像与文本2种模态,分别采用卷积神经网络模型和潜在狄利克雷分布算法学习图像的深度特征和文档的主题概率分布;通过一个概率模型将两个高度异构的向量空间非线性映射到一个一致性表示空间;采用中心相关性算法计算不同模态信息在此空间的距离.在Wikipedia Dataset上的实验结果表明:在单模态输入检索中,文中方法的平均准确率为38.43%,相比于其他方法有明显提高.  相似文献   

16.
针对不同领域对地理事物的认知体系差异造成了地理本体异构的问题,提出了地理本体融合模型,引入统计式机器学习的方法对概念间的关系进行自动处理,并以概念间关系在不同本体出现的频度来产生其可信度,最后形成带有统计信息和领域信息的大型地理概念空间.该模型巧妙规避概念层面繁琐的异构映射过程,融合概念空间将多个地理本体所表达的概念知识融为一体,并保持了领域内的信息,有效实现了不同认知体系之间的共享.  相似文献   

17.
在再认记忆的双加工理论指导下,采用无线索回忆再认范式,分离回想和熟悉性两种再认提取方式,比较实例学习与概念学习的各自优势。结果发现:与关系的概念材料相比,实物样例的图片材料诱发的项目间关系学习在基于熟悉性的再认方式中具有优势;关系概念材料和实物图片材料诱发的关系学习在基于回想的有意识再认中无显著差异。该结果可为实际学习和教学活动提供很有意义的参考价值。  相似文献   

18.
基于Markov逻辑网的句子压缩方法   总被引:1,自引:0,他引:1  
提出了一种基于Markov逻辑网通过删除单词进行英文句子压缩的方法。通过一阶逻辑公式表示单词的局部特征以及单词之间的相互依赖关系,确定单词是否应该删除。与现有方法相比,该方法把判别式学习和整数规划的优点相结合,既融合了丰富的句子特征,又以逻辑公式方便地表示全局约束。在书面和口语两个新闻数据集上的实验结果表明:该方法与L3和SVTL系统相比具有明显优势,在压缩率接近时,以人工压缩结果为评测标准,压缩后句子的依存关系F-score有较大提高。  相似文献   

19.
为实现对车辆异常行为的准确识别,提高车辆行驶的安全性,提出了一种基于支持向量机(support vector machine, SVM)、监督学习与长短期记忆(long short term memory, LSTM)深度学习的交通异常驾驶行为双层识别模型。首先,对车辆轨迹数据筛除和滤波,构建异常行为数据集;其次,从异常行为轨迹特征中提取出特定异常行为的特征标签,并人为标定在训练集中;再次,构建SVM模型对训练集进行粗识别,基于SVM的二分法原理,从测试集中筛选出异常行为;最后,通过LSTM时间序列模型构建具体种类的异常行为模型,并通过深度学习的方法,从异常行为数据中细分为蛇形驾驶、急速变向、侧滑、大半径转弯、快速U型转弯、急刹车等具体的异常驾驶行为。本次实验选用下一代仿真(next generation simulation, NGSIM)数据中US-101高速公路和peachtree城市道路的数据集的轨迹数据验证SVM和LSTM双层识别模型的性能,包括均方根误差、识别准确率等。结果表明,构建的双层识别模型在第一层有98%的识别准确率,第二层有超过80%的识别准确率,可以较为准确地识...  相似文献   

20.
一种基于粗集的概念学习新方法   总被引:1,自引:0,他引:1  
针对传统粗集决策方法不能对未见实例提供很好分类的缺陷,提出了一种基于粗集的概念学习新方法。 利用概念之间的偏序结构,在整个变型空间搜索与训练样例一致的假设,并通过投票的方式得到新实例最可能的 假设。仿真结果表明该方法泛化能力强,是一种有效的概念学习方法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号