首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 125 毫秒
1.
【目的】针对词主题信息与词相似性信息对关键词提取的影响进行了研究,提出一种改进的TextRank关键词提取方法。【方法】首先,使用隐含狄利克雷分布(Latent Dirichlet allocation,LDA)主题模型对文档建模计算词主题信息;其次,使用FastText生成词向量,并计算词相似性矩阵;最后,融合词主题信息与词相似性信息的综合权重来优化TextRank词汇节点的初始权重,并进行词图模型的迭代运算与关键词提取。【结果】实验表明,改进方法的提取结果优于传统方法。【结论】证明了考虑词主题信息的全局性与词相似性信息的局部性能有效提高TextRank算法提取关键词的性能。  相似文献   

2.
语义相似性度量能够提高信息检索的准确性和效率,已成为文本处理中的一个核心任务.为解决一词多义等词汇歧义问题,提出一种基于低维向量组合的语义向量模型.该模型引入了知识库与语料库的多语义特征的融合,主要的语义融合对象包括连续的分布式词向量和从WordNet结构中的语义特征信息.首先利用深度学习技术中的神经网络语言模型,预先从文本语料中学习得到连续的低维词向量;然后从知识库WordNet中抽取多种语义信息和关系信息;再将多语义信息融入词向量进行知识扩展和强化,生成语义向量,从而实现基于向量空间的语义相似性度量方法.在基准测试集上的实验结果表明,该方法优于基于单一信息源(知识库WordNet或文本语料)的语义相似性度量方法,其皮尔森相关系数比基于原始词嵌套向量的方法提高了7.5%,说明在向量特征层面上的多语义信息的融合有助于度量词汇间的语义相似性.  相似文献   

3.
针对一类具有不同重要性与可靠度的证据融合问题,将证据静态权重与体现证据间相似性的动态权重结合起来,提出了一种基于证据综合权重折扣的加权平均法.首先,根据证据的先验信息即静态权重以及证据间的相似性,计算经静态权重折扣的各证据与其加权平均的距离而获得的证据的动态权重,再将静态权重与动态权重综合形成证据的综合权重.然后,将综合权重作为折扣因子建立具有信任折扣的证据推理模型.最后,利用加权平均法对修正后的证据进行组合.该方法能有效处理高冲突证据的融合,算例结果验证了所提方法的有效性.  相似文献   

4.
提出一种融合多模型和高置信度词典的事件线索识别方法,将高置信度词典特征分别加入最大熵模型和条件随机场模型,然后融合两个模型的结果,旨在提高触发词识别的召回率和整体性能。针对事件真伪性识别任务,进一步考察否定词或不确定词与触发词的物理位置距离和依存路径距离等特征,提高事件真伪性识别的性能。实验结果显示,针对触发词识别和事件真伪性识别任务,与仅使用最大熵模型相比,所提出的融合多模型与高置信度词典的方法能够提高触发词识别的性能6.43%,提高事件真伪性识别的性能1.69%。  相似文献   

5.
基于多种现有软件可靠性模型,提出了一种使用静态权重和动态权重加权的软件可靠性混合模型,以提高软件可靠性模型的精度和稳健性.  相似文献   

6.
提出了一种基于自适应多特征融合的目标跟踪算法.分别利用RGB颜色和LBP纹理特征建立目标模型,通过线性加权将两类目标子特征模型代入目标相似性函数并用均值迁移算法进行目标位置优化计算.在跟踪过程中,引入S igmoid函数动态调整两类子特征权重,并利用子特征相关系数和可靠性指数对目标特征模型选择性自适应更新.实验结果表明,该算法能在跟踪场景和目标外观变化时自适应调整两种子特征权重,避免了特征失效导致的跟踪失败;特征模型选择性更新策略有效抑制了模型漂移.与单一特征和模型直接更新的跟踪方法相比,该算法在复杂跟踪环境更具有鲁棒性,能进行准确稳定的实时跟踪.  相似文献   

7.
词语相似性度量在服务选择、自然语言处理、文献检索等领域具有重要的作用,目前通用的词语相似度计算方法是利用《知网》对词的概念解释得出词语之间相似度.对《知网》结构进行分析,认为利用《知网》计算词的相似度的方法中概念的4项基本结构的权重应该动态产生,并提出区分度作为衡量4项基本结构的动态权重.在分析现有研究基础上,借鉴逆文档频率(IDF)权重计算思想,认为义原的区分度与义原在所有概念的相应位置中出现次数成反比,提出了一种基于义原出现频次的义原权重计算方法:逆概念频率(inverse concept frequency,ICF).通过分析概念的组织结构,计算第一基本义原结构、其他基本义原结构、关系义原结构、关系符号结构中各义原的ICF权重,将4个基本结构中的最大义原ICF权重作为基本结构的ICF权重.利用动态ICF值逼近基本结构的区分度,进而计算词语相似度.通过对真实数据的实验对比可以看出ICF算法能有效提高计算词语相似度的准确率.相比较传统算法平均前160个词准确率从30.74%提高到72.28%,平均召回率从15.87%提高到49.64%.  相似文献   

8.
传统词向量表示模型往往忽视了单词间的句法形态结构,导致模型预测准确率不高. 为此,提出基于fastText模型的词向量表示改进算法. 首先,在训练模型数据集上,引入stopwords处理技术,剔除一些无意义介词等对预测模型干扰,减少噪声数据;其次,针对fastText模型中n-gram分解格式进行限定,将分解条件设置为符合英文单词的组成结构;最后,去除fastText模型中单词前后缀标记符,减少无用分解对模型预测产生干扰. 实验结果表明,与fastText模型相比,所提出的改进模型在单词关系评分、语义相似性、句法相似性均取得较好的准确率.  相似文献   

9.
针对当前广泛应用的BOVW模型存在精度不足问题,提出一种基于有序视觉词袋模型的相似性衡量方法.首先,对经过K-mean聚类得到的高维视觉单词,采用LLE(locally linear embedding)流形学习算法降至一维,对一维数据进行排序,并以此顺序对高维单词排序获得有序词袋库;其次,对样本图像的所有局部特征,以该特征在词袋中对应的有序单词索引号构建图像局部特征谱;最后,对训练样本和测试样本的局部特征谱作差求得残差,并以残差的1-范数衡量图像的相似性.KITTI数据集相似性衡量实验表明,有序BOVW模型相似性识别率明显高于无序BOVW模型.  相似文献   

10.
在基于LDA的短文本分类基础上进行改进,提出信息增益结合LDA的短文本分类方法.该方法采用信息增益计算词汇对于文本分类的贡献度,提高"作用词"的权重,过滤掉"非作用词",最后对过滤后的短文本进行LDA主题建模,并采用中心向量法建立文本类别模型.实验证明,该方法随着作用词比例的减少,分类性能有较大的提高.  相似文献   

11.
多传感器多模型相互作用的数据关联方法   总被引:2,自引:1,他引:1  
基于信息融合中的数据关联技术,在卡尔曼滤波基础上,结合相互作用多传感器多模型的概率数据互联算法,建立故障监测报警和现场传感器量测数据关联二者之间的关系,建立更具一般性的分布式传感器系统基础上的多传感器多模型,改进概率数据关联方法,以用于故障监测报警中相互作用的算法.并结合一个时变系统中空间位置传感器的故障诊断问题为例,运用多传感器多模型相互作用的数据关联方法进行仿真分析,研究此类故障判据的数据关联问题和数据关联算法的改进,研究表明相互作用多模型的概率数据互联改进方法不仅与有限维数的特定测量阈值相对应,而且直接针对故障模式,能够体现出动态模型的优点,可以与系统诊断知识相融合,为故障诊断的单步的、多步的、长期的预测预报提供依据.  相似文献   

12.
基于LSTM的大规模知识库自动问答   总被引:1,自引:0,他引:1  
针对大规模知识库问答的特点, 构建一个包含3个主要步骤的问答系统: 问句中的命名实体识别、问句与属性的映射和答案选择。采用别名词典结合LSTM语言模型进行命名实体识别, 使用双向LSTM模型结合两种不同的注意力机制进行属性映射, 最后综合前两步的结果进行实体消歧和答案选择。该系统在NLPCC-ICCPOL 2016 KBQA任务提供的数据集上的平均F1值为0.8106, 接近评测的最好水平。  相似文献   

13.
针对基于语料库统计的词语相似度计算方法存在的一些缺陷,如:计算量大、向量的特征维度高、特征稀疏、忽略了词语的语义信息等,提出了一种基于latent Dirichlet allocation(LDA)的词语相似度计算方法,通过将词语的特征向量映射为词语的主题分布来计算词语间的相似度;通过与基于《知网》的词语相似度计算方法的对比,证明了该方法能有效降低特征维度,并具有较好的词语相似度计算效果。  相似文献   

14.
词向量具有良好的语义特性,可用于改善和简化许多自然语言信息处理应用。本研究利用CBOW和Skip-gram两种模型架构在不同数据和不同维度下训练蒙古语词向量,然后结合蒙古语特征设计一个语义语法综合测试集,并在此测试集上用语义和语法相似度来评测词向量质量。研究结果表明,蒙古语语义和语法相似性任务上,Skip-gram模型优于CBOW模型,Skip-gram模型的窗口大小为5的情况下,词向量质量最好,且随着词向量维度或训练数据的增大,词向量质量有明显的提高。  相似文献   

15.
一种动态校正的AGMM-GPR多模型软测量建模方法   总被引:1,自引:0,他引:1  
工业过程常常是强非线性的,并有多个工况,传统的软测量方法存在预测能力差,不能有效利用误差信息等缺点.为了有效解决这些问题,提出一种基于自适应高斯混合模型-高斯过程回归(AGMM-GPR)的多模型动态校正软测量建模方法.首先,通过贝叶斯信息准则构建自适应高斯混合模型(AGMM),得到优化的子模型个数;然后,利用GPR方法建立各局部模型,当新的数据到来时,将其隶属于各局部模型的后验概率和预测值融合得到多模型输出;最后,为了进一步提高模型的精度,构建自回归积分滑动平均(ARIMA)模型对多模型输出进行动态反馈校正.通过数值仿真和硫回收装置(SRU)中H2S浓度的估计,验证了所提方法具有良好的预测精度和泛化性能.  相似文献   

16.
为了提高非线性动态系统的性能,提出了多模型小波网络方法,并详细介绍了多模型小波网络的结构.用多模型小波网络对非线性系统进行建模与控制,在仿真试验中将其与单小波网络进行对比,结果显示多模型小波网络控制的均方差为0.158,单小波网络控制的均方差为0.374.试验结果证明多模型小波网络方法控制精度高,响应速度快,其控制性能优于单小波网络。  相似文献   

17.
利用微博数据检测突发事件具有重要意义.针对以往检测方法特征不够丰富、准确率不高等问题,提出了一种基于多种特征融合的微博突发事件检测方法.该方法根据情感符号构建情感特征模型,对微博数据进行情感分类,并采用Kleinberg算法对情感特征进行突发期检测;在突发期内根据词频特征、词频增长特征和话题标签特征融合加权提取突发词,...  相似文献   

18.
探讨了多模型集成专家系统的构成原理和实现技术,并将其应用于多模型集成的故障诊断专家系统的实现中,表明了集成机制的合理性和有效性。  相似文献   

19.
为了解决设计重用过程中基于模型的产品数字化定义(MBD)模型的问题,采用特征识别技术,对MBD模型自动添加语义标注,从而提高关键字检索的准确性.首先,对MBD模型的构成原理与模型要素进行分析,并在融合关键信息的基础上建立零件模型的属性面邻接图(AAG),根据零件模型上加工特征,将特征划分为螺钉头部特征、螺钉功能特征和材料特征.其次,通过顶点属性结合邻接矩阵重构图的顶点序列,动态编码结合距离匹配,求出最大公共子图,得出MBD模型之间的相似度.最后,利用聚类法实现对MBD模型的自动语义标注.实验结果表明:文中方法可以实现MBD模型的自动语义标注,很大程度上提高语义标注的自动化程度.  相似文献   

20.
数据聚类是常用的无监督学习方法,通过词嵌入聚类能够挖掘文本主题,但现有研究大多数采用常规聚类算法挖掘词嵌入的簇类,缺少基于词嵌入特性设计实现词嵌入聚类的主题挖掘算法.该文从语言模型通过建模词间相关信息来使相关及语义相似词的嵌入表示聚集在一起的特点出发,设计词嵌入聚类算法.该算法首先计算中心词的簇类号,然后使该簇中心嵌入和相邻词嵌入的相似性增强,同时使其与负样本词嵌入远离,学习文本集词嵌入的簇类结构,并将其应用于文本主题挖掘.在3种公开数据集上的实验表明:该算法在一些模型的词嵌入结果上能够挖掘出一致性和多样性更好的主题结果.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号