首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 265 毫秒
1.
本文提出了一种基于规则匹配和机器学习的论文作者名自动化消歧方法:首先基于人工构建的人名匹配规则确定候选作者,对于存在多个候选人的情况,基于论文的属性信息(例如合作者、标题、摘要、关键词和出版物名称等)提取特征,然后选取合适的机器学习算法进行消歧.实验效果表明K近邻和Softmax分类器较适合于论文作者名消歧任务;此外,将作者信息与论文的其他信息分开提取特征能够有效提高作者名消歧的准确性.  相似文献   

2.
为了有效地提高MRI脑肿瘤图像的分割精度,更好地辅助医生诊断病情,提出了一种多特征融合的超像素谱聚类MRI脑肿瘤图像分割方法。首先通过简单线性迭代聚类分割的超像素替代像素点来构建加权无向图,并且融合多种图像特征构建相似度计算函数,同时采用自适应的方式计算高斯核的尺度参数,根据相似度函数计算相似度矩阵进而求得拉普拉斯矩阵,然后对此拉普拉斯矩阵的特征向量进行K-means聚类来完成对图像的分割。在BraTS 2015数据集上与其他2种谱聚类图像分割方法进行了对比实验,并采用相似性系数(Dice)、相对体积误差(RVD)和灵敏度(Sensitivity)这3个指标对分割结果进行评价。结果表明,本文方法在这3个指标上均优于对比方法。因此本文提出的多特征融合的MRI脑肿瘤图像分割方法能够更高效、更精确地完成MRI图像的分割。  相似文献   

3.
基于LDA的文本聚类在网络舆情分析中的应用研究   总被引:1,自引:0,他引:1  
针对传统的基于词语的文本聚类算法忽略了文本中可能具有的隐含信息的问题,提出了一种基于LDA(latent dirichlet allocation)主题模型的文本聚类算法。该方法利用TF-IDF算法和LDA主题模型分别计算文本的相似度,通过耗费函数确定文本相似度的融合系数并进行线性结合来获取文本之间的相似度,同时使用F-measure值来对聚类结果进行评估。在构建LDA主题模型时,采用Gibbs抽样来进行参数估计,通过贝叶斯统计的标准方法进行最优主题数的确定。从仿真实验的聚类结果的准确性和稳定性来看,该方法相比传统的文本聚类算法具有更良好的效果。  相似文献   

4.
针对科学合作网络姓名消歧问题,以文献题录信息和全文信息为基础,提出了基于语义指纹的综合特征文献著者姓名消歧方法,设计了指纹生成器、指纹比较器、认领决策器、作品指派器以及争议仲裁器。基于标题、作者、合著者、作者机构、期刊、日期、摘要、关键词、作者邮箱、全文等特征构建消歧实验测试数据集,将单特征测试中准确率较高而查全率较低的合著者特征、作者单位特征和查全率较高的文本指纹特征相结合,开展基于语义指纹的综合特征姓名消歧实验,并对实验结果进行评价。  相似文献   

5.
科技文献中回顾前人研究成果、分析存在的问题、提出解决方法等语言片段是论文创新性信息的构成部分。分析论文写作过程中问题分析信息的逻辑思维以及在文章中呈现的篇章关系,综合利用引用分布特征、篇章关系特征、否定情感特征构建具有普适性的信息抽取语义模式。从论文原始文本中通过匹配定义好的语义模式抽取出问题分析信息。同时,利用引导词特征、语义相似度计算从论文文本中抽取出论文的主要工作信息。以数据挖掘领域科技文献为例,对比人工抽取结果对提出的方法进行评价,结果表明该方法能较准确抽取相应信息,为科技论文聚类、论文推荐提供基础数据来源。  相似文献   

6.
基于多层次句子相似度与向量空间模型的词义消歧   总被引:1,自引:0,他引:1  
介绍和对比了20世纪50年代以来出现的各种主要词义消歧的方法,论述了这些方法取得的成效和存在的局限,着重讨论了基于向量空间模型的消歧方法.在此基础上,通过分析和计算,提出了一种将多层次句子相似度计算应用于向量空间模型的新方法,从而提高机器翻译中的词义消歧的准确度.  相似文献   

7.
短文本聚类在数据挖掘中发挥着重要的作用,传统的短文本聚类模型存在维度高、数据稀疏和缺乏语义信息等问题,针对互联网短文本特征稀疏、语义存在奇异性和动态性而导致的短文本聚类性能较差的问题,提出了一种基于特征词向量的文本表示和基于特征词移动距离的短文本聚类算法。首先使用Skip-gram模型(Continuous Skip-gram Model)在大规模语料中训练得到表示特征词语义的词向量;然后利用欧式距离计算特征词相似度,引入EMD(Earth Movers Distance)来计算短文本间的相似度;最后将其应用到Kmeans聚类算法中实现短文本聚类。在3个数据集上进行的评测结果表明,效果优于传统的聚类算法。  相似文献   

8.
为了提高产品评论语句相似度计算的准确率,提出了一种新的基于多特征融合的相似度计算模型。在构建相似度计算模型时,抽取句子的名词、动词和形容词作为关键词构成句子的向量表示,并将关键词的频次信息及其修饰成分信息、句子的主谓结构和动宾结构等特征信息都纳入到向量模型当中,通过各特征要素的重要度来表征这些信息在句子相似度计算中的重要程度。实验结果表明,该计算模型提升了产品评论语句相似度计算的准确率,对提升产品评论语句的聚类分析能力具有重要意义。  相似文献   

9.
针对复杂电磁环境下雷达信号快速聚类分选问题,提出了一种采用变精度粗糙集改进的基于相邻脉冲相似性的快速聚类分选方法。原有方法计算相似度时加权矩阵由专家给定或由经验而定,未考虑到雷达辐射源属性,造成聚类分选结果准确率不高。改进方法利用变精度粗糙集获取雷达辐射源各属性特征参数的权重,由其权重构成最优特征加权矩阵,进而计算相似度,然后基于相邻脉冲相似性对雷达信号进行快速聚类分选。仿真表明,改进方法相比原有方法保持了快速分选的能力,并且将聚类分选准确率提高了5.93%,是一种解决复杂环境下雷达信号快速聚类分选的新方法。  相似文献   

10.
基于深层特征抽取的日文词义消歧系统   总被引:1,自引:0,他引:1  
词义消歧的特征来源于上下文.日文兼有中英文的语言特性,特征抽取更为复杂.针对日文特点,在词义消歧逻辑模型基础上,利用最大熵模型优良的信息融合性能,采用深层特征抽取方法,引入语义、句法类特征用于消解歧义.同时,为避免偏斜指派,采用BeamSearch算法进行词义序列标注.实验结果表明,与仅使用表层词法类特征方法相比,本文构造的日文词义消歧系统的消歧精度提高2%~3%,动词消歧精度获得5%的改善.  相似文献   

11.
实体排歧一直是信息抽取任务中的难点问题.传统的方法常常借助语言知识库来进行排歧,如WordNet等.但是这类方法存在着一个问题,就是很难对人名以及最新的词汇进行排歧.因此,本文利用当前流行的维基百科知识库中的排歧页对同名实体进行排歧处理,提出基于维基百科的实体排歧方法.实验显示该方法能够有效的对人名进行排歧处理并且效果显著.  相似文献   

12.
为了减低图像的噪声,保留有用的信息,获得更为可靠的融合图像,将Kalman滤波引入图像融合中,提出基于Kalman滤波与多特征模糊聚类的图像融合算法.该方法结合滤波和多特征优点,实验结果表明了该方法的有效性.  相似文献   

13.
为了减低图像的噪声,保留有用的信息,获得更为可靠的融合图像,将Kalman滤波引入图像融合中,提出基于Kalman滤波与多特征模糊聚类的图像融合算法.该方法结合滤波和多特征优点,实验结果表明了该方法的有效性.  相似文献   

14.
将名词、形容词、动名词和命名实体作为文本特征,考虑词序与词频,结合特征项的语义,提出一种基于改进最长公共子序列的文本聚类(LCSC)方法.实验结果表明:相对于传统的余弦值聚类方法,LCSC方法在人名消歧的P-IP指标上,F平均值由74.2%提高到了84.9%;相对于最长公共子序列方法,总体性能也提高了3.7%.  相似文献   

15.
由于人的重名现象,人名检索的结果往往是同名的不同人物实体相关网页的混合。重名消解是根据上下文来区分同名的不同人物实体的过程。本文提出了基于相关社区的重名消解方法,采用改进的Espresso算法进行相关社区发现。将每个网页发现的社区应用到两阶段重名消解算法中,并且在WePS-2测试集上进行试验。实验结果表明了该方法的有效性。  相似文献   

16.
基于理想点法的语言评价矩阵评判专家水平研究   总被引:3,自引:1,他引:2  
针对群决策中语言评价矩阵形式偏好信息的评判专家水平问题,提出了一种分析方法.首先,给出了有关语言评价矩阵的若干定义及性质;然后,通过定义专家与专家群体判断之间的偏差距离矩阵、方案集的正理想点和负理想点,根据专家判断与理想点之间的贴近度,给出了基于语言评价矩阵形式偏好信息的评判专家水平的分析方法,最后通过一个算例说明了所提出的分析方法的可行性.本方法使决策结果更加可靠、可信,可作为评判专家水平的备选方法.  相似文献   

17.
基于条件事件代数的常概率事件模型及应用   总被引:1,自引:0,他引:1  
基于乘积空间条件事件代数,介绍了一种具有严格数学表示的常概率事件的方法,将其应用于数据融合系统中的专家权重事件描述,数值融合的结果与代数融合的结果相一致。在乘积空间条件事件代数中,提出了一个新的度量专家观点的布尔相似性测度,该测度可以有效地评定专家信息的相似性,并给出了一个具体的实例。  相似文献   

18.
利用微博数据检测突发事件具有重要意义.针对以往检测方法特征不够丰富、准确率不高等问题,提出了一种基于多种特征融合的微博突发事件检测方法.该方法根据情感符号构建情感特征模型,对微博数据进行情感分类,并采用Kleinberg算法对情感特征进行突发期检测;在突发期内根据词频特征、词频增长特征和话题标签特征融合加权提取突发词,...  相似文献   

19.
超分辨率重建技术可以提高图像质量,使原图像具有更丰富的细节信息。针对现有的超分辨率重建算法存在提取特征单一、不利于对图像信息进一步提取的问题,提出了一种基于多尺度特征融合的超分辨率重建算法。采用多特征提取模块获取更多浅层信息,并在网络中添加密集连接结构,增强特征的传播,减少相关参数计算,减轻梯度消失问题。在Set5和Set14基准数据集上进行了测试,并在电力巡检数据集上进一步验证了算法的有效性。与主流的超分辨率重建方法进行了对比,实验结果表明,该方法生成的图像有更加丰富的细节信息,能够有效地改善图像质量,峰值信噪比与结构相似度值较其他主流算法均有一定的提高。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号