共查询到18条相似文献,搜索用时 62 毫秒
1.
为了提高文本聚类的性能,采用k-modes算法进行文本聚类,并采用知识图谱进行样本预分析,以提高k-modes的文本聚类适用度.采用知识图谱进行样本预处理,对待聚类的文本进行知识图谱三元分析,并生成对应概念、实体和关系的样本集合;接着建立k-modes文本聚类模型,设定簇内节点至簇中心的距离值之和为目标函数,通过轮流固... 相似文献
2.
在自然语言生成任务中,主题文本生成是一项富有挑战性的工作,其主要难点在于:源信息量远小于目标生成的信息量.为了解决该问题,本文提出一个基于外部知识筛选的主题文本生成模型Trans K,通过引入与主题词相关的外部知识来丰富源信息,进而提高生成文本的质量.本文为了解决引入外部知识的“一词多义”问题,提出一种基于线性变换的主题向量计算方法,用于筛选和主题词语义一致的外部知识;提出一种基于注意力机制的外部权重计算方法,为每个外部词设定一个主题权重,使其更贴合文本语义;为了解决主题词(含候选词)在生成文本中反复出现的问题,提出一种基于多头注意力机制的内部权重计算方法.在EASSY数据集上的实验表明,与基线相比,Trans K生成文本质量的各项指标更优.此外,人类评估表明,该模型可生成与主题更相关、语言更连贯、且符合语义逻辑的文本. 相似文献
3.
为了提高文本聚类的性能,采用近邻传播(Affinity propagation, AP)算法进行文本聚类,并采用知识图谱进行样本预分析,以提高AP的文本聚类适用度。采用知识图谱进行样本预处理,对待聚类的文本进行知识图谱三元分析,并生成对应概念、实体和关系的样本集合;建立AP文本聚类模型,并通过差分进化(Differential evolution, DE)算法优化偏向参数;利用DE算法求解的最优个体的偏向参数进行AP聚类运算,不断更新AP算法的决策和潜力阵,从而获得稳定的聚类结果。试验结果表明,经过知识图谱分析之后,通过合理设置DE算法的差分缩放因子和交叉速率,DE-AP算法能够获得更优的聚类准确度,且聚类准确度的均方根误差(Root mean squared error, RMSE)值更低;和常用文本聚类算法相比,该文算法获得了更高的聚类准确度。 相似文献
4.
文本观点检索旨在检索出与查询主题相关并且表达用户对主题观点的文档。由于用户查询时输入通常很短,难以准确表示查询的信息需求。知识图谱是结构化的语义知识库,通过知识图谱中的知识有助于理解用户的信息需求。因此,提出了一种基于知识图谱的文本观点检索方法。首先由知识图谱获取候选查询扩展词,并计算每个候选词扩展词分布、共现频率、邻近关系、文档集频率,然后利用4类特征通过SVM分类得到扩展词,最后利用扩展词对产生式观点检索模型进行扩展,实现对查询的观点检索。实验表明,在微博和推特两个数据集上,与基准工作对比,所提出的方法在MAP、NDCG等评价指标上均有显著的提升。 相似文献
5.
6.
跨境民族文本分类任务是跨境民族文化分析中的基础性工作,其目的是将跨境民族文化文本进行归类处理。针对跨境民族文化数据分类面临类别交叉的问题,提出融合领域知识图谱的跨境民族文本分类方法,利用跨境民族文化知识图谱对文本中的跨境民族实体进行语义扩展,通过实体在知识图谱中的类别特征来增强文本的类别语义特征。此外,通过掩码自注意力机制分别对文本的词级、句子级进行特征提取以此得到文本中句子的局部特征和全局特征。实验表明,本文方法在跨境民族文化数据集中相比基线模型的F1值提升了11.9%。 相似文献
7.
张舒 《科技情报开发与经济》2016,(9):104-108
以CNKI数据库中图书馆学科服务的研究文献为研究对象,利用信息可视化分析软件CiteSpace及文献计量学方法,绘制了知识图谱,探讨了图书馆学科服务研究文献的基金资助来源、核心作者、核心学术机构和研究热点,以期为我国图书馆学科服务的研究提供有益参考. 相似文献
8.
网络技术的发展导致恶意域名类型层出不穷,为了挖掘更深层次的恶意域名,提出一种将知识图谱应用到恶意域名的检测方法。在设计域名知识图谱本体模型的基础上,抽取对应的实体、关系,使用Neo4j图数据库存储域名知识图谱,根据图推理算法计算未知域名与图谱中已知属性相邻节点的密切程度,来判断未知域名的属性。实验结果表明,新方法在恶意域名检测上有良好的实验效果(AUC=0.98),可有效识别之前未检测出的恶意域名,实现对隐藏较深恶意域名的挖掘。 相似文献
9.
网络安全知识图谱研究综述 总被引:1,自引:0,他引:1
针对多源异构的网络安全数据的离散分布问题,总结了知识图谱构建需要的网络空间战技术、攻击模式、漏洞及网络设备等基础数据,提炼了数据之间的关联关系.在此基础上,综述了网络安全知识图谱相关技术的国内外研究现状,包括多源异构的安全情报数据、网络安全知识表示、网络安全知识图谱的本体构建、信息抽取和知识图谱推理.同时,对网络安全知... 相似文献
10.
在基于知识图谱的智能问答系统中,属性映射模块结果的错误传播会导致最终无法得到正确答案,对此提出了一种基于多注意力多维文本的属性映射方法。首先通过拆分问题文本及结合属性信息得到多维文本表示;其次使用长短期记忆网络(long-short-term memory, LSTM)层生成各自的隐层表示;然后输入多注意力机制层后使问句和属性之间的关系及语义信息更加完善,利用属性之间的交互信息及多种角度来加强问句语义信息的理解;最后通过卷积神经网络(convolutional neural networks, CNN)提取局部特征并且采用softmax分类器实现属性映射。试验结果表明,在自然语言处理与中文计算会议(NLPCC 2018)中知识库问答(KBQA)任务所提供的开源数据集上,本方法相比主流属性映射模型其性能有显著提升,准确率最高提升6.62%。本模型可以补足单一文本表示与注意力机制的短板,有效解决属性映射模块中语义歧义的问题,这有助于后续提高智能问答系统的整体性能。 相似文献
11.
提出了一种基于知识图谱(KG)的用户多偏好(MPKG)推荐系统,从用户关系级、实体级和细粒度高阶用户三种不同的视角建模用户的偏好. 首先,将KG中关系向量组合,构建关系级意图,并通过独立性将不同意图之间的差异最大化,由关系级意图来指导学习关系级偏好;然后,根据用户交互实体的频率构建实体偏好图(EPG),并学习用户的实体级偏好;接着,分别使用关系级意图和实体级偏好来指导模型学习用户的表示;此外,还直接从KG中构建关系实体信息流,用于用户的表示,挖掘用户的高阶细粒度偏好. 在两个基准数据集上进行实验,实验结果验证了该方法的有效性和可行性. 相似文献
12.
首先总结现有领域知识图谱的研究现状。其次,介绍领域知识图谱的发展趋势。然后,梳理水利领域知识图谱的构建难点,提出包含知识表示、抽取、融合、推理和存储等关键模块的水利领域知识图谱研究框架,并简要概括上述各模块的研究内容。最后,指出领域知识图谱构建存在的表示形式单一、抽取样本稀少、多源知识冲突、规则表示困难和数据管理低效等问题,认为合理化表示、准确全面抽取、实时性融合、可解释推理和高性能存储是下一步水利知识图谱的研究方向。 相似文献
13.
知识获取技术制约着知识系统的研究和应用,有效地从文本中提取领域知识成为知识获取的重要途径.本文提出了基于本体和图分析的领域知识获取技术,分析了本体数据结构、本体概念的实例化以及基于图分析的语义场构造方法.建立了具有广泛适用性的文本知识获取系统框架,实现了原型系统.通过针对中医医案的中医领域知识获取实验验证,取得了较好的效果. 相似文献
14.
社交网络包含复杂的结构信息与丰富的语义信息.互联的多类型数据,实体对象的行为关系等问题的研究面临极大的挑战.知识图谱旨在处理用户数据知识及行为信息,发现事物、概念与实体对象间的复杂联系,使事物间关联关系得到清晰说明.首先介绍知识图谱基本知识;其次基于知识图谱,在社交网络中,可视化表示用户的行为关系,对其中的行为知识抽取... 相似文献
15.
基于2000—2021年中国知识基础设施工程(CNKI)和Web of Science核心数据库(WOS)中以智慧水利为主题的相关研究文献,采用VOSviewer、CiteSpace等软件构建智慧水利研究领域文献量时序分布、发文机构和研究热点演变的各类知识图谱,分析了当前智慧水利研究进展。结果表明:智慧水利文献量均逐年递增,但CNKI数据库文献量与WOS数据库相比存在明显差距;智慧水利领域已形成核心研究机构,对其前沿发展做出了重要贡献;CNKI数据库中智慧水利研究侧重以流域为单位构建数字流域与智慧水利框架,WOS数据库则侧重从地理地球视角出发开展研究,两者均以物联网、深度学习等为基础搭建智慧水利平台。 相似文献
16.
抽水蓄能技术被公认为是助力实现“碳达峰、碳中和”的重要技术。为深入了解抽水蓄能的技术核心,客观探讨目前该技术的研究现状和热点问题,利用Web of science的德温特专利数据库中的抽水蓄能技术专利进行计量分析。通过知识图谱的构建并结合复杂网络分析,探究抽水蓄能技术发展过程及专利的时空分布、整体前沿技术与热点技术、专利权人间协作情况和建造抽水蓄能电站时要考虑的重要因素。结果表明:首先,抽水蓄能领域大部分技术专利来自中国,目前的前沿研究是聚焦太阳能与抽水蓄能混合发电系统、平衡网络负载和如何减少或防止功率振荡等技术。其次,机构间合作网络是无标度网络,国家电网有限公司在其中扮演着非常重要的中介角色。最后,在进行抽水蓄能电站建设时要结合地势和当地丰富的清洁能源进行具体分析,注重相关设备技术的升级换代和运营管理技术的更新。 相似文献
17.
针对多数据源的融合应用,构建了基于多数据源的知识图谱.首先,对不同领域内的数据源构建相应本体库,并将不同本体库通过数据融合映射到全局本体库;然后,利用实体对齐和实体链接方法进行知识获取和融合;最后,搭建知识图谱应用平台,提供查询和统计等操作.在实体对齐方面,利用传统的基于相似性传播实体对齐方法,获得良好的实体对齐效果;在实体链接方面,提出了基于约束嵌入转换的预测推理方法,实验结果表明,在预测准确率上取得较好的结果. 相似文献
18.
一种基于知识粒度的关键词提取方法 《山东科学》2019,32(2):137-142
使用粗糙集中的等价关系来刻画粒度,粗糙集结合粒度计算方法,给出信息决策表的粒度表示,并将信息决策表中的属性重要度值作为启发信息,在相对约简的个数组合上进行Tabu搜索。此方法可避免无用的属性入选,有效去除可省属性及缩减搜索空间,提高了算法的高效性。 相似文献