首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到15条相似文献,搜索用时 62 毫秒
1.
介绍实体链接的概念和步骤以及基于深度学习的命名实体链接相关问题和研究现状,分析实体链接研究中存在的问题及相应的解决模型,并介绍相关数据集和评测方法.总结国际评测会议中实体链接的现状,展望未来的研究方向.  相似文献   

2.
命名实体在文本中是承载信息的重要单元,而微博作为一种分享简短实时信息的社交网络平台,其文本长度短、不规范,而且常有新词出现,这就需要对其命名实体进行准确的理解,以提高对文本信息的正确分析。提出了基于多源知识的中文微博命名实体链接,把同义词词典、百科资源等知识与词袋模型相结合实现命名实体的链接。在NLP&CC2013中文微博实体链接评测数据集进行了实验,获得微平均准确率为92.97%,与NLP&CC2013中文实体链接评测最好的评测结果相比,提高了两个百分点。  相似文献   

3.
鉴于现有中文实体链接基准语料库的缺乏, 在ACE2005中文语料库和中文维基百科的基础上, 通过自动构造和人工标注的方法, 构建一个中文实体链接语料库及其相关的中文知识库。与传统的英文实体链接语料库不同, 构造的中文实体链接语料库是基于实体而非单个实体指称(Mention)。中文实体链接语料库的构建, 将为中文实体链接研究提供一个可用的基准平台。  相似文献   

4.
5.
近年来,网络媒体微博的迅速发展,为命名实体的识别研究提供了一种全新的载体.针对中文微博文本短、表达不清、网络化严重等特点,论文提出了一种规则与统计相结合的中文微博命名实体识别方法.该方法首先利用中文微博的主题标签对处理后的数据进行筛选,然后再选取合适的特征模板,并利用条件随机场模型(Conditional random fields, CRF)进行实体识别.为了满足实验要求,该文将传统网页爬虫方法与API接口采集方法相结合进行微博数据采集.实验结果表明,该方法能够有效提高中文微博命名实体的识别效果.  相似文献   

6.
专家实体主页识别是专家检索的一个重要的组成部分,本文提出了一种基于J48的机器学习算法来对中文专家实体主页进行分类识别.首先,人工收集中文专家实体及对应的专家主页面2 113个,针对中文专家实体特点,定义与链接和网页内容特征相关的专家实体特征,并对这些特征进行提取,形成训练数据集.然后,采用不同学习算法对在不同特征上的...  相似文献   

7.
针对目前中文命名实体识别研究集中在输入文本的特征的提取,且输入的嵌入表示直接影响模型的性能这一特点,从背景知识、研究现状和未来发展等方面对中文命名实体识别的研究展开全面的调查.回顾了命名实体识别的发展进程,解释中文命名实体识别的研究难点,归纳不同的研究方法,分为基于字的模型、基于词的模型和基于字-词的模型;介绍目前中文命名实体识别的主流数据集、标注方法和评价指标,从不同角度分析了各数据集的特点;讨论了近几年深度学习技术在中文命名实体识别中的最新研究进展,介绍各分类下具有代表性的模型及性能对比,分析性能优劣原因;总结了中文命名实体识别当下所面临的一些挑战,讨论了未来更具有研究价值的方向,促进中文命名实体识别的进一步发展.  相似文献   

8.
实体链接任务的目的是将文本中的实体指称链接到知识库中与之对应的无歧义实体。针对此任务, 提出一种基于主题敏感的重启随机游走的实体链接方法。该方法首先使用实体指称的背景文本信息将实体指称扩充为全称, 并在维基百科知识库中搜索候选实体, 得到候选实体集合; 根据上述中间结果构建图, 利用在图上的主题敏感重启随机游走得到的平稳分布对候选实体集合进行排序, 选出top 1 的候选实体作为目标实体。实验结果表明, 该方法在KBP2014 实体链接数据集上实验的F 值为0.623, 高于其他系统实验的F值, 能够有效提高实体链接系统的整体性能。  相似文献   

9.
中文嵌套命名实体关系抽取研究   总被引:1,自引:0,他引:1  
为了解决嵌套命名实体关系抽取研究缺乏相关语料库这一问题, 在现有中文命名实体语料库的基础上, 将人工标注与机器学习相结合来抽取其语义关系。人工标注一个中文嵌套命名实体关系语料库, 然后分别采用支持向量机和卷积神经网络等方法, 进行中文嵌套实体关系抽取实验。实验结果表明, 在人工标注实体的中文嵌套命名实体语料上, 嵌套实体关系抽取的性能非常好, F1指数达到95%以上, 而在自动识别实体上的抽取性能尚不理想。  相似文献   

10.
一个新的基于细节特征的指纹匹配方法   总被引:2,自引:1,他引:2  
自动指纹识别系统(automaticfingerprintidentificationsystems,AFIS)的精度和效率主要依赖于指纹的匹配算法.指纹匹配涉及的两个关键问题是指纹的对齐和匹配方式.根据同一个指纹的不同采样,其脊线形状保持高度的相似性的特点,利用两条脊线对应点的距离构造了一个判据,用来评价两条脊线形状的相似性,以实现指纹的最优对齐;针对传统指纹匹配算法中伪细节点的混入和真实细节点的遗漏影响指纹匹配精度的问题,提出了一种基于编辑距离原理的指纹细节特征匹配方法,对指纹库Fingdb和FingerDUT进行了测试,等错误率分别为0.62%和2.75%,证明该方法具有较高的可靠性和有效性.  相似文献   

11.
从1898年《马氏文通》问世到1956年“暂拟汉语教学语法系统”的建立,是介词、连词命名、体系建立及词类地位确立阶段。1956年至今,介词、连词的区分主要就“和、跟、同、与”、“因为、为了、由于”两类词的划界标准进行了探讨。研究的方法是多向、多维的且不断更新的。历时与共时、口语与书面语、普通话与方言多方面结合考察是介词、连词的区分应该关注的问题。  相似文献   

12.
基于句法与主题扩展的中文微博情感倾向性分析模型   总被引:1,自引:0,他引:1  
微博数据具有微博文本长度不一,文本内容主题发散性,夹杂微博专用符号等特性,需要一种融合句法分析、领域知识、表情符号等多因素的综合建模方法对社会、娱乐、安全等多领域微博进行情感分析. 文章提出了一种面向主题的中文微博情感建模方法,该模型涵盖了数据预处理、句法分析、主题扩展、领域知识、情感词上下文极性调整、表情符号等内容,最后以新浪微博采集数据,选取3个领域主题进行了实验,在特定的实验环境下,得到了较高的分析准确率.   相似文献   

13.
依据水语的语音信息,提出了与声母、韵母、音节相关的水书字音编码规则,在该规则的基础上讨论了水书字音输入过程中存在的歧义性问题,并提出了消除歧义的算法.分析了水书字音输入算法的基本思想和核心步骤,通过仿真试验验证了该方案的可靠性和有效性.  相似文献   

14.
通过对摩托车灯的结构特点及AutoCAD造型方式特点的分析,讨论了在ObjectARX环境下,摩托车灯实体造型辅助设计系统构造的需求、解决方案及涉及的关键技术。这对进一步构造和实现这样的系统具有重要的意义。  相似文献   

15.
基于微博文本数据分析的社会群体情感可视计算方法研究   总被引:1,自引:0,他引:1  
针对已有的情感分析研究多侧重在情感的倾向性方面, 缺乏对各类情感的详细描述, 不能形象直观地反映社会群体的情感变化的问题, 提出一种基于依存句法和人工标注相结合的情感分析方法。该方法采用三维立体的人脸表情进行情感分析, 形象地呈现社会群体的情感变化。对于不同的社会事件, 以可视化方式来展现不同地区微博群体的情感。实验结果表明, 该模型可以有效地描述人群情感, 研究结果为基于大数据的网络舆情分析提供了一种新思路。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号