首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 156 毫秒
1.
主要针对中文网页语料研究人物关系抽取,提出一种融合最近距离和人名窗口信息的人物关系抽取方法。首先利用远程监督的方法构建人物关系库,提取关系候选语料,通过打分函数过滤掉语料中的噪音数据以提高语料质量;然后在卷积神经网络中引入最近距离,将词与人名之间的距离信息加入到网络中;在循环神经网络中以人名窗口内词向量代替整句词向量作为网络的输入。最后融合两部分网络信息并对网络模型进行训练。结果显示,该方法比传统基于SVM的中文人物关系抽取方法和一些其他的神经网络模型F1值提高3个以上百分点。  相似文献   

2.
高波 《科技信息》2012,(34):I0088-I0088
人名是一种社会现象,同时也是一种语言现象。本文的调查对象选取了出生于1950至2009年各个年份的男女人群,共计300人。本文旨在从社会语言学的角度分析从1950年到2009年间出生的汉人的命名方法,以及影响命名的社会因素是什么。以此为新生儿的命名以及以后人们对于人名的研究提供一些建议和资料。  相似文献   

3.
多样性是描述社会网络中节点行为的一个重要特性,通过对典型的大规模Web社会网络DBLP数据源提取,构建了一个大型SCN(科研合作网络),针对该网络节点间的关系进行建模与量化分析,利用节点度的累积分布、相关性、结构洞、聚类系数等网络结构特征参数,实证分析得出真实社会网络中的节点间关系具有多样化的特性,其多样性指标分布呈指...  相似文献   

4.
为构建东盟十国知识图谱,需要对相关文本进行命名实体识别工作。设计一种基于双向GRU-CRF的神经网络模型对中国驻东盟十国大使馆中文新闻数据进行命名实体识别。以预训练的领域词向量为输入,利用双向GRU网络从向量化的文本中提取语义特征,再通过CRF层预测并输出最优标签序列。为了进一步改善结果,在双向GRU和CRF层之间添加两层隐藏层。在数据预处理方面,提出一种数据集划分算法对文本进行更加科学合理的划分。在东盟十国数据集上将该模型与几种混合模型进行对比,结果显示所提模型在人名、地名、组织机构名识别任务中拥有更好的识别性能。  相似文献   

5.
人名识别是自然语言处理中具有挑战性的任务之一。该文实现了基于条件随机场的维吾尔人名识别。首先从对维吾尔语黏着性特点的分析入手,研究总结了维吾尔人名的构成特点,实现了以词形、词性、词干、后缀、首音节、最后一个音节和最近一个动词等为特征,基于条件随机场的维吾尔语人名识别方法,并设计了选取最佳特征模板的贪婪算法。实验结果表明:该方法达到了较高的性能,识别维吾尔人名的准确率、召回率和F-score分别达到了90.03%、82.96%和86.35%。  相似文献   

6.
提出了一种网络数据挖掘的方法从大规模文集中抽取命名实体之间的关系.其核心思想是,将文集中的命名实体对以及它们的上下文表示成网络结构并从该网络结构中发现网络社区,则每个社区表示一种关系,而处于相同社区中的命名实体对具有相同的关系;最后我们用适当的词语来标记这些关系.我们使用《人民日报语料库》进行实验,其结果表明我们不但可以得到较高的准确率,而且可以自动的标注命名实体的关系.  相似文献   

7.
提出一种以Web服务为节点,服务间的调用关系为边来构建复杂网络模型的方法.通过模型来研究Web服务组合结构中的服务关系,找到大量Web服务中关键的Web服务,增加组合服务的健壮性及可靠性.实验结果证明了该方法的正确性以及有效性.该方法的提出把对Web服务的研究从传统的SOA模型中引领到复杂网络模型中,对Web服务组合的进一步研究具有指导意义.  相似文献   

8.
汤薇 《科技信息》2010,(10):I0216-I0217
在对相关信任模型研究的基础上,借鉴社会网络中的信任关系,提出了一个基于实体行为的信任模型。该模型使用实体在网络中的行为作为模型的反馈信息,对其关键属性进行量化得到关键评价,并进行适当的计算,得到实体的信任度从而决定所要进行的操作是否可进行。  相似文献   

9.
基于LSTM的大规模知识库自动问答   总被引:1,自引:0,他引:1  
针对大规模知识库问答的特点, 构建一个包含3个主要步骤的问答系统: 问句中的命名实体识别、问句与属性的映射和答案选择。采用别名词典结合LSTM语言模型进行命名实体识别, 使用双向LSTM模型结合两种不同的注意力机制进行属性映射, 最后综合前两步的结果进行实体消歧和答案选择。该系统在NLPCC-ICCPOL 2016 KBQA任务提供的数据集上的平均F1值为0.8106, 接近评测的最好水平。  相似文献   

10.
社会网络分析方法将社会行动者映射为图的节点,社会行动者之间的关系映射为图的边,然后利用图论的相关知识来解决社会网络问题.将数据挖掘方法应用于社会网络分析是数据挖掘研究领域的一个新方向.本文主要在算法改进和系统实现层面展开数据挖掘在社会网络分析中的应用,提出了基于权重的Jaccard相似度度量的方法及处理多链接属性的实体识别算法.最后基于电信分析系统平台,使用上述算法在电信数据集上进行测试,实验结果表明上述算法的有效性和实用性.  相似文献   

11.
自从引入分子系统学的观点和技术手段以来,我国的苦苣苔科植物在属一级水平上的撤销、合并、转置、扩增等修订与再修订工作多次发生。众多物种的系统位置变迁、学名的更替变换对我国科研人员在国产苦苣苔科植物研究、成果发表方面造成了很大的混乱和困扰。为协助不同学科方向的学者更好地理解我国苦苣苔科植物系统修订与变更前后的过渡关系,同时解决苦苣苔科分类系统发生的变化导致出现的大量相关拉丁学名和中文名错用的现象,本文研究了自2011年中国苦苣苔科植物新系统构建以来,中文科技论文中中国苦苣苔科植物名称(包括学名和中文名,主要是学名)更替上出现的混淆问题,并据此展开分析。从学科和时间的角度看,2012—2017年,中文科技文献中修订前的属名仍然大量出现,以唇柱苣苔属为首,出现在园林植物学、植物生态学、植物生理学、植物化学、中药学等学科之中,但随着新分类系统逐渐被接受,旧学名出现的频度开始出现下降。进一步统一修订后的我国苦苣苔科植物学名和中文名,对于提高中文科技期刊的科学性具有重要的意义。  相似文献   

12.
设计了一个中文姓名抽取系统, 该系统采用神经网络进行汉语句子的分词处理, 根据姓名后置特征词进行姓名的抽取, 成功解决了尾字和下文成词的姓名抽取问题. 以1998年1月份《人民日报》语料库中含有此类姓名的语句作为测试数据,结果表明, 姓名抽取的召回率和精确度较现有方法都有很大提高.  相似文献   

13.
从商标的功能谈汉语商标名的英译   总被引:4,自引:0,他引:4  
随着中国加入世贸组织,出口商品大量增加,人们更加认识到了商标名翻译的重大意义。本文从商标的功能谈起,认为商标名的英译可以以“功能等效”理论为依据,并依此探讨了几种常用的翻译方法与技巧。  相似文献   

14.
基于遗传算法的Web集群负载均衡方法   总被引:3,自引:2,他引:3  
Web集群技术解决了Web服务器系统的容量问题,其核心思想是负载均衡策略和算法。在此对Web集群中的负载均衡技术进行了分析和探讨,并提出一种混合遗传算法。仿真实验表明,这种算法能有效解决Web集群的负载均衡问题,并且能避免标准遗传算法的早熟收敛现象,同传统的负载均衡方法相比,降低了任务执行时间。  相似文献   

15.
基于深度学习的中文地名识别研究   总被引:1,自引:1,他引:0  
基于深度学习的循环神经网络方法,面向中文字和词的特点,重新定义了地名标注的输入和输出,提出了汉字级别的循环网络标注模型.以词级别的循环神经网络方法为基准,本文提出的字级别模型在中文地名识别的准确率、召回率和F值均有明显提高,其中F值提高了2.88%.在包含罕见词时提高更为明显,F值提高了26.41%.   相似文献   

16.
西方人名在汉译过程中一般是采取音译方式,但在实际翻译中却出现了林林总总的形式,令人莫衷一是,难以抉择。文中列举了西方人名在汉译过程中所采用的一些规则,诸如名随主人、约定俗成、外国人名的汉化以及"名"字的选择等,并作相应解释,归纳总结,旨在为以后的翻译提供参考。  相似文献   

17.
基于URL类型优先级的入口页面查询算法   总被引:1,自引:0,他引:1  
入口页面(主页)查询结果只有一个,并且用户的查询词常常是简短的页面名称,由于它要求更高的精准度,一般认为是较为困难的. 依据语言模型分析,挖掘出对中文入口页面(entry page)检索有意义的查询域作为基准检索的内容域,同时考虑到非内容网页优先级(URL type等)特征的重要性,建立综合内容域和非内容网页特征的检索模型. 通过URL类型优先级(URL type prior)的概率统计,发现入口页面和其相关的子页面之间存在比较大的联系. 据此提出基于相关子页面的入口页面提取算法PERS(page extracted from relevant sub page). 对比实验数据表明,PERS算法对检索的性能有较大提高.  相似文献   

18.
张小艳 《科技信息》2013,(22):189-190
In the field of translation,name translation is seldom noticed.Even though we can not deny that name translation is an indispensible part in translation,the attention that we paid to it is not enough.In Chinese and English cultures,names are given different significances.So it is necessary to pay enough attention to the translation of names from its situations,skills and meanings.But so far there is still no fixed standard of name translation,both from its forms and skills.Form the time that people from different cultures met and communicated,name translation had become a part that can not be ignored in translation.The target of name translation is simple,but the means of it are variable.The attractive ways of name translation are worth to study,and it is significant indeed.In this thesis I will focus on how to translate English names into Chinese,analysis the phenomena,explore the skills and come up with some valuable viewpoints.With some selected examples,we can discuss the problem we just noticed above,and several unsolved problems will appear in the thesis.  相似文献   

19.
Premiere Pro CS3是Adobe公司开发的一款功能强大的影视作品编辑软件,但在字幕制作上有一个明显的不足。即使是汉化版的Premiere Pro CS3,字幕设计器中的字符面板也不能以中文显示中文字体名称与中文字体样式。本文就是针对该问题,分析阐述了三种显示中文字体名称与中文字体样式的方法。  相似文献   

20.
The Web cluster has been a popular solution of network server system because of its scalability and cost effective ness. The cache configured in servers can result in increasing significantly performance, In this paper, we discuss the suitable configuration strategies for caching dynamic content by our experimental results. Considering the system itself can provide support for caching static Web page, such as computer memory cache and disk's own cache, we adopt a special pattern that only caches dynamic Web page in some experiments to enlarge cache space. The paper is introduced three different replacement algorithms in our cache proxy module to test the practical effects of caching dynamic pages under different conditions. The paper is chiefly analyzed the influences of generated time and accessed frequency on caching dynamic Web pages. The paper is also provided the detailed experiment results and main conclusions in the paper.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号