共查询到20条相似文献,搜索用时 15 毫秒
1.
基于深度学习的循环神经网络方法,面向中文字和词的特点,重新定义了地名标注的输入和输出,提出了汉字级别的循环网络标注模型.以词级别的循环神经网络方法为基准,本文提出的字级别模型在中文地名识别的准确率、召回率和F值均有明显提高,其中F值提高了2.88%.在包含罕见词时提高更为明显,F值提高了26.41%. 相似文献
2.
近几年来,中文分词技术取得了可喜的进步,各种机器学习方法被应用到这一领域,而采用标注的方法进行分词也是应用得比较多的方法。本文尝试了一种不同以往的方法,不对字本身进行标注,而对字与字之间的切分点进行标注,并结合条件随机场模型,实现了一个分词系统并参加了第三届国际中文处理评测的分词比赛,取得了较好的结果。 相似文献
3.
针对现有地理数据空间检索方法以简单字面匹配为核心、缺乏推理能力等问题,根据地理信息科学中的空间拓扑理论,提出一种基于地名本体的加权相关度算法.该算法考虑到不同的空间拓扑关系在语义检索应用中的重要程度不同,从而赋予地理空间本体关系不同的权值,并体现了其与语义距离的反比关系.通过地名本体实例验证,表明经加权后的语义相关度算法在语义检索应用中可以达到更好的检索效果. 相似文献
4.
基于支持向量机的中文文本中地名识别 总被引:2,自引:0,他引:2
提出并实现了一种基于支持向量机(SVM)的中文文本中地名的自动识别方法.结合地名的特点,抽取单字本身、基于字的词性、是否在地名特征词表中及其上下文的信息作为向量的特性,并将其转化为二进制表示,在此基础上建立了训练集,并通过对多项式Kernel函数的测试,得到了用支持向量机进行地名识别的机器学习模型.实验表明,所建立的SVM地名识别模型是有效的,系统开式召回率和精确率分别达86.69% 和93.82%,F-值为90.12%. 相似文献
5.
汉语自动分词中中文地名识别 总被引:6,自引:0,他引:6
以词语级的中文地名为识别对象,根据地名内部用字的统计信息和地名构成特点产生潜在地名.在汉语自动分词中将可信度较高的潜在地名等同于句子的候选切分词,利用候选切分词本身的可信度和上下文接续关系评价句子的各种切分方案.在确定句子最佳切分时识别句子中的中文地名.对真实语料进行封闭和开放测试,封闭测试结果为召回率93.55%,精确率94.14%,F-1值93.85%;开放测试结果为召回率91.27%,精确率73.48%,F-1值81.42%.取得了比较令人满意的结果. 相似文献
6.
CRF与规则相结合的中文地名识别 总被引:2,自引:0,他引:2
采用递增式学习策略优化条件随机域(conditional random fields,CRF)的特征模板以提高中文地名的识别效果,结合语言学相关知识构建规则库,以弥补机器学习模型获取知识不够全面导致召回率偏低的不足,最终实现了CRF与规则相结合的中文地名识别系统.实验结果表明,采用CRF与规则相结合的方法识别中文文本中的地名是有效的,对Bakeoff2007NER任务的MSRA语料进行开放测试,召回率、精确率和F值分别为94.67%、92.35%和93.50%. 相似文献
7.
基于本体的信息检索技术能形成较好的语义理解,能有效地提高信息检索的效率.试图将本体在信息检索中的部分研究成果运用到GIS领域,研究基于本体的地理信息检索方法.在构建地理本体时,通过领域本体生成应用本体,由此产生的应用本体采用相同的数据结构,使地理本体具有良好的共享性和扩展性. 相似文献
8.
提出了将本体的思想和方法引入到空间信息集成的思路,以解决当前地理信息系统中的各种异构问题.研究了地理本体模型的建立和表示,并在此基础上提出了一种面向空间信息集成的地理本体比较方法,其核心思想是从结构和语义两个方面对地理本体中的概念进行比较,其中从结构方面对概念进行比较主要是对概念的名称进行比较,而从语义方面对概念进行比较主要是确定在地理本体中概念之间的语义关系. 相似文献
9.
随着信息技术的飞快发展,今天的互联网上信息已成爆炸式增长,文本挖掘技术成为目前研究的热点.文章概述了中文分词的算法,通过介绍歧义存在的种类,分析了分词结果歧义性存在的必然性;在中文分词基础上,提出了一种采用"动词优先"的歧义消除算法,使分词结果最大程度地消除歧义,从而提高了分词的精度,为文本挖掘之后的环节打下了基础. 相似文献
10.
地理时空本体研究进展 总被引:6,自引:0,他引:6
地理现实的动态性早已被人们所广泛接受,日前关于时空GIS的研究也越来越多.本体技术的引进,为地理时空研究提供了一条新途径.从地理时空本体的起源基础介绍了时间本体、空间本体的基元、特性、表示模型等,综述了目前时空本体的研究进展,总结了目前研究中存在的一些问题并展望了未来的发展方向. 相似文献
11.
刘畅 《北京联合大学学报(自然科学版)》2006,20(1):49-53
介绍了文物领域本体的概念模型,研究了用OWL语言建立文物领域本体的设计与实现方法。给出了对OWL本体进行解析和推理的方法。在分布式系统中,解析OWL对本体的知识共享具有很好的效果。 相似文献
12.
13.
刘盛佳 《华中师范大学学报(自然科学版)》1996,30(4):511-516
认为地名,地图,地理在古代都是揭示地理实体的学问,根据古今文献记载的分析,人类认识地理实体的过程是由个体开始,继而研究各别个体的空间关系,进而揭示实体的构成,联系和性质,这一认识过程正好是由地名到地图再到地理,由其产生的渊源关系也揭示到三者皆是共同研究人类赖以生存的地理环境的科学,故都是组成地理科学的成员。 相似文献
14.
基于地理关联度和证据理论的地名消歧方法研究 总被引:1,自引:0,他引:1
针对目前地名消歧方法普遍缺乏理论基础和统一形式化方法的现状,以地理学第一定律为理论基础,使用地理关联度形式化地理实体之间的邻近性。在此基础上,提出基于证据理论的地名消歧计算模型,用于表示与合成上下文中共现的地名证据。该模型模拟人类阅读和理解文本中时空语义的认知过程,并为地名消歧处理提供一个统一的易扩展的形式化框架。最后,给出本文地名消歧方法的实现算法及其实验评估。结果显示,算法综合性能指标F1达到89.60%,取得较好的实验效果。 相似文献
15.
《云南大学学报(自然科学版)》2011,33(Z2):196-201
传感网的研究和应用已经成为推动新信息时代发展的重要动力,而传感网络的运行无法避免结构复杂的海量传感数据的处理.尽管目前已有大量的数据融合算法和模型的出现,但无法避免数据语义、网络语义异构等等问题.结合传感网的特征和地理本体的研究,本文首先提出了空间传感网的定义,随后提出了基于空间传感网的地理本体库公理化模型,最后给出了应用于湖泊领域的实践,结果显示采用文中所提方法既能够节约传感网有限的动力资源,又能够有效消除传感网中的异构. 相似文献
16.
17.
为了实现局部本体之间数据交换映射关系的自动识别,重点研究基于全局本体与局部本体之间的数据交换映射技术。技术以本体映射重用角度出发,结合信息集成中数据交换映射的研究重点分析了本体映射的详细分类与可逆性,定义了映射传递性与识别缺失率,研究映射关系组合结果实现映射自动识别,技术在大庆油田数据中心大型数据交换项目中得到应用。 相似文献
18.
袁鸿雁 《长春工程学院学报(自然科学版)》2010,11(1):108-110
由于HTML只描述数据怎样显示而不描述数据的内容,因此识别HTML表格并抽取其数据是Web信息抽取领域中重要的研究课题之一,针对现在包装器技术的不足提出了一种新的基于领域本体的HTML表格结构识别技术,为构造HTML表格信息抽取系统打下基础。 相似文献
19.
跑道入侵的危险识别是控制跑道入侵发生率的重要研究基础。通过应用业务流程建模与标注,对跑道入侵发生场景进行业务流程建模;在此基础上应用HAZOP方法对跑道入侵发生场景进行危险分析。建立HAZOP节点分析本体,构建概念间的TBOX描述逻辑关系并推理;此方法的案例应用表明,综合BPMN、HAZOP和本体的危险识别方法能够更好分析系统内复杂交互行为所带来的危险,并实现HAZOP分析的标准化,是一种比传统HAZOP分析更为有效的方法。 相似文献
20.
提出了一种在构造内部规则和外部规则的同时采用概率统计的中文地名实体的识别方法,并利用这种基于规则和统计相结合的方法对测试语料库进行识别测试,实验证明该方法获得了较高的准确率和召回率,具有可行性和合理性,同时也指出了它的局限性. 相似文献