共查询到20条相似文献,搜索用时 31 毫秒
1.
2.
汉语分词技术研究现状与应用展望 总被引:8,自引:0,他引:8
汉语自动分词是计算机中文信息处理系统的基础和难题,本文对近年来的汉语自动分词的研究方法与成果进行了分析综述。探讨了分词中存在的一些关键问题,同时介绍了分词技术在科研以及商用系统中的应用。并展望了未来分词技术在应用方向的发展. 相似文献
3.
《科技资讯》2019,(1)
随着我国互联网技术的不断发展与进步,我国已经逐渐步入到了"互联网+"时代,与此同时,在当今时代背景下,国与国之间的距离正在逐渐缩小,国际经济合作已经成为一种新常态。在这种大环境下,各大外贸企业对于国际汉语人才的需求度正在逐年提升,因此,汉语国际教育工作就显得尤为重要,该项教育的质量在一定程度上对于国际经济合作的发展有着重要的影响。有效地提升汉语国际教育水平,不仅可以为国际经济贸易企业提供必要的语言文化人才支持,同时还可以促使我国更好地融入到世界贸易市场当中,进而提升我国的整体经济水平。该文主要就"互联网+"背景下,汉语国际教育在国际经济合作中的作用与影响做了简要的分析。 相似文献
4.
5.
近年来,随着国际互联网 Internet 技术的飞速发展,相当一部分各级政府、各类企业已采用先进的互联网技术建立自己的内部办公网 Internet,但国际互联网的开放性使得网络安全性受到严重威胁。网络的安全性是全球瞩目的话题,也是电子商务时代最令人感到不安的因素。根据美国一家研究“电脑经济”的研究中心近日发表的一份研究报告,仅1999年电脑受病毒就已经使全球公司损失了76亿美元。有专家更进一步指出,电 相似文献
6.
林杏光 《科技导报(北京)》1997,(4)
人工智能(利用计算机模拟人类智力活动的学科)的研究已成为当前最热门的研究学科之一,而自然语言理解(NaturolLanguogeUnderstanding,简称NLU)是人工智能的一个分支。自然语言理解有时也称计算语言学(ComputationalLinguistics),前者侧重于应用,后者侧重于理论,其内涵是一致的。汉语理解属于计算语言学范畴,是自然语言理解的一部分。汉语研究,在某种意义上说,是汉语理解的基础,因为汉语理解必须应用汉语研究的成果。1974年经周总理亲自批准的"748"工程,标志着我国中文信息处理技术首开先河。由于方块汉字的特殊性,在汉… 相似文献
7.
8.
一种改进的增字最大匹配算法 总被引:1,自引:0,他引:1
汉语自动分词技术是中文信息处理的关键技术,目前已经成为中文信息处理的瓶颈。介绍了目前几种常用的自动分词算法,在对各种分词算法进行研究的基础上,对现有的增字最大匹配法进行了进一步的改进,更加充分的体现了最大匹配法中的“长词优先”的原则,使分词系统在自动分词阶段有比目前的增字最大匹配法更好的效果。 相似文献
9.
词、格助词、藏文信息和分词单位等概念是藏文分词过程中必须提及的几个专业术语。文章依据《咨询用中文信息处理分词规范》、《中文信息处理分词之基本词表》、《信息处理用现代汉语分词规范》和《分词词表》等地区和国家标准,结合藏文传统语法典籍和汉语语义分类体系,对这几个概念进行了论述。 相似文献
10.
汉字字符远比西文字符量多且复杂,我国是创造和使用汉字的国家,因此探索中文信息处理技术是至关重要的。本文从中文信息处理的研究内容、基本方法等几个方面谈了对计算机中文信息处理的认识。 相似文献
11.
杨丽 《东北师大学报(自然科学版)》1988,(4)
汉字编码,即通常所说的计算机汉字键盘输入技术,是中文信息处理工作中的重要一环。目前国内汉字编码大体有音码方案和形码方案两大类。音码方案比较易学,但输入速度慢,而且字集只限于国标简体汉字。一些形码方案虽能够快速输入,但难学,不易普及推广。由于电子计算机中文信息处理技术应用领域的扩大和改革、开放,中国电子产品要打入国际市场,繁体汉字在其它语种中仍在广泛使用,这就十分需要汉字编码 相似文献
12.
基于优化最大匹配与统计结合的汉语分词方法 总被引:1,自引:0,他引:1
汉语自动分词足中文信息处理的前提,如何提高分词效率是中文信息处理技术面临的一个主要问题.基于训典和基于统计的分词方法是现有分词技术的主要方法,但是前者无法处理歧义字段,后者需要大量的词频汁算耗费时间.本文提出优化最大匹配与统汁结合的分词方法,首先提出优化最大匹配算法,在此基础上提出了规则判断与信息量统计两种消歧策略.然后,给出了优化最大匹配与统计结合的分词算法,提高了分词的效率.最后,基十分词算法实现中义分词系统,并通过实验对算法进行了分析和验证. 相似文献
13.
《呼和浩特科技》2006,(3):5-9
《瞭望新闻周刊》记者最近走访了科技部技术前瞻研究组项目执行组组长程家瑜,他向记者展示了最新的研究成果《中国技术前瞻报告》。课题组上千名专家近三年来深入分析了未来10年我国经济社会发展的大趋势和对科技的需求,系统调查了信息、生物、新材料三大领域国内外的发展状况和趋势,课题组认为,未来10年我国在这三大领域最有可能的科学突破与技术突破集中在以下10个方面:下一代移动通信技术、下一代网络体系、纳米级芯片技术、中文信息处理技术、人类功能基因组学、生物制药技术、生物信息学、蛋白质组学、农作物新品种培育技术、纳米材料与纳米技术。信息、生物、新材料是21世纪前30年发展最快、最热门的三大领域,它们集结了当今世界最强势的研究力量。但在这些关系未来发展的关键领域中,我国许多核心技术仍依赖追踪、模仿和引进国外技术,原始创新能力明显不足。从更宽的视野来看,不仅仅是这三个领域的发展需要高扬“自主创新”的信心与勇气。实际上,整个中国科技正面临着前所未有的发展压力:对外要适应国际科技竞争的紧迫形势,对内要满足经济社会发展进程中的重大战略性需求。而原始创新能力和技术创新能力的薄弱,已成为当前和未来相当长时期内影响我国整体竞争力的极大障碍。 相似文献
14.
对于汉语这种缺乏严格意义上的形态变化的语言来说,要让计算机自动理解并生成汉语,语义知识的研究就显得至关重要。文章主要介绍了国内面向中文信息处理的语义研究概况,旨在为相关工作人员提供参考资料,奠定研究基础。 相似文献
15.
16.
消解中文三字长交集型分词歧义的算法 总被引:18,自引:0,他引:18
汉语自动分词在中文信息处理现实应用中占据着十分重要的位置。三字长交集型分词歧义是分词歧义的主要类型之一,在真实文本中的出现频率相当高。提出了一种针对这种分词歧义的消解算法,回避了训练代价比较高昂的词性信息而仅仅利用了词的概率信息及某些具有特定性质的常用字集合。从一个60万字的汉语语料库中抽取出全部不同的三字长交集型分词歧义共5367个作为测试样本。实验结果表明,该算法的消解正确率达到了92.07%,基本可以满足实用型中文信息处理系统的需要。 相似文献
17.
中文分词是中文信息处理领域的重要技术,现已成为中文信息处理研究中最成熟的领域.融合多策略的中文分词算法模型在字典匹配的基础上引入了标注统计和规则理解的优化策略,将已有的句法、语义研究应用到分词排歧与未登录词识别领域.通过实验对比,初步证实分词效果较好,达到模型分词的准确率和自适应性的提升. 相似文献
18.
王世宁 《山西大学学报(自然科学版)》1981,(1)
精密的实验测定,是中文信道特性分析所必不可少的。中文信息处理技术是目前世界上计算技术中的发展点,仅日本便约有廿家计算机公司在竞相研究之中,美国IBM及日本富士通等许多公司来华研究中文信息处理问题。我国汉字键盘码也正进入考评阶段。然而,有关的特性分析最终要通过实验加以测定,给出定量的结论才为可靠。 相似文献
19.
基于最长次长匹配的汉语自动分词 总被引:11,自引:1,他引:11
汉语自动分词是中文信息处理领域所特有的一个重要研究课题,机器翻译(MT),自然语言理解(NLU),情报检索(IR)等都需以自动分词作为基础。为解决分词中的歧义问题,针对歧义切分字段的分布特点,提出一种基于最长匹配原则的汉语自动分词方法,分词效果较好。 相似文献
20.
本文简要介绍了中文信息处理的主流技术,着重介绍了中文信息处理中的N元模型、语音识别、词性标注和句法分析技术。 相似文献