排序方式: 共有81条查询结果,搜索用时 15 毫秒
1.
谭晓平 《湖北三峡学院学报》2010,(2):87-89
《新著国语文法》的语法体系不仅在汉语语法教学和研究领域影响深远,而且在中文信息处理中得到有效的应用。其普遍语法观念、“句本位”语法体系、句成分语法观念、对字与词的明确区分、对动词的分类等均有助于汉语形式语法的构建。 相似文献
2.
可应用于互联网的自学习中文关键词抽取算法 总被引:6,自引:1,他引:6
论文提出了一种自学习中文关键词抽取算法,该算法可以辅助实现互联网上的智能信息获取,从而有效解决互联网信息爆炸问题,该算法现已用于课题组开发的互联网信息智能获取工具中,实验表明该算法的查全率和查准率较高,在互联网信息智能获取中具有广阔的应用前景。 相似文献
3.
4.
5.
6.
黄Li 《广西师范大学学报(自然科学版)》1997,15(3):41-44
以五笔输入法为例,介绍了一种为中文WINDOWS增加新的汉字输入法的通用方法。通过这种方法可以将UCDOS等中文系统中常用的汉字输入法,转换到中文WINDOWS中,从而能够充分发挥DOS中文系统中丰富的输入法和WINDOWS中文字处理软件强大功能的优势。 相似文献
7.
一种基于概率模型的分词系统 总被引:9,自引:1,他引:8
汉语自动分词是中文信息处理中的基础课题。本文首先对汉语分词的基本概念与应用,以及汉语分词的基本方法进行了概述。接着引出一种根据词的出现概率、基于极大似然原则构建的汉语自动分词的零阶马尔可夫模型,并重点剖析了EM(Expectation-Maximization)算法,最后给出了一个基于本模型的汉语文本处理仿真系统。 相似文献
8.
藏文分词是藏文自然语言处理的基础。根据藏文虚词在藏文文本中的特殊作用以及虚词的兼类性、结合性、黏着变体性和还原特性,设计实现了一个基于藏语虚词切分的正向最大匹配的藏文分词系统,该系统对原始文本进行逐次扫描处理得到分词结果。实验表明,文章提出的藏文分词系统具有较高的切分精度和切分速度。 相似文献
9.
数量名短语的自动识别是中文信息处理中短语识别的重要内容,对汉语深层次句法分析和语义分析将起到很重要的作用。本文对"数.量.名"、量词重叠的数量名短语进行自动识别,以量名搭配概率为基础,提出了基于变长后缀匹配的后退算法来发现更多的量名搭配,把召回率提高了40个百分点。我们在240万字的当代新闻小说语料上进行了识别试验和测试,结果显示,达到80%左右的调和平均值。 相似文献
10.
离合词是现代汉语中一种特殊的语言现象。文章对动宾式和并列式离合词的扩展形式进行了细致的描写,并分析了这两类离合词的扩展形式的特点,认为动宾式和并列式离合词的扩展形式不同于典型的动宾结构,在中文信息处理系统中,应该建立离合词词库,对离合词的扩展形式做出专门的符号标注。 相似文献