首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 140 毫秒
1.
基于构词法的网络新词自动识别初探   总被引:21,自引:0,他引:21  
网络新词语的自动识别是中文信息处理中的一个热点研究课题。文章在对加工过的网上文本语料统计的基础上 ,根据汉语构词法建立规则库 ,通过调用“互斥性字串”过滤规则和构词规则来确定新词语。设计并实现了网络新词语的自动识别实验系统 ,经封闭测试 ,准确率为 91.2 % ,召回率为 95 %。  相似文献   

2.
基于Web的多不确定因子WORD通用报表的动态生成   总被引:1,自引:0,他引:1  
报表是应用程序数据输出的一个重要方式,如何开发实用高效、通用性强、交互性好的报表系统是软件开发人员最关心的问题.文章针对Web成绩报表系统中的数据库结构、字段、专业、班级、学期课程数等诸多不确定因素,提出了一个基于Web成绩报表模型和实现算法,通过ASP对数据库的自动识别技术、字段自动识别与归类方法,开发出一个适应分布式环境的、能解决多不确定因素的通用高效WORD成绩报表系统.提高了工作效率,解决了现有报表中存在的不足.  相似文献   

3.
基于规则库和聚类分析的复句短语字段的自动识别研究   总被引:1,自引:0,他引:1  
复句层次结构与层次关系研究,是一项将中文信息处理由字、词处理阶段提升到句处理阶段的关键性难题.在研究复句层次划分和层次关系之前,首先要确定复句中分句的数量,需要排除其中非完整分句的字段(本文中称之为短语字段).结合语言学的相关理论,首先建立规则库,在此基础上,引入聚类分析法,对短语字段进行分类,最终使短语字段的自动识别率达到92.1%.  相似文献   

4.
为了建立一个面向中文信息处理的现代汉语复句深加工语料库,我们必须进行短语字段的自动识别工作.目的是把这些字段排除在分句层次分析的范围之外.这项工作建立在自动分词和词性标注的基础上,首先通过编写的程序把所有不含动词的字段暂时统一识别为短语字段.对于虽包含动词但前后有明显形式标志的字段则通过制定相应的规则来识别.还有一部分字段只包含一个动词,但前后却没有明显的形式标志,对此,需要利用字段中的结构助词"的"来帮助识别.  相似文献   

5.
新词语的产生是社会进步和科学技术不断发展的产物,是汉语言强有力的发展因素。新词语的出现极大的丰富了汉语言的使用范围和语义范畴,表现出了强大的语言魅力。该文详细阐述了新词语产生的来源,并对新词语如何丰富汉语言的发展做了详细的分析,以便充分理解新词语对汉语言的丰富和发展。  相似文献   

6.
利用计算机进行字符自动识别与录入的技术对机器翻译、数据挖掘、人工智能等都有着重要的理论意义和实用价值,基于数字图像处理技术的字符识别是其中的一个重要发展方向。文章重点研究了字符特征提取和匹配识别这两个影响字符识别效果的因素,根据中文字符笔画的方向特点,选择了对图像方向特征敏感的Gabor变换作为特征提取方式,在获取字符的特征向量后,先利用最小距离分类器进行预分类,再利用最小距离分类中产生的候选样本集训练SVM分类器,识别时只需利用候选集分类器依次判决,降低了训练和识别工作量,同时提高了识别效率。实验表明,系统对网站导航字符平均识别率达94%以上,具有一定的理论意义和实用价值。  相似文献   

7.
周静 《科技信息》2010,(8):I0166-I0166,I0168
汉语新词语是新时期以来语言生活中的重要现象,新词语是对语言生活实态的观察和记录,也是对社会生活的记录。通过对2007年汉语新词语的研究,可以窥探出新时期下人们的各种心态,挖掘出深刻的文化内涵。  相似文献   

8.
藏语是藏民族通用的语言,是藏族人民最重要的交际工具.随着社会的发展、时代的变革,藏语中出现了大量表达新事物、新现象和新观念的新词语.文章根据新词语的特征和藏语构词法,对新词语的类型、构成方式、词长和词性等进行考查研究.  相似文献   

9.
无数研究表明,汉语新词语是指近年来产生能够反映新时期新事物新现象新观念的词语。它们的产生是对汉语语汇系统的不断丰富和发展。本文紧密结合近年来笔者自己身边发生的和自身感悟的语言现象,对新词语的界定阐述了自己的看法,同时在分析汉语新词语产生的主要途径以及新词语的相关特点的基础上,根据新词语反映出的不同的心理特征,创新性地表述了新词语的几种类型,并论述了规范使用新词语应当着重把握的注意事项。目的在于更加准确、合理、规范地使用好新词语。  相似文献   

10.
甘肃条码工作的发展康仲如(中国物品编码中心甘肃分中心730030)条码技术是20世纪在计算机应用实践中产生和发展起来的一种自动识别技术,它将光学、电学、机械学技术融为一体,以其准确、快速、经济、便于操作、自动输入、自动识别的巨大优点,被世界各国所接受...  相似文献   

11.
运用比较法,通过分类举例、对比分析,发现汉、日语合成词都包含重叠式、派生式和复合式三种构词法,且三种构词法皆有异同。从重叠式构词法来看,两者构成的词类都较为多样,但汉语构词方式多样,而日语较为单一;从派生式构词法来看,两者分类一致且都有不少后缀具有改变词根词性的功能,但日语的前缀和后缀较为多样,汉语有些前缀可以起到改变词根词性的作用,而日语没有;从复合式构词法来看,两者都以此构词方式为主,且都可根据词根语素之间的语法关系进行分类,但日语复合词的构成较为复杂,其词性一般由后一个词来决定,且有时会出现语音或语调的变化,而汉语则不然。  相似文献   

12.
从汉语造词法的相关理论为入手,结合网络词语的特点,通过对大语境范围内的网络词语进行全面分析,可以使我们对网络词语早期造词的初因有所了解,并可以解析其相关“密码”。  相似文献   

13.
樟树方言的词缀有"子"、"仔"、"叽"、"牯"、"婆"等近20个,其中"叽"是一个使用频率较高,能产性很强也最为特殊的跨类词缀.通过考察,"叽"可附于名词、动词、形容词和量词等词根后面,意义虚化,表示数量少、小称、动作随意等语法功能.  相似文献   

14.
一种噪声环境下的语音识别方法(线性预测误差法)的研究   总被引:4,自引:0,他引:4  
介绍一种平稳噪声环境下语音识别的新的方法。该方法利用噪声的LPC系数去预测语音信号,从而得到LPC预测序列,然后把它代替原语音序列来进行语音端点的检测、语音特征的提取和在合适的匹配方式下的识别。实验结果表明:该法在噪声环境下自动检测语音端点和提取语音信号的特征是可行的,获得了很满意的识别率。  相似文献   

15.
根据实际工作,开发了一个自动分词系统,对汉语自动分词技术在智能人机交互中的实现进行探讨.基于系统的情况,分词算法采用了最大匹配法,在词库检索中提出了化查询为直接存取的方法,提高了检索效率,节省了内存,有利于分词速度的提高.  相似文献   

16.
《西京杂记》作为书面文献材料,在文物的考古研究中发挥了不可替代的重要作用,不但为出土文物的身份提供宝贵的书面依据,还很大地体现了成书当时的科学技术和历史的可靠性程度,而同样在词汇研究领域里,《西京杂记》也占据了一席之地。本文根据前辈对中古时期,尤其是魏晋南北朝时期的复音词的研究加上复音词本身的界定和与同时期其他作品中的复音词进行对比,来分析《西京杂记》中的复音词特征,尤其是从构词角度和语义特征几个角度来仔细探讨《西京杂记》的复音词分布情况。  相似文献   

17.
从日语固有词汇、汉语词汇、外来语词汇等三大主流八个方面分析了日语构词方式,认为日本文字的形成主要是受到中华民族文化的影响,输入了汉字并加以利用,从而形成自己独特的假名汉字混合文字与构词方式并固定下来,其次是输入欧美各国文字即外来语。  相似文献   

18.
王淑华 《长春大学学报》2005,15(1):60-62,81
对关汉卿现存戏曲作品的复音词作了穷尽式的统计和分析,并在对这些复音词的构词方式作定性与定量分析的基础上,初步总结出复音词构词方式在元代的发展与变化的特点。  相似文献   

19.
当代汉语中,类词缀的大量产生和广泛参与构词,深刻地影响到汉语词汇系统。类词缀强化了汉语词汇的系统性,促成了各种外语对汉语词汇系统的渗透,加速了短语词汇化的步伐,使词汇系统的新词呈现出词缀化倾向,使词汇系统的音节词构成发生了变化。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号