首页 | 本学科首页   官方微博 | 高级检索  
     检索      

汉语识别初探
引用本文:李介谷.汉语识别初探[J].上海交通大学学报,1979(2).
作者姓名:李介谷
作者单位:上海交通大学电工和计算机科学系
摘    要:语言是人类交流信息的主要媒介,如果能用数字计算机来识别语言,必然能对人类交流信息的过程带来无可估量的影响。正因为如此,语言识别问题在近二十年来受到了很大的注意,同时由于这一问题牵涉面很广,边缘性很强,因此它又成为计算机科学中使人颇感兴趣的问题之一。Wolf曾对七十年代初期以前有关这一问题的研究作了一个较好的总结(主要指美国对英语识别所进行的研究)。语音的识别看来基本上所采用的是对于音素或类似于音素的识别,这是因为尽管人可以发出频带相当宽的声音,但作为语音来说,大致上是由几十个基本发音单元,即音素所构成的。这样,我们依靠内存于计算机中的数量不多的音素模型就可能进行语言的识别。英语的音素大致有四十多个。汉语(普通话)计算机识别用的音素可以建立在汉语拼音的基础上。如果仅从元音、辅音来说,则也不过三十多个。汉语拼音把发音单元分为声母和韵母,声母即辅音,韵母则包括单元音和复合元音。关于音素识别方面的一些辅助识别工作,诸如音节、清音、浊音、元音的区分等都与英语识别问题相类似,汉语语音识别方面的一个特殊问题是关于声调的识别。汉语以及许多亚洲语系都有声调识别的问题。汉语(普通话)分成阴平(—)、阳平(/)、上(V)、去(\)四声。如果每一个韵母加上四声的变化,则音素模型的数字将大为增多,这将增加识别检索时的困难。问题的复杂性还不止于此,如地(di)、期(qi)这类字,四声的变化只在于韵母本身,因此不影响其他相关连的音素d、q。如烟(yan)、望(wang)、两(liang) 这类带复合元音的字,四声的变化贯串于整个音节,这就是说四声的变化将影响这一音节中的其他音素,这样一来问题的复杂性就提高了。据说有些方言,如广东话,有多至十种声调的,如果把不纯正的发

本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号