首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 125 毫秒
1.
介绍了规范彝文字词频度统计的设计及应用程序.首先阐述了研究开发该软件的必要性和重要意义:然后介绍了用于统计的彝语语料库;讨论了统计的算法;最后根据国际彝文编码的基本原则,词汇的频度、频率、累计频率以及通用度原理结合规范彝文的特点设计字词频统计系统.  相似文献   

2.
以Alan E.Branch著的Export Practice and Management教材为例,将该教材正文内容全部转换为电子文本形式,使用语料库语言学统计软件AntConc对该教材词汇用法进行研究。首先,统计教材的类符/形符比;然后,使用词形还原功能统计高频500实词,并与柯林斯常用词表进行对比分析词汇难度,与美国当代英语语料库中的学术、小说的高频500实词进行对比,考察语域造成的词频差异;最后,对教材中单词用法进行归纳总结。  相似文献   

3.
用《标准频率指数》统计词频是一种先进的科学的词频统计方法,本文探讨了此种方法在新闻语料词频统计中的应用,这在汉语词频统计中尚属首次。  相似文献   

4.
设计一个文本过滤实验 ,首先从语料库的词频统计结果中挖掘出词频的二元关联度 ,然后用一个Hop field网络将词频的二元关联关系转化为语境关联关系 ,训练语言单位在整个上下文环境下的权重 ,并建立用户模板 .该算法改善了词频特征提取算法与文本上下文环境的匹配状况 ,实验结果表明 ,对专业性Web文档的过滤可达到更高的精确度  相似文献   

5.
权晓辉  吴江 《甘肃科技》2013,29(7):72-75
词汇教学作为高中英语教学的一个重要组成部分,与计算机辅助下的数据驱动学习一起依托于正在蓬勃发展的英语语料库,从词频统计研究、词语搭配研究、词汇句法层面知识信息的提供以及词汇运用语境、纠正用词失误等5个方面发挥着语料库在高中英语词汇教学领域中的重要作用,旨在改进词汇教学方法,提高英语词汇教学的质量。  相似文献   

6.
该文结合笔者实际工作经验,对管道卧室过滤器设备在长距离输送管道中的应用进行分析,并提出卧室过滤器拉杆的故障,有针对性地提出改造措施.  相似文献   

7.
高建广  张宁 《甘肃科技》2020,(6):15-16+25
管道过滤器作为一种特殊管道件,其对于设备的保护及工艺的稳定都起着不可忽视的作用,因此有必要对于管道过滤器的设计进行全面地分析和探讨。本文以现行的设计标准为基础,结合实际工程经验,对管道过滤器设计中的选型,滤网目数、滤网强度、设备维护等方面进行了分析,并提出了相应的建议,希望对工程设计人员有一定地借鉴作用。  相似文献   

8.
在英语词汇学习中,近义词辨析既是重点也是难点。学习者借助词典进行辨析依然感到困难重重。语料库因其语料丰富、搜索功能强大等特点能够很好地取代词典,学习者可以利用语料库进行数据驱动式的近义词辨析。文章基于COCA语料库,从词频、语域分布、搭配、类联接、语义韵切入,辨析了近义动词abolish、cancel和repeal,探索了基于语料库的近义词辨析新路径。  相似文献   

9.
分析美国当代英语语料库(COCA)中同义动词achieve,gain,obtNn和acquire及其相关搭配词语的词频信息,探讨本组同义动词与其他词语搭配时在语义和用法方面的差别。以及基于语料库进行同义词研究的可行性方法。  相似文献   

10.
从国家语委现代汉语平衡语料库提取语料,统计分析"有点"和"稍微"的左右搭配词语词性、语义韵倾向。从台湾中央研究院现代汉语标记语料库提取语料,统计分析二者附加搭配词的语义类别、在不同语体中的词频分布差异。采用定量分析与定性分析相结合的方法,以期为现代汉语近义词辨析提供新思路。  相似文献   

11.
文字识别是图像处理和模式识别的主要研究方向之一。文章提出了一种复杂背景图像中维吾尔字符切分与识别方法,该方法根据维吾尔文字母结构特点,对维吾尔文词语的切分进行了认真地分析,通过对维吾尔文字符边缘特征和笔画分布规律等特点进行研究,提出了比较有效的切分方法,并结合维吾尔文的特有规则,利用维吾尔文周边结构模式识别方法提取结构特征,最后通过计算 Minkowski距离找出最近的类别,输出识别结果。  相似文献   

12.
随着网络资源的不断丰富,人们获取信息的途径已被网络代替。维吾尔文,在语言信息处理,WEB应用等领域有了迅速的发展。文章针对网络爬虫的工作原理以及聚焦爬虫策略进行阐述,在此基础上结合维吾尔语信息提取的相关研究,研究了维吾尔文的网络爬虫技术的结构和策略,从而为维吾尔文搜索引擎的网页数据库建设和维吾尔文网络舆情分析研究提供海量的语料。  相似文献   

13.
谚语作为一种极具民族特色的语言形式,既是词汇学又是语法学的研究对象。维汉谚语在语法形式上既有相似之处,又有明显的差异。通过对单句式、紧缩句式和复句式维吾尔谚语和汉语谚语的统计对比分析,发现维汉谚语形式特点的共通之处在于句式自足完整,形式简洁自然,兼得书面语和口语之风;不同之处在于维吾尔谚语基本遵循SOV语序,汉语则遵循SVO语序。  相似文献   

14.
针对维吾尔语中构形词缀种类多、构形复杂以及发生音变现象等问题, 提出一种基于字符级的维吾尔语形态协同分析方法。该方法最大的特点是同时进行维吾尔语的形态切分、形态标注以及音变还原, 将词素边界、形态标记以及音变信息用一个复合标记描述, 采用字符序列的标注方法进行训练。实验结果显示, 形态切分、形态标注及音变还原的正确率分别达到96.39%, 92.78%和99.79%, 系统总体正确率达92.59%。  相似文献   

15.
本文重点讨论智能手机上安卓(Android)系统程序开发环境的搭建以及基于TTS(Text.To.Seech)语音资源文件的维吾尔语手机语音合成技术的实现过程和方法,并给出带编辑器的维吾尔语手机语音合成演示系统的实验测试结果。  相似文献   

16.
维吾尔医药发展现状及存在问题分析   总被引:1,自引:0,他引:1  
本文综述了维吾尔医药的发展现状,对维吾尔医药发展中存在的问题进行了分析,并提出了维吾尔医药进一步发展的基本思路和对策.  相似文献   

17.
Based on the analysis of the unique shapes and writing styles of Uyghur characters,we design a framework for prototype character recognition system and carry out a systematic theoretical and experimental research on its modules.In the preprocessing procedure,we use the linear and nonlinear normalization based on dot density method.Both structural and statistical features are extracted due to the fact that there are some very similar characters in Uyghur literature.In clustering analysis,we adopt the dynamic clustering algorithm based on the minimum spanning tree(MST),and use the k-nearest neighbor matching classification as classifier.The testing results of prototype system show that the recognition rates for characters of the four different types(independent,suffix,intermediate,and initial type) are 74.67%,70.42%,63.33%,and 72.02%,respectively;the recognition rates for the case of five candidates for those characters are 94.34%,94.19%,93.15%,and 95.86%,respectively.The ideas and methods used in this paper have some commonality and usefulness for the recognition of other characters that belong to Altaic languages family.  相似文献   

18.
针对印刷体维文在连体段切分部分存在过切分和漏切分的现象,结合水平投影法和连通域搜索法实现维文文本的行切分和单词切分;同时针对连体段切分正确率不高的问题,提出一种新的切分方法。首先对字母连体段位于基线上方的部分进行竖直投影来寻找所有可能的切点,然后利用阈值判定法去除误切分。实验证明,该方法提高了印刷体维文的切分正确率,为提高维文识别的正确率打下基础。  相似文献   

19.
维语口语发音中很多音素相对标准语产生了发音变异,基于标准语音的识别系统在识别带有发音变异的口语语料时识别率较低。该文针对维吾尔语同化、弱化、脱落、元音和谐等语流音变难点进行分析,对语音、韵律特性进行知识融合与技术创新,运用基于数据驱动和基于专家经验相结合的方法对维吾尔语方言口语中存在的发音变异现象进行研究,统计元音、辅音多发音变化映射对,建立音素混淆矩阵,为维吾尔语方言口语语音识别研究奠定基础。  相似文献   

20.
文章研究的是在维吾尔文字语料库建立过程中,从MS-DOS系统上排版的书刊,杂志中获得维吾尔语单词,并转换到WINDOWS环境上RTF格式的一种快速解决方法,然后提出维吾尔文字Unicode代码对应的RTF代码表和动态生成维吾尔文RTF文件的简单方法。实践证明这种方法有助于提高语料库构造中的大单词收集的效率和质量。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号