首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 218 毫秒
1.
随着信息化的普及,作为新疆地区主要少数民族文字之一的维吾尔文,在计算机信息处理,标准化等方面,尤其是维吾尔文WEB建设方面有了迅速的发展,而其发展和管理、应用的特殊性,又使得信息复杂多样并且难以控制,因此研究多语种网络信息的安全和正确的舆情疏导机制成为一个重要的课题,本文主要阐述了维吾尔文网络舆情分析目前国内外的研究状况和要解决的几个关键技术问题。  相似文献   

2.
基于深度学习的神经网络在中英文的图像文字识别中有着广泛的应用,而在维吾尔文识别的相关研究中应用有限.针对维吾尔文属于粘连性文字难于识别的问题,建立了维吾尔文图像识别的数据集,提出了TRBGA模型,并与主流的网络做了对比实验.实验表明:所提出的识别方法准确率达到了99.395%,优于传统的识别方法.  相似文献   

3.
文字识别是图像处理和模式识别的主要研究方向之一。文章提出了一种复杂背景图像中维吾尔字符切分与识别方法,该方法根据维吾尔文字母结构特点,对维吾尔文词语的切分进行了认真地分析,通过对维吾尔文字符边缘特征和笔画分布规律等特点进行研究,提出了比较有效的切分方法,并结合维吾尔文的特有规则,利用维吾尔文周边结构模式识别方法提取结构特征,最后通过计算 Minkowski距离找出最近的类别,输出识别结果。  相似文献   

4.
随着信息技术的迅速发展和计算机软件技术的不断成熟,维吾尔文信息处理也取得了很大的进步.字符切分是字符识别的基础,文章在分析维吾尔文字母的结构特点的基础上,对维吾尔文单词的切分进行了一些研究,根据对字符的高度,宽度,相邻字符块的间距,笔画分布规律等特征进行分析,提出了一种切分方法.  相似文献   

5.
文章研究的是在维吾尔文字语料库建立过程中,从MS-DOS系统上排版的书刊,杂志中获得维吾尔语单词,并转换到WINDOWS环境上RTF格式的一种快速解决方法,然后提出维吾尔文字Unicode代码对应的RTF代码表和动态生成维吾尔文RTF文件的简单方法。实践证明这种方法有助于提高语料库构造中的大单词收集的效率和质量。  相似文献   

6.
文本水印技术可以有效地保护数字作品的版权,防止盗版、侵权等行为。针对维吾尔文数字作品版权保护问题,通过分析维吾尔文左向连写、书写落于基线等特征,根据现有文档结构水印算法,提出基于行移结构的维吾尔文文本水印算法。通过行移结构编码嵌入水印信息,依据移动行相对于维吾尔文基线位置的变化,进行水印信息的提取。从水印嵌入和提取的仿真试验结果可知,该算法水印容量小、不可感知性高,具有较强的鲁棒性。  相似文献   

7.
通过研究对比不同网络爬虫策略的优缺点,提出了基于微博信息的关键词库爬虫策略,利用微博的特性以及数据挖掘算法的优势,生成关键词库指导爬虫模型进行微博信息的获取,解决了主题爬虫模型在数据获取时存在的时序性、正确性以及高效性的问题,提高了微博事件信息的覆盖率和准确率,最后通过设计实验系统Keys Crawler,验证了本文提出的策略的优越性.  相似文献   

8.
主题爬虫搜索策略的研究   总被引:1,自引:0,他引:1  
由于信息多元化的发展,通用的搜索引擎无法满足专业化用户的需求,分类细致、精确、更新及时的面向特定主题的垂直搜索引擎便应运而生了。主题网络爬虫是垂直搜索引擎获取数据的自动化程序。以何种策略有效地访问网络资源是主题爬虫研究的主要问题。本文重点对主题爬虫的搜索策略进行研究,并对各种搜索策略进行了比较。  相似文献   

9.
将离散隐马尔科夫模型用于脱机手写维吾尔文字母建模.采用分区编码规则,对归一化后的字母图像的笔画游程中心进行分区编码.对分区规则和数量进行了研究,同时对扫描编码进行融合和空游程定义,限制码本容量,从而形成观察序列,并用构建起的离散隐马尔科夫模型进行维吾尔文字母识别.实验结果表明:对维吾尔文字母,对比其他各类算法,该算法对手写脱机字体的变形忍耐性高,平均首选识别率为88.1%.  相似文献   

10.
黄昊晶 《科技资讯》2011,(21):13-14
爬虫作为网页搜索下载程序,其网络爬行性能决定了搜索引擎的性能和数据质量。本文通过分析聚焦爬虫的特点和网络环境,总结出三类制约爬行性能的主要问题,分别是DNS查询及缓存设置、内外部分布式爬行特点和网页URL静态与动态分配策略。结论为聚焦爬虫使用URL静态分配策略结合异步DNS查询及缓存设置,在内部分布式爬行时可有效提高网络爬行性能。  相似文献   

11.
本文重点讨论智能手机上安卓(Android)系统程序开发环境的搭建以及基于TTS(Text.To.Seech)语音资源文件的维吾尔语手机语音合成技术的实现过程和方法,并给出带编辑器的维吾尔语手机语音合成演示系统的实验测试结果。  相似文献   

12.
维吾尔语的几种特殊空位   总被引:1,自引:0,他引:1  
《中央民族学院学报》2006,33(3):112-116
维吾尔语中有几种与名词的形态变化有关的特殊空位,即语言的经济性原则引起的语义空位、中心名词移位引起的句法空位和靠上下文解释的语用空位等,它们与名词构形成分的不规则重叠、其他词类带名词的构形成分等现象有着潜在的关系。  相似文献   

13.
针对维吾尔语中构形词缀种类多、构形复杂以及发生音变现象等问题, 提出一种基于字符级的维吾尔语形态协同分析方法。该方法最大的特点是同时进行维吾尔语的形态切分、形态标注以及音变还原, 将词素边界、形态标记以及音变信息用一个复合标记描述, 采用字符序列的标注方法进行训练。实验结果显示, 形态切分、形态标注及音变还原的正确率分别达到96.39%, 92.78%和99.79%, 系统总体正确率达92.59%。  相似文献   

14.
维语语料库是汉维机器翻译系统的核心基础,同时也是对维语中的词语进行统计的一个完整和完善的基础模型。在此我们要介绍管道与过滤器模式在维语语料库的构造和维语词频统计系统中的应用。第一步介绍管道和过滤器概念,其次说明建立维语语料库过程和选择语料库原则,最后陈述维语词频统计结果和进行分析。  相似文献   

15.
基于标准语音的识别系统在识别带有发音变异的口语语料时,识别率较低。针对这一问题,提出了一种在标准维吾尔语发音字典的基础上生成多发音字典的方法。采用基于专家经验和数据驱动相结合的方法分析了维吾尔语方言口音发音变异规则,构造发音变异集合,生成初始的多发音字典,并运用了自动数据处理算法和门限阈值法,使得能够从方言口音训练语音数据中自动获得精简的多发音字典。实验结果表明:该方法对维吾尔语方言口音的识别性能有提升作用。  相似文献   

16.
谚语作为一种极具民族特色的语言形式,既是词汇学又是语法学的研究对象。维汉谚语在语法形式上既有相似之处,又有明显的差异。通过对单句式、紧缩句式和复句式维吾尔谚语和汉语谚语的统计对比分析,发现维汉谚语形式特点的共通之处在于句式自足完整,形式简洁自然,兼得书面语和口语之风;不同之处在于维吾尔谚语基本遵循SOV语序,汉语则遵循SVO语序。  相似文献   

17.
准确挖掘网页中的信息对检索系统非常重要.提出了一种基于模板的网页信息抽取方法进行网页信息抽取.该方法采用网页抓取与数据模板技术实现了网页信息的自动发现与抽取.在Yahoo网站上的实验结果表明,该方法具有较好的检索效果.  相似文献   

18.
比喻是人类最重要的话语形式之一。一切物理世界的似同和差异都经过民族文化的过滤和加工。维吾尔文学作品中的比喻也是如此。作家对喻体的选择植根于本民族文化的土壤之中,因民族不同,造成喻体选择也有所不同。本文从文化的角度,考察维吾尔文学作品中作家对喻体选择的社会文化成因以及不同喻体所体现的独特的维吾尔文化内涵。这对我们进一步了解比喻的特点,探讨不同文化对比喻构成的影响具有十分重要的意义。  相似文献   

19.
随着Internet和Intranet的飞速发展和普遍应用,静态网页已远远不能满足人们实际需求,客户更多地希望看到根据各自要求而生成的网页并能方便地实现访问和查询。目前,采用运行在WEB服务器端的CGI、ISAPI和NSAPI应用程序还是一种主要的动态生成网页的方式。就这个问题深入地探讨客户端浏览器与服务器间网络信息交互过程,并给出相应程序的部分源码。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号