首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 165 毫秒
1.
突发数据量直接影响网络传输的性能,而汉字文本的传送有春固有特性,本文分析了汉字文本的存储结构特征,并改进了LZW算法进行压缩,这样即提高了压缩比,同时也改善了网络传输性能。  相似文献   

2.
基于汉字字频向量的中文文本自动分类系统   总被引:1,自引:0,他引:1  
提出了一种根据汉字统计特性和基于实例映射的中文文本自动分类方法。该方法采用汉字字频向量作为文本的表示方法。它的显著特点是引入线性最小二乘方估计(LinearLeastSquareFil,LLSF)技术建立文本分类器模型,通过对训练集语料的手工分类标引以及对文本和类别间的相关性判定的学习,实现了基于全局最小错误率的汉字———类别两个向量空间的映射函数,并用该函数对测试文本进行分类  相似文献   

3.
设计了一个所见即所得的,以MathML标识语言作为存储格式的在线公式录入系统,有利于数理公式以文本的形式在网络上传输,解决了远程教育及相关领域的一个技术瓶颈.  相似文献   

4.
余根坚  郑宝玉 《自然科学进展》2006,16(10):1351-1355
从信息论角度研究论证了CDMA无线移动Ad Hoc网络的簇间传输性能的上下界,得出网络的任一对簇间传输性能的下界是该对簇间在文中所定义的信息率的结论;若无线信道为广义对称衰落信道,则得出了CDMA无线Ad Hoc网络的簇间传输性能的上界不超过Θ(n5/2)的结论.  相似文献   

5.
王英龙  王建 《山东科学》1998,11(2):62-64
网络线路的连通性与网络布线电气性能有本质区别。电气性能是影响网络传输性的关键因素,它的测试包括接线图、长度、近端串扰、衰减等几个参数,分析影响网络传输性的参数因素,对网络系统集成商和最终用户判断网络线路故障具有指导作用。  相似文献   

6.
气象中心VPN备份网络设计   总被引:1,自引:0,他引:1  
完成了气象中心基于OpenVpn的VPN备份网络的实现,结果表明VPN网络速度能够满足一般的气象文本信息的传输,达到基本业务需求。  相似文献   

7.
基于协作分集技术的无线传感器网络传输性能   总被引:2,自引:0,他引:2  
对基于协作分集技术的传感器网络传输性能问题进行了深入研究,建立了多信源、多信宿和多中继的传感器网络协作分集模型,推导出了在该模型下传感器网络的传输性能具体表达式,据此可以定量地计算在协作分集下多信源、多信宿和多中继的传感器网络的传输性能指标,为进一步讨论协作选择策略等技术方案在实际的无线传感器网络环境中的应用提供理论上的判断依据.另一方面,本文也从理论上证明了协作分集技术可以提高传感器网络的传输性能.最后利用仿真参数,给出了主要的几个仿真结果,其反应出来的协作通信下的无线传感器网络传输性能变化特点与本文的结论相吻合.  相似文献   

8.
该文分析了在金山汉字编辑系统中文本文书文件密码处理方法,对密本身加密和文本加密方法进行了剖析,并提出了如何取得未知密码的方法和提供文本文书文还原的程序。  相似文献   

9.
针对现有文本多标签语义信息挖掘方法仅注重从文本到标签的映射方向,而忽略了从标签到文本的映射方向的问题,本文认为从标签到文本的映射方向可以过滤文本中与标签无关的噪声信息,进而生成只关注于标签信息的文本表示。基于此假设,本文基于注意力机制提出了一种深度模块化标签注意网络,主要由标签注意网络进行多层级联而成。在标签注意网络中构建了双向标签注意单元和自我注意单元,从而得到标签和文本的双向依赖表示。模型在公开数据集RCV1、AAPD、EUR-Lex上与SGM、LSAN、EXAM等算法进行比较,对于现有的最佳性能平均提升0.54%。  相似文献   

10.
基于PDF文本的信息隐藏技术   总被引:1,自引:1,他引:0  
针对网络环境中信息安全传输问题,给出了一种文本信息隐藏模型。通过分析PDF文档结构,提出了几种实用的文本信息隐藏算法。实验结果证明,算法具有一定的鲁棒性和隐蔽性。  相似文献   

11.
几种常用文本分类算法性能比较与分析   总被引:9,自引:0,他引:9  
分析了几种典型的文本分类算法的特点,并基于中文文本数据集和英文文本数据集对算法性能进行了综合评价.实验结果表明:对于英文文本数据,支持向量机具有最优的性能,但时间开销最大,贝叶斯算法速度较快;对于中文文本数据,由于分词的困难,使得算法性能普遍低于同等规模下在英文数据集上的性能.几种算法性能均随训练集规模的增大而有改善.  相似文献   

12.
We explore the techniques of utilizingN-gram information to categorize Chinese text documents hierarchically so that the classifier can shake off the burden of large dictionaries and complex segmentation processing, and subsequently be domain and time independent. A hierarchical Chinese text classifier is implemented. Experimental results show that hierarchically classifying Chinese text documents basedN-grams can achieve satisfactory performance and outperforms the other traditional Chinese text classifiers.  相似文献   

13.
文本分类中特征选择、权重计算及分类算法三个阶段中都存在一些经典方法,在实际的中文文本分类任务中,如何从各阶段不同方法的组合中找到一个好的组合成为值得研究的问题。比较研究中文文本分类中各阶段经典方法的不同组合对分类效果的影响结果表明:采用CHI特征选择方法、TFIDF权重计算方法及SVM分类方法的组合为最佳组合。  相似文献   

14.
Generally, text proofreading consists of two procedures, finding the wrongly used words and then presenting the correct forms. At present, most of the Chinese text proofreading focuses on finding the wrongly used words, but pays less attention to correcting these errors. In this paper, the Chinese text features are interpreted first and then a Chinese text proofreading method and its algorithm are introduced. In this algorithm, text features, including text statistical feature and language structure feature, are properly used. Here, correcting errors goes on at the same time with finding errors. Experimental results show that this method has a performance of detecting 75% of wrongly used Chinese words and correcting about 60% of them with the first candidates.  相似文献   

15.
Generally, text proofreading consists of two procedures, finding the wrongly used words and then presenting the correct forms. At present, most of the Chinese text proofreading focuses on finding the wrongly used words, but pays less attention to correcting these errors. In this paper, the Chinese text features are interpreted first and then a Chinese text proofreading method and its algorithm are introduced. In this algorithm, text features, including text statistical feature and language structure feature, are properly used. Here, correcting errors goes on at the same time with finding errors. Experimental results show that this method has a performance of detecting 75% of wrongly used Chinese words and correcting about 60% of them with the first candidates.  相似文献   

16.
 基于拇指操作的键盘输入在当前以及未来都将作为一种不可替代的文本输入模式应用在手机上,因此,手机键盘文本输入效率的高低成为了衡量手机可用性水平的重要标志之一。从手机键盘文本输入法的改进研究、中文文本输入法的研究、模型预测与评价等多个角度归纳了国内外有关手机键盘文本输入法的研究动态,在此基础上,指出了目前研究存在以下不足:基于西方文字设计的手机键盘不适合中文输入;新的中文输入法在应用上存在诸多不足;大多数手机的键盘改进没有考虑用户的操作特点。并提出了今后的研究发展方向:根据用户操作特征以及中文输入特点来优化现有中文手机键盘的设计,对提高中文文本输入绩效,具有很高的应用价值和较强的可操作性。  相似文献   

17.
一种新的文本预处理方法研究   总被引:2,自引:0,他引:2  
文本预处理是整个字符识别系统的重要组成部分.它的性能的优劣,对整个字符识别系统的识别率和识别速度至关重要.由于汉字印刷文稿版面的复杂性,其文本预处理远比西文困难.本文提出了一种新的文本预处理方法.实现了含有文字字符,图形,图片和表格的、版面结构复杂的数字图象的分割.整个算法分为两个阶段完成:首先,从图形的连通原则出发,定义了扩展连通域的概念,对整个文本图象逐行扫描,搜索出所有的扩展连通域,进而通过集合的交、并操作,将属于一个字符或图象、图片和表格的若干个扩展连通域合并.这时扩展连通域已标记文本图象中的字符尺寸大小和位置.然后,基于同一行字符的间距的知识,将扩展连通域合并为逻辑字符行(横,竖);由字符行的高(宽)度的一致性及间距的知识,将逻辑字符行合并为逻辑块:按照印刷文稿的排版规律完成版面的结构识别、并将标记字符位置和大小的扩展连通域的顺序按版面结构信息重新组合,最后把字符规范为一定尺寸的点阵图象输出到字符识别器.本文提出的文本预处理方法已经实现.经实际运行测试表明,系统对于复杂版面的文件,书刊和报纸的文本图象的分割,具有较好的效果.  相似文献   

18.
基于LSTM的中文文本分类方法能够正确地识别文本所属类别,但是其主要关注于学习与主题相关的文本片段,往往缺乏利用词语其他方面的信息,特别是词性之间的隐含的特征信息。为了有效地利用词语的词性信息以便学习大量的上下文依赖特征信息并提升文本分类效果,提出了一种结合词性信息的中文文本分类方法,其能够方便地从词语及其词性中学习隐式特征信息。利用开源数据并设计一系列对比实验用于验证方法的有效性。实验结果表明,结合词性信息的基于注意力机制的双向LSTM模型,在中文文本分类方面的分类效果优于常见的一些算法。因此识别文本的类别不仅与词语语义信息高度相关,而且与词语的词性信息有很大关系。  相似文献   

19.
对如何利用Microsoft Speech SDK 5.1实现中英文混合文本朗读进行了研究,解决了中英文朗读时不能真正朗读英文的问题,提出了一种根据文本类型和系统消息实时切换中英文引擎的方法,实现了中英文朗读时引擎的自动平滑切换.朗读效果良好,对于实现人机之间人性化交流具有积极的意义。  相似文献   

20.
提出了一种基于机器学习的Web文本自动分类的信息检索解决方案。采用层次约束法完成文本自动抓取功能,文本频度与词条频度相结合的文本特征选择算法实现特征提取,并采用特征加权技术进一步提高文本分类性能。该算法不仅实现中文文本的自动分类,有效地提高Web信息检索的精度,而且能大大降低人工二次浏览筛选的工作量,还可用于电子政务和电子商务信息的自动分类。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号