首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 375 毫秒
1.
网络舆情监控系统的实现方法   总被引:1,自引:0,他引:1  
结合信息通信技术,使用中文信息处理和文本挖掘中的关键技术对舆情监控设计流程进行分析.通过相关功能模块建立网络舆情监控系统,实现网页信息采集和Web挖掘基础上的热点发现与跟踪.  相似文献   

2.
COBOL 数据管理系统是在 Cromemco 微型机上建立的一个实际的应用系统.我们针对应用微型机进行小规模的中文信息处理和情报检索以及用 COBOL 语言设计通用程序等问题进行了研究和探讨,进而设计出一个具有数据库的一些特点和较强的检索功能的通用数据管理系统.这个系统具有以下一些特点:  相似文献   

3.
一、引言 0520微型机系统是一个已在我国广泛使用的中文信息处理系统,它与IBM-PC微机系统相兼容。它的汉字功能是依靠CC-DOS操作系统实现的。这个操作系统由电子工业部第六研究所开发成功,它采用软方案来实现汉字功能。也就是说,不需要对原系统的硬设备进行改动,只要对原系统的软件进行一些修改和扩充。从某种程度上可以讲,CC-DOS是0520系统的核心。CC—DOS是以IBM—PC系统的主操作系统PC-  相似文献   

4.
基于优化最大匹配与统计结合的汉语分词方法   总被引:1,自引:0,他引:1  
汉语自动分词足中文信息处理的前提,如何提高分词效率是中文信息处理技术面临的一个主要问题.基于训典和基于统计的分词方法是现有分词技术的主要方法,但是前者无法处理歧义字段,后者需要大量的词频汁算耗费时间.本文提出优化最大匹配与统汁结合的分词方法,首先提出优化最大匹配算法,在此基础上提出了规则判断与信息量统计两种消歧策略.然后,给出了优化最大匹配与统计结合的分词算法,提高了分词的效率.最后,基十分词算法实现中义分词系统,并通过实验对算法进行了分析和验证.  相似文献   

5.
精品课程是高校课程中的精华,它是高等学校教学质量与教学改革工程的重要组成部分.介绍了利用ASP.NET2.0、数据库等技术开发精品课程管理系统的途径与方法.结合平顶山学院的实践,从设计思想、设计目标、实现过程以及系统的特点方面进行论述.  相似文献   

6.
自动分词是中文信息处理的基础,而未登录词识别是影响分词系统准确率的最主要的因素.字母词语作为中文信息处理中的一类未登录词语,现有的分词软件仍不能有效识别.为此设计了一个规则 统计的自动标注算法,该算法首先对原文本进行扫描,依据字母串正则表达式取得合法的字母串;再以字母串为锚点,往两边扫描,依次调用前后界规则、汉字组成成分规则、例外校正规则,结合搭配概率矩阵对字母词语进行识别和标注.实验结果表明:该算法的召回率为100%,准确率约为92%.该算法不仅对中文自动分词有益,而且所开发的软件可用于建设字母词语知识库和对字母词语语言现象的考察研究.  相似文献   

7.
中文分词是中文信息处理领域的重要技术,现已成为中文信息处理研究中最成熟的领域.融合多策略的中文分词算法模型在字典匹配的基础上引入了标注统计和规则理解的优化策略,将已有的句法、语义研究应用到分词排歧与未登录词识别领域.通过实验对比,初步证实分词效果较好,达到模型分词的准确率和自适应性的提升.  相似文献   

8.
网络爬虫在中文信息处理中被大量使用,根据待处理的问题定向爬取相关领域的数据,为后续中文信息处理提供基础.传统多线程模型在处理高并发和大量I/O阻塞操作时,存在较为明显的限制和不足.针对以上问题,提出了一种基于coroutine模型的解决方案.从coroutine的基本原理和实现方法上作了较为详细的阐述,并给出基于coroutine网络爬虫的完整实现.实验表明,该方案能够有效地降低系统负荷,提高爬虫的爬取效率.  相似文献   

9.
目的结合中文信息处理技术,设计一个网络舆情监控系统;针对网络舆情挖掘研究中存在的问题,提出了一种K-means改进算法,实现Web挖掘基础上的文本聚类与主题发现。方法构建一个基于聚类分析的网络舆情监控系统,并详细介绍系统各个模块用到的关键技术;提出了一种K-means改进算法,对K-means算法中的关键环节(聚类初始值的选择和孤立点的剔除)进行了改进。结果设计的系统能通过对网页、论坛、博客、新闻评论等网络资源的精确采集,并结合网页净化、中文分词、向量模型建立、特征选择、降维处理,文本聚类等中文信息处理技术,实现对网络舆情的监测;改进算法的总体思路是要求用户输入簇的初始个数k和最大值kmax,由改进算法在计算过程中自动计算出聚类的结果数k。结论设计了一个基于聚类分析的网络舆情监控系统;提出了一种K-means改进算法。具体算法实施及将这些关键技术整合实现成一套自动化的网络舆情信息采集、分析、监测与预警系统,是网络舆情挖掘研究工作的下一步重点。  相似文献   

10.
中文自动分词一直是中文信息处理、Web文档挖掘等处理文档类研究的基础技术之一,传统的中文分词技术研究,主要集中在算法的改进研究上,对实验的平台,有关软件的实现涉及很少.本文通过探讨中文自动分词的重要性和不可或缺性,给出了基于VC /MFC自动分词软件的开发技术,最后对软件实现的四种基于词典的机械匹配的算法进行了实验分析,实验证明该系统能够高效的给中文信息处理提供一个平台.  相似文献   

11.
对彝文计算机操作系统的研制技术从彝文的编码输入、彝文的显示、彝文的打印输出等进行了系统的阐述.彝文信息处理的特点和要求是:①具备英文计算机系统原有的全部功能.②要在计算机系统中能保留汉字信息处理的全部功能.⑦要在计算机系统中能够输入和输出彝文信息.④要解决信息量较大的彝文字形在系统内的存储问题.⑤在系统技术上,要解决彝文与汉字、英文信息的兼容问题.要求系统同时能处理英文、汉字和彝文混合的信息流.⑥彝文信息处理系统的技术必须走和国际标准兼容的道路,已便彝文信息处理能共享世界上丰富多彩的计算机硬件和软件资源.  相似文献   

12.
在我国,基于嵌入式系统的智能仪器中,中文人机交互界面是必不可少的功能,某些系统还要求中文文本的输入。给出了通用计算机键盘在智能仪表中的接口,同时也给出了以ST7920为控制器的带汉字字库的液晶显示模块的接口方法及原理。采用该方法可大大提高智能仪表的汉字输入与显示功能,为智能仪表提供了一种汉字输入与显示解决方案。  相似文献   

13.
七笔形声输入法是一种形码与音码相结合的汉字输入法。它确立横,竖,撇,点,折,钩,方7种笔形,从它们的组合笔形中筛选出26种作为码元,再挑选26个与形码元有联系的代表字,将各形码元和代表字分别配于26年拉丁字母作为代码,按所给编码规则,每个字至多3个形码和1个音码,该输入法限制性因素少,适应范围广,成本低,重码率低,击键次数少,应用广,用户可在通用机上操作。  相似文献   

14.
VAX-8350配有汉字终端VT82,应用时,若文件需用俄文字母,或需输入编码让机器自动转换成汉字等问题,就得了解汉字内码的分布。本文通过分析内码系统。给出了内码与传送码间的转换公式和两种打印内码汉字表的程序。解决了上述问题。  相似文献   

15.
介绍了在VAX-11/780计算机上建立油藏描述计算机管理系统的总体设计思想及实现方法。该系统采用集中和松散两种管理方法,使建立后的VAX-11/780[1]油藏描述系统可独立自成体系,又可方便地通过系统的通讯接口软件与PDP-11和PE计算机及微VAX等物探、测井专用微型计算机系统实现相互的数据通讯。此外,系统还为物探、测井等专用子系统提供了一套专用的基础软件包,从而为各专用子系统的软件开发创造了一个良好的环境。为便于使用,监控模块是在汉字系统支持下编写的。该系统是油藏描述技术的一个组成部分。  相似文献   

16.
嵌入式系统VxWorks下应用软件中文输入的实现   总被引:3,自引:0,他引:3  
汉字输入是中文应用软件进行人机交互的重要组成部分。在嵌入式系统Vxworks下只提供了西文信息的输入输出功能,不支持中文信息处理功能。详细介绍了汉字输入的基本原理和开发技术,并在嵌入式系统Vxworks下实现了应用软件的中文输入功能,为嵌入式系统Vxworks下中文应用软件的开发提供了一个很有价值的实用工具。  相似文献   

17.
针对在P300的脑-机接口(BCI)汉字输入系统中输入速度较慢的问题,开发了一套新型的汉字拼音输入在线脑-机接口系统.用户界面中设计新型的二级选择模式,减小了用户在实验中的视角转移,并且将自然语言处理(NLP)技术用到此系统中,可以使此套在线系统的正确率和速度都有所提高.实验结果表明:此改进的P300-BCI系统汉字输入速率可达1.37 字·min-1,有效地提高了汉字的输入速率;随着用户使用次数增多,系统的效果会进一步得到提高,用户与外界交流将会更加方便快捷.  相似文献   

18.
本文把模式识别技术中的特征抽取概念应用于汉字编码,提出了汉字形码输入方案的一种新的设计方法,介绍了用新方法设计的简单易学、高编码效率、低重码率和低重码度的“简笔汉字输入法”。把简笔汉字输入法与其他汉字输入法及西文键盘输入的技术性能作了定量的比较。  相似文献   

19.
手写体汉字特征提取的研究   总被引:2,自引:0,他引:2  
在手写体汉字识别的研究中,汉字的特征提取可以说是整个手写体汉字识别系统中最重要的一部分。本文针对手写体汉字特点,找到了能充分反应手写体汉字特点的三种特征井加以提取;同时提出了将汉字分解为部件来识别的观点。实验结果表明所提取的特征兼顾了提取方法的方便性和特征的稳定性;这些特征能有效地识别手写体汉字。  相似文献   

20.
在BNF范式编码的基础上,深入讨论了生僻汉字数字化处理问题。根据对生僻汉字部件的统计和分析,本文提出了基于编码的生僻汉字输入方法,建立了相应的生僻汉字部件库,实现了生僻汉字的数字存储和显示。此外,应用测试用例自动生成的方法,对输入方法进行了测试,表明该方法具有造字速度快,应用范围广,与现有字体兼容性强等优点,从而为生僻汉字的数字化提出了一个新的解决方案。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号