首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 190 毫秒
1.
汉语的自动分词   总被引:2,自引:0,他引:2  
本文分析了汉语自动分词的困难,概述了已公布的主要分词方法,简单介绍了在1986年开发的一个分词系统.  相似文献   

2.
汉语分词技术研究现状与应用展望   总被引:8,自引:0,他引:8  
汉语自动分词是计算机中文信息处理系统的基础和难题,本文对近年来的汉语自动分词的研究方法与成果进行了分析综述。探讨了分词中存在的一些关键问题,同时介绍了分词技术在科研以及商用系统中的应用。并展望了未来分词技术在应用方向的发展.  相似文献   

3.
藏文分词是藏文自然语言处理的基础。根据藏文虚词在藏文文本中的特殊作用以及虚词的兼类性、结合性、黏着变体性和还原特性,设计实现了一个基于藏语虚词切分的正向最大匹配的藏文分词系统,该系统对原始文本进行逐次扫描处理得到分词结果。实验表明,文章提出的藏文分词系统具有较高的切分精度和切分速度。  相似文献   

4.
刘勇  王崇 《科技信息》2012,(34):188-189
中文分词词典是中文信息处理技术的重要基础,中文分词词典设计的优劣直接关系着分词的速度与效率。本文在研究了各种中文分词算法和中文分词词典机制的基础上,提出了一种基于专业词典的带词长的中文分词词典算法,主要用于对专业文档中进行加工处理,并且基于该算法设计了一个基于专业词典的带词长的中文分词词典的专业文档切分系统。  相似文献   

5.
根据实际工作,开发了一个自动分词系统,对汉语自动分词技术在智能人机交互中的实现进行探讨.基于系统的情况,分词算法采用了最大匹配法,在词库检索中提出了化查询为直接存取的方法,提高了检索效率,节省了内存,有利于分词速度的提高.  相似文献   

6.
许华 《科技咨询导报》2010,(20):230-230
中文分词技术是中文信息处理的关键,开发设计中文分词系统需要选择合适的平台构造分词词典,处理分词方法。本文是利用VC++6.0作为开发工具,介绍系统设计之初词典的构造与加载的方法。  相似文献   

7.
基于Lucene的互联网文献信息检索系统的研究   总被引:1,自引:0,他引:1  
论文详述了利用Lucene索引工具包设计和实现的一个互联网文献信息检索系统,给出了系统的设计框架和各个模块的实现技术,并介绍了系统的检索算法.为了使系统支持中英文和各种格式文献检索,论文扩展了Lucene的分词接口和文件分析接口.  相似文献   

8.
一种改进的增字最大匹配算法   总被引:1,自引:0,他引:1  
汉语自动分词技术是中文信息处理的关键技术,目前已经成为中文信息处理的瓶颈。介绍了目前几种常用的自动分词算法,在对各种分词算法进行研究的基础上,对现有的增字最大匹配法进行了进一步的改进,更加充分的体现了最大匹配法中的“长词优先”的原则,使分词系统在自动分词阶段有比目前的增字最大匹配法更好的效果。  相似文献   

9.
几种基于词典的中文分词算法评价   总被引:1,自引:0,他引:1  
基于词典的中文自动分词是中文信息处理的基础.按照使用计算机缓存的优化原则,分析了几种典型的分词词典机制,指出了其中的一些问题.改进了整词二分法,极大地提高了速度.结合哈希索引和PATRICIA tree搜索算法,提出了一个综合最优化的中文分词系统.  相似文献   

10.
本文根据彝文自身的特点,从分词词表、分词算法、设计原则、结构流程、系统界面和功能、实验结果等6个方面详细分析了彝文自动分词系统的实现过程及自动分词过程实例;最后给出了实验结果,结果表明系统具有较高的切分精度和较好的通用性,对彝文自动分词技术的研究做了一次尝试性探索。  相似文献   

11.
保护模式是X86体系结构的一种重要的工作方式,为在X86平台上实现的多任务、多进程操作系统提供了相应的硬件支持,在计算机的庥层开发过程中,了解计算机体系结构中的主要部件-内存的工作方式是及其重要的,文章介绍了当前较流行的微机体系结构-X86系统中的内存的组织、管理、和访问机制,分析了X86在保护模式下分段机制、分页机制中的一些主要的数据结构和相应的确件支持,并详细描述了分段机制中逻辑地址到线性地址的转换,分页机制中虚拟地址的转换过程。通过分页和分段机制,可以实现多进程操作系统中的进程独立的地址空间,以及对操作系统中内存的保护措施,从而及时而有效地防止了因内存的非法访问而导致的系统崩溃。  相似文献   

12.
针对颗粒图像分割中产生过分割、欠分割及粘连区域存在孔洞从而导致分割不理想的情况,提出了一种改进算法.该算法在基于边界跟踪的分割算法的基础上,采用根据真实欧氏距离所提取的局部极大值点信息对分割策略进行控制,以减少过分割、欠分割的产生,同时对含有孔洞的粘连区域增加内边界跟踪处理.实验结果表明,算法获得了更好的分割效果.  相似文献   

13.
针对大数据集的初始聚类中心选取问题,在基于密度的划分算法和适用于大规模数据集限定初值的采样算法基础上,提出了一种用于初始聚类中心的划分采样算法。对聚类子空间在每一维上进行均匀划分形成不同的数据区域,根据数据区域的数据点数的多少进行采样来提高采样的准确性。利用采样思想缩小了数据集的规模,保证了算法在时间上的优势。通过不同规模、不同形状的数据集对算法进行验证,实验结果表明,与其它初始聚类中心算法相比,该算法在准确率和时间上都具有一定的优势。  相似文献   

14.
研制了一种能够实现动目标图象分割、识别与跟踪的简易计算机视觉系统。实验结果与分析表明:该系统在图象分割实时性、动目标跟踪精确性、抗干扰性及快速灵活性等方面颇具特色。  相似文献   

15.
自动、时实、计算机视学细胞追踪系统需要一种非常有效的细胞图象分割方式.通常一些文献介绍的分割算法在运用于未染色活细胞图象分析时,由于灰度变化和不均匀的光照等,显得非常虚弱.我们研究了分割的两步策略即:(1)选出含有细胞和一部分细胞周围背景的近似区域;(2)从这个区域内的背景中分割出细胞.这种方式能有效降低周围背景灰度和细胞区域上纹理的影响.实验结果表明这种方法作为细胞图象的分割时既快又省力.  相似文献   

16.
设计一个基于非线性增强滤波方法和水平集方法的超声医学图像计算机辅助诊断系统,主要对图像进行降噪处理和分割,以改善超声医学图像质量,实现半自动化定量分析.  相似文献   

17.
材料微观组织图像分析是材料研究的重要环节,其分析方法的精准性和快速性对新材料的设计、研制和现有材料的优化、寿命评价都非常重要。因此,如何建立更快速更精准的微观组织分割方法成为微观组织图像分析和性能评价的关键。针对传统的微观组织图像分割技术对于高温合金材料分析精度不高等问题,通过对卷积神经网络结构进行优化,提出了一种基于Res_Unet网络的微观组织图像分割方法。实验验证结果表明,本文的方法不仅解决了深度学习在材料组织图像小样本数据上的实现问题,还显著提高了材料微观组织图像的分割精度。  相似文献   

18.
相 连 字 符 的 分 割 算 法   总被引:2,自引:1,他引:1  
提出针对两类常见相连字符的3种分割算法, 并按一定的优先级将这些方法排序, 有效地解决了相连字符的传统分割方法中往往只能对字符相连的某些情况进行分割的问题.  相似文献   

19.
在音频相关的系统中,迫切需要利用语音识别技术对音频流自动识别和分割,以及针对不同的应用需求, 利用消息-动作自动机进行各种复杂控制.为此,介绍了一种新的具有实时性的音频流分割系统的设计思路及其 程序实现.  相似文献   

20.
根据佳木斯信息网络的实际情况,在不浪费现有资源的情况下,提出了以TCP/IP传输协议为基础,以ATM交换机为核心的佳木斯未来信息网络组网方案,以及该网络所具有的功能和所提供的WWW,DNS,E-MAIL,FTP,NEWS,PCTOPHONE以及其它各项服务。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号