首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 93 毫秒
1.
在分析传统手写汉字文本切分算法利弊的基础上 ,提出了一种改进的基于快速连通域提取的切分算法 ,算法具有很强的抗干扰能力 ,有效解决了小角度歪斜图像和笔画粘连字符的汉字切分问题 .同时给出了具体的实现方法  相似文献   

2.
一种快速精确的汽车牌照字符切分算法   总被引:5,自引:0,他引:5  
针对汽车牌照具有字符间距、字符数、字体等统一的纹理特征,提出了一种快速精确的牌照字符切分方法,设计了一系列的特征函数和判决函数突出其纹理特点从而进行车牌字符的切分。对在不同气候条件和不同地点采集到的1000幅图片进行了实验,实验结果表明,该算法具有快速和鲁棒性的特征,字符切分准确度达到98.1%。  相似文献   

3.
一种改进的手写汉字文本切分算法   总被引:9,自引:1,他引:8  
  相似文献   

4.
通过改进的Single Pass增量文本聚类算法, 以话题为粒度对新闻信息进行组织, 实现网络新闻话题的发现. 该方法考虑了新闻的动态性和时间特性, 在特征词项权重计算中从词项在标题和正文中的位置信息及词项的增量文档频率两方面进行优化, 同时在相似度的计算中添加了时间因素及聚类中动态更新话题的质心向量. 应用 基于主题的网络爬虫构建的新闻等语料作为测试数据集, 实验结果表明, 改进算法较传统算法在耗费代价和错检率上分别降低0.34%和1.57%, 验证了改进算法的有效性和准确性.  相似文献   

5.
为适应微博数据的短文本、低词频、缺乏语义表达等特殊性,提高话题发现的准确性,利于用户从大量微博数据中获取有用信息,本文提出一种基于BTM和加权K-Means方法实现微博话题发现。首先,针对微博数据稀疏性的问题,采用BTM模型对微博中的短文本进行建模,获得话题词;然后针对传统K-Means算法本身的缺陷,提出加权K-Means算法实现微博话题发现;最后实验验证本文的方法,实验结果表明,BTM和加权K-Means方法解决了微博数据高维度和稀疏性的问题,提高了热点话题发现的准确性和有效性。  相似文献   

6.
针对互联网上新闻网站和论坛、博客等发布的海量自然语言文本,本文设计了一个面向藏文的话题发现系统,将大量藏语文本分类整理并聚合成各个话题。本文采用两层聚类策略对文本进行聚类,实验结果表明文本聚类取得了不错的结果,具有较高的应用价值。  相似文献   

7.
文章通过采用两种方法对藏语语音合成语料库中的语音进行音素切分:一种是基于单音素HMM模型的自动切分方法,一种是传统的人工切分方法,并通过实验分析了自动切分与人工切分方法的准确率程度.实验结果表明:在构建语料库时,前者有助于缩短建库周期,尤其对于大语料库的建立会有明显的优势.这种方法既节省了切分与标注的大量时间和人力成本,又提高了语音语料库标注信息的精确度和一致性.  相似文献   

8.
分析了影响FP查询速度的原因,并在此基础上提出了一种新的基于二级串联布隆过滤的冗余数据块发现算法.实验结果表明:该算法在FP查询性能及数据存储速度方面优于已有算法.  相似文献   

9.
为适应公安部的数据库设计,本文给出了数据库异构表间进行数据转换的两种算法,并通过在“机动车、驾驶员数据转换系统”中实施,比较这两种算法运行产生的实际效果,总结出在处理海量数据转换的情况下,提高数据转换效率的可行算法.  相似文献   

10.
在分析最小相位群延迟函数特点的基础上,提出了一种改进的汉语连续语音自动切分算法,该算法利用短时能量和类音节平均统计时长构造的最小相位群延迟函数为切分依据,将连续语音切分成一系列类音节单元.实验结果表明,本算法具有96.4%的切分正确率,比原算法提高5.2%.  相似文献   

11.
 中文微博具有更新快、时效性强等特点,产生的热点话题均具有一定的突发性,与此同时文本中有代表性的特征词也会随之激增。利用这一特性,在传统的TF-IDF(term frequency-inverse document frequency)基础上提出一种改进的特征权重算法,称之为TF-IDF-KE(term frequency-inverse document frequency-kinetic energy),用以解决突发性热点话题在聚类时特征不明显的问题。该算法结合物体的动能原理,将特征项的突发值用动能的概念进行描述,加入权值计算,提高突发性特征项的权重,最后使用CURE(clustering using representatives)算法,实现微博的话题检测。该方法描述了文本和特征项所具有的动态属性,实验结果表明,该方法能够有效地提高话题检测的效果。  相似文献   

12.
引进文本相关度这一影响因子,提出了一种基于蚁群聚类算法的突发话题检测算法,该算法结合蚁群聚类算法的优势,综合考虑文本聚类和文本相关度的影响,得到对网络突发话题检测的最优聚类效果,并对近年来网络突发话题进行实验,达到了很好的聚类速度和聚类效果,验证了算法对突发话题检测的准确性和即时性.  相似文献   

13.
在已有的预留碰撞算法基础上,提出了一种以空间数据结构管理为核心,用简化的几何模型表示(OBB层次树)结合起来实现复杂物体间的实时碰撞检测算法,主要采用包围盒的方法对检测物体进行包围,然后对包围盒所形成的体进行结构索引,遍历体索引输出检测结果,这样在少量增加存储空间的前提下,可以提高碰撞检测的速度。  相似文献   

14.
针对已有标记分水岭算法存在的过分割问题,提出一种基于边缘检测的溢水标记分水岭算法。首先,对遥感影像进行相位一致边缘检测,获取边缘信息。然后,基于获取的边缘信息进行区域增长,检测对象区域的微弱边界,并改善对象边界的位置精度。最后,利用提出的溢水模型生成新标记继续增长,直到得到最终分割结果。在卫星影像和航空影像数据集上的实验结果表明,所提出的算法有效地抑制了过分割现象,能够准确的提取对象区域。  相似文献   

15.
为了克服基于贝叶斯信息准则(BIC)的音频跳变点检测方法存在的缺陷,提出了音频跳变点的分割熵检测算法.该方法通过检测音频信号内部信息熵的变化趋势来检测跳变点的声学特征.结果表明:该方法可避免因设定固定门限而导致的漏检和数据积累带来的累积误差,能够准确地切分各种声学特性的音频数据,是一种更为直观和有效的跳变点检测方法,具有很高的灵敏度和鲁棒性.  相似文献   

16.
针对俄文新闻文本的话题检测问题,以俄文文本的自动形态分析、命名实体识别作为辅助手段,设计了一种基于本体描述俄文新闻文本和话题信息并进行相似度计算的方法,随后使用Single-pass算法进行俄文文本的话题检测实验。通过对比基于向量空间模型和基于本体模型的俄文话题检测结果,证明了后者具有相对较高的准确性和有效性。  相似文献   

17.
针对灰度非匀质图像分割困难及效率低下的问题,提出一种基于局部区域活动轮廓模型快速分割方法.该方法结合核函数和割测度定义一个新的能量函数.一方面,在中心点被核函数掩模的局部区域内,用邻近点的加权均值拟合数据项能有效处理图像的非匀质分布.另一方面,用割测度逼近的曲线长度作为全局正则性,利于轮廓快速定位于物体边界.最后,在轮廓演化过程中,使用基于栅格图的最大流算法,避免了传统模型计算代价高昂的水平集函数.合成图像和真实图像的实验结果表明,提出的方法能有效快速地分割灰度非匀质图像中的弱边缘物体及多灰阶复杂结构物体;同时,对初始轮廓线位置和噪声具有较好的鲁棒性.  相似文献   

18.
一种改进的PCB板缺陷检测分割算法   总被引:1,自引:1,他引:0  
针对PCB板缺陷检测分割中存在分割效果差、运行速度慢以及适用范围小的问题,提出一种改进的基于遗传算法的二维最大类间方差法的快速迭代算法。首先利用改进的遗传算法来确定分割中的最优阈值,再将这个最优阈值应用到二维最大类间方差法快速迭代算法中来确定最终的阈值最优解,从而完成分割。仿真实验表明,该算法分割的PCB图像,更加接近于人工标注的结果,最终的精度和Kappa系数达到了98.68%和0.9706。具有广泛的应用前景。  相似文献   

19.
设计了一种基于快速谱聚类的图像分割算法,该算法利用余弦相似度构造相似度矩阵,避免了传统谱聚类算法中尺度因子的精确设置问题,提高了算法效率.在谱映射的过程中,该算法采用了Nystrm逼近策略,降低了谱聚类算法的复杂度和内存消耗.在Berkeley图像库上的图像分割实验证明了算法的有效性.  相似文献   

20.
将图像中具有不同含义的区域分割开来,就是所谓的图像分割。它在计算机视觉和图像处理中是一个非常重要且具有权威意义的实际应用问题,在图像分析和图像处理中也起至关重要作用。因此,图像分割技术具有极高的研究价值。随着数学、生物学、计算机科学等学科的发展,图像分割技术也在不断更新与完善。但到目前为止,图像分割还没有一套完整切实可行的理论。力求就图像分割算法做一些积极的探索和研究,尤其是对区域分割法、边缘检测分割法及其它领域相关理论工具的分割法做一些比较详细的阐述,最后给出未来可能的研究方向。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号