排序方式: 共有18条查询结果,搜索用时 171 毫秒
1.
首先针对在文本处理的高维矢量环境中Kohonen自组织映射神经网络的计算瓶颈问题和输入矢量空间中存在的问题进行分析,然后对随机映射(RM)和隐含语义索引(LSI)方法分别进行理论分析,提出用于文本处理的基于随机映射的加速LSI方法.试验结果表明,加速LSI方法可以在凸现原有语义联系的基础上,低代价、有效、可控地解决上述问题,极大地降低文本处理环境中Kohonen自组织神经网络的规模和计算代价. 相似文献
2.
提出一种基于过渡像素的视频流人工文本检测与定位算法.该算法在水平和垂直方向上提取过渡像素点,生成过渡图.通过块滤波器抑制背景的过渡像素,采用基于密度的快速区域生长算法形成候选文本区域;再利用改进的局部二进制模型(LBP)验证候选文本区.仿真实验结果表明,本文的改进算法相对于Kim算法,字符定位的准确率更高. 相似文献
3.
Windows环境下蒙古文复杂文本处理的研究 总被引:1,自引:0,他引:1
简要介绍了复杂文本和Uniscribe布局引擎,然后介绍一种基于Uniscribe的蒙古文Unicode文本的解释算法,解决Windows环境下字处理软件不支持蒙古文国际标准编码的问题.该算法具有较好的通用性,能够有效处理多种复杂文本语言,在蒙古文字处理软件MWord中的应用说明了该算法的有效性. 相似文献
4.
5.
纸质地图的地图特征曲线提取 总被引:2,自引:0,他引:2
描述了一种通用的在复杂特征图像中检测主曲线的新算法.基于曲线最短路径和方向偏移判据,主曲线检测的所有运算都在图形表达中进行.在图形网络搜寻中,采用了深度优先搜索方法.其应用背景是从地理测绘图中检测道路边界和房屋轮廓,采用自动方法生成数字地图.由于测绘图中的文字、符号常常与有意义的图像特征重叠,主曲线检测旨在从原始测绘图中获得“洁净”的特征图像.大量的实际图像实验表明,本算法效率高、鲁棒性强.除了地理测绘图外,该方法还可以用于文本处理中的其他领域,如在文字识别中,将字符与之相重叠的其他无用图像分离. 相似文献
6.
针对某市公安110接处警文本描述进行案件分类的需求,参考现有文本分类方法在其他行业的应用,搭建了应用于警情描述的文本分类系统.通过论证常见分类网络适用场合及其优缺点,结合对警情数据中案件描述特征的分析,提出了基于改进卷积循环神经网络的模型,该模型优化了关键特征提取过程,弥补了现有模型短文本局部特征提取不足的缺陷.实验表明,该模型的准确率比常见分类模型提升了2%~3%,且能够有效保证数据局部特征的关联性,可以对案件描述所对应的案件类型进行准确分类,从而提高公安接处警平台的自动化效率. 相似文献
7.
基于结构的文本信息检索技术的设计与实现 总被引:2,自引:0,他引:2
阚忠良 《黑龙江大学自然科学学报》2005,22(3):393-396
设计了文本信息检索的一些数据结构,包括结构化倒排索引、结构索引和词典等,并在此结构的基础上设计实现了基于内容和结构的查询算法。这些算法以计算机机群并行环境为基础,并行数据查询提高了查询的速度。 相似文献
8.
针对复杂场景的视频,在传统的梯度检测算法基础上融入多尺度技术,提出一种由粗到细的两阶段视频字符文本检测新算法.首先,利用加权平均梯度能量特征和运动能量特征对采样帧粗检测,形成候选文本区;然后,通过连通域分析,过滤部分虚检的候选文本区,再利用梯度方向的统计特征进行验证,得到精确的检测结果.仿真结果表明,本方法在处理复杂背景视频图片时具有较好的鲁棒性. 相似文献
9.
提出了一种文档聚类方法,对用户的检索结果中类似的文档进行聚类,提供目录结构,辅助用户浏览检索结果.首先分析了现有的文本聚类方法,讨论了它们的优势和不足,然后提出了基于后缀树的中文文本聚类算法,并详细描述了该算法的原理和构造使用过程,及在算法实现的过程中遇到的关键问题及解决方案. 相似文献
10.
由于新闻更新快,对用户进行新闻推荐往往需要进行聚类预处理,而传统方法要么复杂度过高,要么依赖于迭代初值,都不能准确而高效地应用于新闻推荐中.针对以上问题,文中提出了一个基于二次聚类的新闻推荐方法,对随机抽样数据进行密度聚类,基于该样本密度聚类的簇数和初始簇心进行所有待推荐新闻的二次快速聚类,并结合时新性、新闻热度等因素实现新闻推荐.文中方法可以将相关新闻聚集在一起,同时又不导致过高的运算开销,并通过参数估计方法计算各因素参数.实验结果表明,与其他新闻推荐方法相比,文中方法具有较好的推荐多样性和推荐准确度. 相似文献