首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 218 毫秒
1.
基于实体识别的在线主题检测方法   总被引:2,自引:0,他引:2  
为提高在线主题的检测效率,作者提出了一种基于实体识别技术的在线主题检测方法,利用新闻报道中的命名实体快速判断新到达报道与历史主题的关系,从而减少对报道间文本相似度的计算。实验结果显示,本文提出的方法能够在不牺牲检测准确率的基础上,显著提高在线主题检测的效率。  相似文献   

2.
深入分析和研究了多种文本信息查询模型和算法后,提出了基于内容分析的文本查询系统的设计思想和实现策略.该系统主要综合了基于概率统计模型的简单易于实现的优点,又采用了基于语义分析模型中的查询结果准确率高,查询过程具有一定智能性的特点.文章最后分析了该系统的运行复杂度,给出了算法的总体性能评估.  相似文献   

3.
基于内容的索引和检索是实现巨量数字视频资料有效检索与浏览的一种重要方法,是当今的研究热点之一,而检测提取其中的文本是实现该目标的一个重要途径。文章提出一种检测提取图像中文本的新方法,其特点在于应用模糊技术对子图像变异灰度直方图(VGH)中的文本映射特征进行识别,从而实现检测定位图像中的文本;在讨论子图像VGH中文本映射特征性质和阈值参数选取算法的基础上,着重研究了模糊技术用于文本映射特征识别问题,给出了具有鲁棒性的文本检测提取算法;实验结果表明,新方法切实可行,相关算法正确有效。  相似文献   

4.
文章针对脱机手写体汉字特征约简与识别中离散化不当的问题,构建出基于实域粗糙集的脱机手写体汉字识别决策信息系统。提出了实域粗糙集中特征属性的广义重要度的概念以及空间中的广义近邻关系;设计了在广义近邻关系下基于实域粗糙集模型的特征属性约简算法,构建出基于实域粗糙集的脱机手写体汉字识别决策信息系统;采用基于变粒度仿反馈机制的智能认知模型对脱机手写体汉字识别决策信息系统进行仿反馈识别,并建立了变粒度仿反馈机制智能识别方法的评价指标体系和认知信息粒度变换规则,提出基于变粒度仿反馈机制的智能认知算法。对SCUT-IRAC HCCLIB样本库中的汉字进行了仿真实验研究,平均识别精度达到95.37%。仿真实验表明,相比于传统认知系统单向开环方式,该文提出的方法对提升脱机手写体汉字的识别效率、可识别性及正确识别率是有效可行的。  相似文献   

5.
在直线和圆的识别算法基础上提出一种基于Hough变换的四边形分类识别算法,并进行实验验证。该算法通过Hough变换检测所构成四边形的4条线段,分别计算出4条线段与平面直角坐标系横坐标的夹角值(或是斜率),然后用冒泡排序法对夹角值排序后比较大小,根据线段间的关系(平行、垂直、相交)对四边形进行分类识别。算法可行,效果较好。  相似文献   

6.
本文采用内容分析法,选取两个特殊时期的灾害类新闻报道进行分类统计,数据分别收集自国内三大知名门户网站。通过这两个不同时期新闻报道的报道量、报道内容、报道侧重点以及传播效果等的变化,比较分析我国在重大灾害类新闻报道方面的发展趋势、变迁及现状问题,以期探索一条突发灾害新闻报道有效传播的新途径。  相似文献   

7.
话题检测的提出是为了帮助人们从海量的新闻报道中发现未知的新话题,其中文本聚类算法的研究,是实现藏文新闻文本的话题检测技术的核心.本文提出一种聚类算法,是基于简易聚类算法的改进,首先改进了文本顺序对聚类结果产生的影响,其次通过确定种子话题,来确定话题的类别.本研究的聚类算法在较小规模的语料中比改进前源算法有一定程度的提高.本文的研究对象是藏文网站中的新闻文本.  相似文献   

8.
随着人工智能行业的不断发展,智能语音问答技术逐步得到国内外学者的广泛关注和研究,但是语音识别方面仍然存在两个技术瓶颈,第一是语音识别系统,第二是根据识别的语音进行问题的回答。基于此,开展了基于深度学习的智能语音问答系统研究。首先介绍了基于隐马尔科夫模型的语音识别系统,然后研究了基于梅尔频率的语音信号特征提取技术,并建立了声学和语言模型,最后研究了基于GRU算法的问答匹配模型,并基于以上模型开发了智能语音问答系统。经实际实验验证分析,文章所提出的算法在语音识别和问答的准确度方面都相比传统算法具有很高的精确度,本算法具有较大的实用价值。  相似文献   

9.
在分析拥挤交通流特性的基础上,提出了一种基于模糊综合识别的事件检测算法,并可以确定拥挤成因,仿真研究结果比较表明该算法效果很好。  相似文献   

10.
HMM技术在语音识别中得到较为成功的应用,本文基于HMM的孤立词语音识别系统的识别策略,提出了两个改进的算法.第一种算法是对背景噪声进行动态估计的汉语语音端点检测算法,较一些常规的端点检测方法如基于能量的端点检测方法,具有更高精度和鲁棒性.第二种算法针对分裂法进行码本设计时,可能出现除数为零的计算错误,提出了避免出现计算错误的改进算法.通过进行汉语孤立词语音识别实验,表明这两种算法是有效的,得到较高的识别率.  相似文献   

11.
0 IntroductionAsmoreandmorevideolibrariesareavailabletohomesandofficesthroughtheInternet,itbecomesincreasinglyimpor tanttoefficientlymanagethevideocontent,soastoprovidethesupportforotherapplications.Inordertocharacterizethevideocontent,videostructureparsingisrequiredforindexing.Manyliteratureshaveaddressedtheshotboundarydetectiontechniques,suchasRef.[1,2 ].Someresearchershavepresentedsceneseg mentationorextractionalgorithms,forexample ,Ref.[3]pre sentsanovelalgorithmthatusesnumberofinterpol…  相似文献   

12.
针对俄文新闻文本的话题检测问题,以俄文文本的自动形态分析、命名实体识别作为辅助手段,设计了一种基于本体描述俄文新闻文本和话题信息并进行相似度计算的方法,随后使用Single-pass算法进行俄文文本的话题检测实验。通过对比基于向量空间模型和基于本体模型的俄文话题检测结果,证明了后者具有相对较高的准确性和有效性。  相似文献   

13.
提出了一种基于新闻环境的人物肖像检索方案. 该方案可从新闻中找到相关人物的描述,并以此作为人物的背景信息,对现有的通用图像搜索引擎的检索结果过滤,再通过人脸检测技术以及多媒体信息检索方法,最终找到新闻人物最佳的肖像图像,并在此基础上展示了一种新的互联网新闻表示方法. 实验证明,该方法能够比较准确地得到新闻人物的肖像表示,而且以新闻人物的肖像作为互联网新闻表示中的一个补充对提高读者的新闻阅读兴趣和阅读效率都有一定帮助.  相似文献   

14.
A schema for content-based analysis of broadcast news video is presented. First, we separate commercials from news using audiovisual features. Then, we automatically organize news programs into a content hierarchy at various levels of abstraction via effective integration of video, audio, and text data available from the news programs. Based on these news video structure and content analysis technologies, a TV news video Library is generated, from which users can retrieve definite news story according to their demands. Foundation item: Supported by the Science Item of National Power Company (No. SPKJ 016-071) Biography: Yu Jun-qing (1975-), male, Ph. D candidate, research interests: scientific visualization and video database.  相似文献   

15.
基于多中心模型的网络热点话题发现算法   总被引:1,自引:0,他引:1  
为了有效消除网络话题相关报道内容侧重点变化对网络话题发现准确性的影响,提出了网络话题多中心模型.将报道内容之间的关联关系层次化,提高了对网络话题的描述能力.提出了基于多中心模型的网络热点话题发现算法,利用话题中心判别新出现的报道是否属于已有网络话题,算法基于单遍聚类思想,通过引入话题中心的策略优化了算法的计算开销.实验结果表明:该算法可以全面、准确地发现网络热点话题,同时具有较为理想的性能,可应用于大规模网络动态流式数据环境下的热点话题发现.  相似文献   

16.
基于上下文信息的新闻故事单元分割   总被引:1,自引:0,他引:1  
为了有效检索和管理新闻视频资源,提出了一种利用多模态特征、基于上下文信息的新闻故事单元分割方法。首先利用字幕变化、音频类型和视频镜头类型信息将新闻镜头序列转换成为相应的关键词序列,使新闻故事单元分割转换成为文体序列分割的问题;然后应用一种有效的序列分割模型—条件随机场,来分割新闻故事单元。对多段视频的测试结果证明了该方法的有效性,取得了查全率为72.9%、查准率为88.4%的较好结果。  相似文献   

17.
音频分割是提取音频结构和内容语义的重要手段,是基于内容的音频分析、检索的基础.提出分层熵检测音频分割算法,采用定长分析窗分层结构遍历音频流,窗内根据熵变化趋势检测跳变点.实验结果表明,该算法避免了ΔBIC分割算法中的硬门限判决和数据累积问题,是一种更加有效的音频分割方法.  相似文献   

18.
对图像处理时的边缘检测算法作了分析和研究,介绍了基于模糊增强的图像边缘检测算法,详细研究了单层次模糊增强和多层次模糊增强的算法,并结合实验说明,该智能图像处理方法不仅能够明显的增强图像,而且可以检测到良好的图像边缘.最后,展望了这一新的研究应用领域的发展前景.  相似文献   

19.
针对重复缺陷报告检测研究中存在语义长距离依赖以及缺陷报告特征的单一性问题,提出一种强化文本关联语义和多特征提取的重复缺陷报告检测模型。引入自注意力机制捕获缺陷报告文本序列内部的语义关联性,从而动态计算上下文语义向量进行语义分析,解决长距离依赖问题;利用隐含狄利克雷分布算法捕获缺陷报告文本的主题特征,同时针对缺陷报告的类别信息,构建一种特征提取网络计算类别差异特征;最后基于3类特征向量进行综合检测。实验结果表明,该模型实现了更优的检测性能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号