首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 149 毫秒
1.
抽取音频数据特征的快速离散余弦变换方法   总被引:2,自引:0,他引:2  
针对音频数据库中存原在的问题,提出了一种基于索引的变换,分析了离散余弦变换的特点,得出Ⅱ型和Ⅲ型快速主散余弦变换算法,并把这两种算法用于数据索引特征的抽取和音频信号的重构,所提算法具有搜索速度快、回取精度高的特点,同时也使得音频数据的索引对噪声不敏感,与原数据搜索相比,具有更高的成功率,通过对峰值信号噪音率和回取精度两个指标的评估,验证了这种方法对加快音频数据的搜索速度和提高回取精度的有效性,为音频数据自动分析和分类、基于内容的数据索引和查询、基于近似的搜索提供了快速而有效的手段。  相似文献   

2.
随着3D Web技术的成熟与发展,第二代Web离我们越来越近,从3D Web中挖掘多媒体数据是一个新兴的研究领域.提出了一种基于VRML标准的多媒体数据模型——VMDM,该模型能够充分表达3D Web中的多媒体对象的特征,且易于实现,尤其易于可视化的数据挖掘.同时,在此模型基础上,提出了基于兴趣的个性收索方法,并给出了部分算法,最后,给出了基于VMDM模型的3D Web多媒体数据查询语言VMQL,并展望了在该领域将要进一步研究的内容.  相似文献   

3.
文章提出一种对MPEG-1静态文件进行索引的方案。该方案把MPEG-1静态文件分解成独立的系统信息、音频流和视频流,并建立索引树。根据索引可以快速地对音频流和视频流进行搜索和定位,还可以按照流媒体传输规则打成RTP包,并介绍了一种简便易行的视频容错策略。  相似文献   

4.
介绍了基于Web环境下流的技术处理,是在Web环境下上传和播放多媒体信息的一次探索、尝试。对Authorware流进行了解释,对流的实现原理、实现途径、设计要点等进行了说明,并结合一个Authorware多媒体课件基于Web环境下 进行了测试和分析。  相似文献   

5.
王渊博  李晶 《科技信息》2014,(15):105-107
iOS是最为流行的移动操作系统之一,本文介绍了基于苹果iOS系统的音频播放的实现机制,围绕开发环境,多媒体框架,Audio Queue三个方面详细分析了实现方法,并对音频文件播放和音频流播放两种模式进行了对比。  相似文献   

6.
如何有效地对海量数据尤其是诸如音频之类的多媒体数据进行分析、存储和检索是一个有待解决的问题.由于原始音频数据的非结构化特性,音频检索受到极大的限制.相对于日益成熟的图像与视频检索,音频检索相对滞后.基于内容的音频检索己成为多媒体检索技术的研究热点.本文对基于内容的音频检索的音频分层分割算法展开分析,提出一种基于压缩域特征音频分割域识别算法.经试验结果显示,此算法由于不依赖于具体的应用阈值,使此算法准确率有较大提高.  相似文献   

7.
流媒体课件是适于基于Web远程教学的新型课件。该类课件包含教师授课的音频流、视频流、屏幕流、文字等多种媒体信息,并按照合理的时间顺序组合起来,构成情景交融的多媒体交互环境,给学习者以全方位的学习感受。流媒体课件具有实时流式传输的特征,适合开放式的网络教学的需要。流媒体课件制作管理和学习平台的出现,减少了课件制作与维护的精力,并降低了其成本。因此,研究基于Web远程教学课件及其应用具有重要的理论意义和应用价值,它更符合现代的教育理论和教学要求。  相似文献   

8.
音频信息的检索是多媒体检索技术中的一个重要方面,本文基于数字音频指纹的快速检索算法提出了一种广告检测技术,该算法将音频流分块提取数字音频指纹,然后在广告音频指纹库中粗检索,检索过程中同时得到相似广告的时间偏移及广告长度信息,进而进行完整匹配,实现了广告信息快速完整检索.为了消除音频指纹检索受采样率误差的影响,精细匹配时提出了分割匹配的方法.实验证明,该方法具有检索速度快、受采样率误差影响小的特点.  相似文献   

9.
在集中式多媒体音频会议中,混音算法决定了其混音输出语音质量的高低,而混音算法的实现要依靠同步混音转发机制的支持。对Perkins提出的混音循环缓冲区进行分析,提出一种适用于集中式多媒体音频会议系统的实时同步混音转发算法。该算法通过设置多个循环混音缓冲区,并对其实施同步控制来实现音频数据的混音、转发功能,并利用反映操作系统调度情况的声卡缓冲区数据长度确定每次混音处理的数据长度,以减轻操作系统调度对混音的影响。实验验证了此算法的可行性和稳定性。  相似文献   

10.
针对现有的语义Web 中对象共指的消解工作研究不足,提出了一种异构Web数据流对象共指消解的技术.首先,定义了Web数据流对象的对象共指冲突识别与消解框架;然后,提出了一种基于描述逻辑的对象共指识别技术,归纳给出了描述逻辑的层次依赖关系并提出了基于依赖图的冲突遍历识别算法;并且,在冲突消解方面,定义了冲突的三种类型、冲突消解匹配模式与仲裁消解算法;最后,分别用测试集检验了本文提出的异构Web数据流冲突识别与消解技术的应用效果.  相似文献   

11.
JMF技术在网络多媒体教学系统中的应用研究   总被引:3,自引:1,他引:3  
 网络多媒体教学与一般的网络多媒体应用的主要差别在于同时包括了视频流、音频流和课件板书数据流等,本文讨论了JMF(Java Media Framework)应用于网络多媒体教学系统开发研究中的几个问题,给出了其中的2个主要部分:JMF API和JMF RTP API的实现方式,在网络课堂实录系统的开发中取得了较好的效果.  相似文献   

12.
基于Zigbee的数话同传技术研究   总被引:1,自引:1,他引:0  
设计实现基于JN5139模块的全双工VoIP语音与数据同传终端,解决了缓冲区不足造成的声音断续问题.将其应用于多媒体无线传感器网络中,在Cluster+AODVjr的路由算法基础上,提出基于数据类型的路由策略,避免RREQ分组大量洪泛,并均衡节点能量消耗.借助E-model方法对语音质量进行评价,最远语音传输距离达150m,最高数据丢包率在8%以下.  相似文献   

13.
嵌入式多媒体终端的CPU资源优化分配   总被引:2,自引:0,他引:2  
在嵌入式平台上实现多媒体通信时,多业务间对有限的运算能力资源的竞争将导致语音通信质量的严重下降。为了解决这一问题,该文提出了利用语音数据流的短时和长时抖动性对其通信质量进行评价的方法,对多种CPU资源分配方案的性能进行了研究,提出了一种能较好的保证语音通信质量的方案,实现了支持语音、静态图像、短信和白板等数据业务并发的手持多媒体通信终端。与其他方案相比,该方案语音数据流的长时抖动性降低了33%。实验证明:通过优先保证实时通信所需要的CPU资源,终端能提供更好质量的多媒体通信。  相似文献   

14.
本首先介绍了多媒体通信中的流同步问题以及影响同步的各种因素,然后提出一种基于播放时间的自适应同步算法并加以推导证明,最后介绍了它在我们设计的语音传输系统中的具体实现。  相似文献   

15.
特定类型音频流泛化识别方法   总被引:2,自引:2,他引:0  
提出一种基于Mel频率倒谱系数(MFCC)和AdaBoost算法的特定类型音频流泛化识别方法,通过分析特定类型音频流的子类别间的共性和差异性,利用共性特征进行泛化识别,能够准确地检测并定位音频流中特定类型的音频.文中将枪声作为特定类型音频进行研究,通过提取各种枪声子类别的共性,弱化子类间的差异得到一个泛化的枪声模板,利用一个模板就可以支持多子类的准确识别.实验结果表明,算法的识别准确率为87.6%,查全率达到91.8%.  相似文献   

16.
在多媒体通信中,改进数据文件的存储结构和模式对数据的传输、存储、检索和更新都具有非常重要的意义。本文结合具体的监控录像系统提出了一种视音频文件的更新存储结构,给出了在这种结构下文件的自动更新方法及其实现过程。  相似文献   

17.
采用了流媒体技术、DirectX技术、音视频解码技术,开发出基于MPEG-4流媒体播放器.解决了两大技术难题:文件定位播放与音视频同步播放.该播放器功能强大,可同时进行1—16路实时音视频流播放,具有播放画质好、性能稳定等特点;除了具有普通文件播放器的播放功能外,还可实现单帧放,抓图等功能.该播放器可用于交通、银行、住宅小区等多领域的实时多媒体监控系统,能为用户提供音视频效果接近DVD实时多媒体信息.  相似文献   

18.
针对EVDO(evolution-data optimized)网络分组域可视电话业务性质、用户行为特性、数据源的压缩协议和网络传输协议,提出了一种基于数据业务的可视电话业务源模型。首先,对音频和视频流分别采用三层和两层模型进行建模,再选取合适的模型参数对业务流进行描述,最后对业务源模型参数及分布进行求取和拟合。该模型可为EVDO网络仿真和系统规划提供参考依据。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号