首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 328 毫秒
1.
由于汉语是声调语言,在连续语流中韵律词重音不仅会受到其所在韵律层级的影响,也会受到调型组合的影响。该文在大规模连续普通话语音数据库的基础上,从韵律层级和调型组合2方面对韵律词重音感知作了细致分析。实验结果表明,在不同韵律层级和调型组合条件下,重音感知呈现出规律性差异,主要表现为:1)随着韵律层级的上升,时长和基频都随着重音级别的增大而增大,但基频对重音感知的影响更大;2)在相斥的调型组合下,时长对重音感知的作用要显著高于其在相容调型组合下的作用;3)在连续语流中,双音节韵律词的重音模式没有显著稳定性。  相似文献   

2.
随着音乐数量的迅速增加,对音乐进行数字化的处理已经成为必然趋势.主旋律反映了音乐的主要思想,提取主旋律在制作计算机音乐,检索分类,哼唱识别等领域具有广泛的应用价值.本文提出一种自适应谐波叠加的复调音乐主旋律提取算法.首先,通过声源分离预处理,通过判别基频最小稳定方差改变压缩因子,自适应叠加谐波构建显著函数;然后,对显著函数构建的基频片断采用随机森林模型进行人声检测,组合所有人声帧的最大显著度频率得到音乐的主旋律序列.实验表明,在MIR-1K数据集上得到的结果在高信噪比情况下有显著提升.  相似文献   

3.
重读对降阶作用的影响研究   总被引:1,自引:0,他引:1  
通过设计特定声调组合的实验室语句,考察了重读和降阶作用对陈述句语调下降趋势的影响规律。结果发现,重读对其后语调下降趋势的影响是刚性的;而降阶的作用则是有条件的,会受语句中重音位置的影响。当重读处于诱发降阶的低音之前时,两种因素对语调下降的作用是累加的,导致低音后的基频曲线明显低于只存在重读或降阶时的基频曲线。当重读与低音成分位置重合或重读处于低音成分之后时,虽然重音本身的音高表现在一定程度上会受到低音的影响,但低音成分不影响重音位置之后的基频曲线,并且此时重读会导致降阶现象消失。  相似文献   

4.
针对传统信号处理算法在分离转子启停车过程中包含复杂非平稳谐波分量的振动响应信号时存在计算量大、对宽频信号提取能力差等问题,基于零相移滤波和相位解调原理,提出了一种转子启停车过程中的基频振动分量提取方法。该方法通过一次非线性相位解调计算,把启停车信号各分量在频带上进行重新分布,这样宽频的基频分量被解调到可见的窄带上,仅在频域即可实现基频分量与其他高次谐波分量的分离,再通过零相移滤波即可提取这个窄带分量。仿真计算和实验数据分析结果表明:与传统的信号处理算法在处理转子启停车信号上相比,提出的方法具有原理简单易实现、计算速度快、受相邻分量带宽限制小、滤波器参数能够从频谱上直接选取等优势,同时该方法提取出的基频振动分量波形平整,无相位偏移,满足进一步的分析计算,为转子启停车信号的快速提取提供了一种新的方式。  相似文献   

5.
目前针对古筝的音高识别的研究较少,识别算法表现欠佳,主要原因在于古筝音高频谱频率分布复杂且现有高质量数据集较少,不易获取有效音高特征。本文考虑到古筝音高频谱存在基频丢失、谐波衰弱、倍频音混淆(八度错误)等问题,提出了一种基于频率比对的音高相似度特征计算方法。该方法首先通过预处理对原始音频数据进行时频变换,然后提出用综合频率相似度、能量相似度和频率置信度这3种相似度特征来区分不同的音高,3组相似度矩阵表明该方法在不同音高上有较高的区分度。对630条古筝音频数据的实验结果表明,利用本文所提出的3种相似度特征计算方法的音高分类模型的准确性F1值高达97%,优于使用传统频谱特征的方法的80%。  相似文献   

6.
语音信号中相位信息的听觉感知研究   总被引:4,自引:0,他引:4  
通过主观听觉测试实验,研究了语音信号中相位信息对人的听觉感知的影响.实验结果表明,保持语音信号的幅度谱不变,在改变其相位谱时,只要重建信号在时域中的包络不变,重建语音和原始语音就不存在主观听觉上的差异.重建语音的听觉感知效果主要取决于附加相位对频率的导数的起伏幅度.重建语音中不同频率分量之间的最大相对时移决定语音感知的质量,当最大相对时移小于10ms时,语音感知质量最优;只要相位失真带来的不同频率分量之间的最大相对时移小于20ms,就不会影响对连续语音的正常理解.  相似文献   

7.
电网谐波检测中,传统FFT算法存在的频谱泄露现象影响了检测的精度.为解决这一问题,分析和比较了全相位FFT算法与FFT算法之间的区别,将一种三谱线校正方法推广到精度更高的全相位FFT算法,并由此提出一种全相位FFT三谱线校正算法.该算法利用频谱峰值频点周围三根谱线信息构造频率偏移量修正公式,进而获得全相位FFT幅值和频率校正值,并利用全相位FFT的相位不变性直接获得信号相位.通过与FFT三谱线插值算法、全相位FFT双谱线校正算法和全相位FFT双谱线插值算法对比,结果表明该全相位算法具有更好的谐波和间谐波检测精度,并且抗白噪声能力更强.  相似文献   

8.
为提高客观图像质量评价与主观图像质量评价的一致性,提出一种模拟人类感知图像质量过程中,由生理因素主导的前期过程和由心理因素主导的后期过程的IQA 方法. 人类感知图像信息的过程依赖于人脑的内部生成机制,它主动预测图像中易被感知的简单结构且忽略难以被感知的复杂结构. 此方法利用贝叶斯预测模型将输入图像分为易感知区域和难感知区域,对具有各异感知特征的两区域通过不同特征进行分别评估. 最后采用关于视觉显着性和亮度掩蔽的整体综合策略,对两组评估结果统一进行计算. 基于整体感知的综合策略和基于局部感知的保真度测量在此方法中互为补充.TID2008 等4 个通用评测数据库的实验结果,指出了该方法具有良好的预测精度和稳定性.  相似文献   

9.
音高感知是听者将声音的频率与知觉目标联系在一起所产生的知觉,不同程度的音乐训练对人的听觉感知有不同的影响.本研究采用oddball经典实验范式,以纯音为实验材料,以固定音高乐器与无固定音高乐器长期训练者为实验对象,通过实验来探讨不同乐器训练对训练者音高感知能力的差异性影响.实验结果显示,不同乐器训练对音乐中细微音高差别...  相似文献   

10.
通过考察研究问卷长度、问卷项目性质与作答心向的关系,并对组合问卷结果分析,发现第4、5份问卷的中间点和两个极端点选择次数的标准差在下降;相同份问卷不同量尺间的选择存在着显著差异;第1、3、5点在不同份问卷之间的差异具有不同的特点.表明问卷内容与所在位置都会对作答心向产生影响.通过对自我概念问卷不同量尺的正向、反向题之间的比较,发现二者的选择存在着显著差异.通过对涉及核心价值观问题情境的解答,发现匿名作答能够获得更有意义的信息.表明问卷项目性质对作答心向有直接的影响.  相似文献   

11.
Bendor D  Wang X 《Nature》2005,436(7054):1161-1165
Pitch perception is critical for identifying and segregating auditory objects, especially in the context of music and speech. The perception of pitch is not unique to humans and has been experimentally demonstrated in several animal species. Pitch is the subjective attribute of a sound's fundamental frequency (f(0)) that is determined by both the temporal regularity and average repetition rate of its acoustic waveform. Spectrally dissimilar sounds can have the same pitch if they share a common f(0). Even when the acoustic energy at f(0) is removed ('missing fundamental') the same pitch is still perceived. Despite its importance for hearing, how pitch is represented in the cerebral cortex is unknown. Here we show the existence of neurons in the auditory cortex of marmoset monkeys that respond to both pure tones and missing fundamental harmonic complex sounds with the same f(0), providing a neural correlate for pitch constancy. These pitch-selective neurons are located in a restricted low-frequency cortical region near the anterolateral border of the primary auditory cortex, and is consistent with the location of a pitch-selective area identified in recent imaging studies in humans.  相似文献   

12.
Patel AD  Balaban E 《Nature》2000,404(6773):80-84
Despite growing interest in temporal aspects of auditory neural processing, little is known about large-scale timing patterns of brain activity during the perception of auditory sequences. This is partly because it has not been possible to distinguish stimulus-related activity from other, endogenous brain signals recorded by electrical or magnetic sensors. Here we use amplitude modulation of unfamiliar, approximately 1-minute-long tone sequences to label stimulus-related magnetoencephalographic neural activity in human subjects. We show that temporal patterns of activity recorded over particular brain regions track the pitch contour of tone sequences, with the accuracy of tracking increasing as tone sequences become more predictable in structure. In contrast, temporal synchronization between recording locations, particularly between sites over the left posterior hemisphere and the rest of the brain, is greatest when sequences have melody-like statistical properties, which may reflect the perceptual integration of local and global pitch patterns in melody-like sequences. This method is particularly well suited to studying temporal neural correlates of complex auditory sequences (such as speech or music) which engage multiple brain areas as perception unfolds in time.  相似文献   

13.
一种典型的时间性的感觉是对于闪烁灯光缺失基频的现象.对此可用从信号的自相关函数(ACF)中导出的时间性因子加以描述.此方法与关于复音的音调评价所采用的方法相类似.此外,视觉的空间感,例如纹理感,包括对比、韵律和粗糙度,这些感觉也可用从灰度的ACF中导出的因子加以描述.其主观优选条件已经从其与时间和空间因子的关系中找出.文中还发现大脑的活动与对视觉有关的时间性因子的主观优选具有良好的对应性,当时间因子改变时,左脑的α波形更为显著.该理论结合时间和空间值可应用于实现更佳的视觉环境.此项关于时间性设计的新概念也可应用于建筑与环境设计中,人们可从2001年以来发表于网页http://www.jtdweb.org/中的文献里得到更多的关于JTD的信息.  相似文献   

14.
用时间域相位解包法测量不连续物体的三维轮廓   总被引:1,自引:0,他引:1  
针对传统相位解包方法不能测量不连续物体轮廓的问题,提出了一种基于时间域相位解包的傅里叶变换技术.该技术采用先投影一系列间距随时间变化的正弦条纹图到被测物体上,再用电荷耦合器件和图像采集卡来获取由物体面形调制而变形的条纹图,并沿时间轴对这些变形条纹做傅里叶变换、滤波和反变换,然后沿时间轴解包,得到图像上每个时刻每个像素点的相位.由此得到的相位值在像面内是相互独立并且是沿时间轴变化的,这个相位变化率包含有物体的高度信息.实验表明,该技术成功地解决了不连续物体的轮廓测量问题,与传统的空间相位解包方法相比,该技术最大的优点是能够方便、准确地测量不连续和大陡度物体的轮廓.  相似文献   

15.
16.
Study on the whispered tone is important to speech recognition and conversion in whispered Chinese. In this paper, the characteristics of whispered speech are introduced and the tone features in whispered Chinese are discussed. There is no fundamental frequency in the whispered speech, so other features, such as the amplitude envelope, duration, glottal area, lip area, forrnant, and vocal tract length, are extracted and their contributions to the automatic tone recognition are compared. From the experiments with six simple Chinese whispered vowels in four tones, it is proved that loudness-weighted 32 Mel-frequency bands log-amplitude envelopes and duration can be used as the main tone features in the whispered Chinese tone recognition. The average tone recognition rate approaches that of the human perception level.  相似文献   

17.
汉语耳语音库的建立与听觉实验研究   总被引:6,自引:1,他引:6  
耳语音的识别和转换是个全新的课题,可应用于公共场合下的通讯和公安司法工作的某些特殊需要等方面.首先建立了一个包含1172个字和98个近音词的单人女声的汉语耳语音库.通过对两个听觉测试实验数据的统计分析,研究了人耳对汉语耳语音字和近音词声调的辨认率特征,得出人耳对孤立字四个声调的辨认率由高到低的排序为三声>四声>二声>一声.同时也得出人耳对词声调的辨认能力比字要强得多.幅值包络和音长这两个特征参量能够反映出汉语耳语音声调的特性,基于此参数对汉语耳语音字进行声调识别实验,其声调识别率已达到了人耳的平均辨认率,为连续耳语音声调识别研究打下了基础.  相似文献   

18.
When two mosquitoes meet to mate, each modulates its flight tones such that the female’s 3rd and the male’s 2nd harmonic frequencies are equivalent. We show that this phenomenon is an example of synchronization, which is common in nature. The mosquito’s flight tone acts as an external signal, stimulating its partner to adjust the wing beat rhythm to achieve the synchronization state. A simplified model, which is based on the frequency ratio difference feedback mechanism, is proposed to describe the harmonic convergence of mosquitoes. Furthermore, we proposed a method to characterize the energy dissipation in the frequency alteration, and the results demonstrate that 3/2 frequency locking is an optimal selection to mosquitoes. When compared with other possible ratios, the mosquitoes expend minimum energy if they lock the synchronizing state at a ratio of 3/2.  相似文献   

19.
现有基于传统平面电磁波雷达的人体目标识别技术能够实现对步态差异较大的人体目标的分类识别,但在步态精细识别方面面临较大困难。将涡旋电磁波雷达应用于人体步态识别中,尝试通过发射携带有轨道角动量的单频涡旋电磁波来增加雷达回波中的目标信息量,以提高人体步态精细识别能力。首先建立了人体目标的涡旋电磁波雷达回波模型,并仿真生成了3种步态下的回波数据集;然后通过将回波变换到基频,获得目标线多普勒和角多普勒混合信息并用时频图表征,最终将时频图输入到卷积神经网络模型中获得分类结果。仿真实验表明:相比于传统平面电磁波雷达,使用涡旋电磁波可以提升人体步态精细识别能力。  相似文献   

20.
应用时域相位解包方法的三维形貌测量系统   总被引:1,自引:0,他引:1  
为了解决投影法三维形貌测量中测量点误差受相邻点影响的问题,投射计算机按照所需频率和相位生成的正弦条纹,利用时域相位解包算法实现每个测量点的独立计算。为了降低测量复杂形貌时因栅距变化产生的误差,发展了虚参考平面法。列举了在真人头面部和鼠标测量中的应用。实验结果表明,在进行复杂形貌三维测量时,采用时域相位解包方法可以抑制误差的扩散,不受不连续区域的影响。整个测量过程可在5s之内完成,测量平面时精度可达0.78%。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号