首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 250 毫秒
1.
To explore Chinese Mandarin speech identification in babble of spatially separated talkers,subjective speech identification tests of word and sentence were made with diotic and dichotic listening respectively.The result shows that the speech identification scores changed non-monotonically with the masker number N increasing from 1 to infinity,first declining gradually until reaching their minimums and then rising.Statistical difference was found between the scores of diotic and dichotic listening.For all the values of N checked,dichotic listening achieved higher scores than diotic listening,showing that dichotic effect has an advantage for reducing babble masking.And the scores of sentence test are significantly higher than that of word test with whether diotic or dichotic listening,indicating that the linguistic connection in sentence can help listeners get a better perception of the target speech in babble masking.  相似文献   

2.
语言传输指数STI和语言可懂度指数SII为当前语言可懂度的两个主要客观评价体系.对STI和SII计算模型和测量结果的研究表明,二者并没有本质上的区别,测量结果的差别也主要是由采用的具体方法不同造成的;STI和SII的汉语语言可懂度主、客观评价关系曲线差别也不大,都可以用来对汉语的语言可懂度进行客观评价.但考虑到SII的测量过程更为复杂,在传统建筑声学等领域的应用也不具有优势,以及ANSI S3.5对测量条件限制的相对宽松可能会带来数据之间的可比性降低等因素,STI更适用于对汉语语言可懂度的客观评价.  相似文献   

3.
为了研究针对汉语清晰度的客观评测方法,通过汉语清晰度主观评价实验和客观测量对现有语言传输指数STI评价汉语清晰度的失效性进行分析。从汉语清晰度与STI的关系、STI的掩蔽模型、STI的权重系数三方面论述了采用STI评价汉语清晰度可能存在的问题,对引用IEC标准作为评价汉语清晰度的国家标准或工程规范提出了一些建议。  相似文献   

4.
语言传输指数直接与间接测量方法实验对比   总被引:1,自引:0,他引:1  
通过对4个不同房间内12个测点共48个听音条件的测量,分析了直接测量方法和间接测量方法测量语言传输指数(STI)、公共广播系统语言传输指数(STIPA)时的差异以及不同频率响应的测量系统对这两种测量方法的影响.结果表明,只要采用标准化的测量系统、测试程序,测量过程严格按照规定执行,这两种方法测得的STI和STIPA都能准确反映出语言经过声传输通路后与语言可懂度相关特征的变化,测量结果都可以用于语言可懂度的客观评价,差别较小.  相似文献   

5.
在不同室内声学特性、不同信噪比条件下探讨汉语语言平均频谱干扰噪声及其方向对汉语语言清晰度的影响。汉语语言清晰度测试信号与干扰噪声信号按照一定的信噪比混合,由听音人进行汉语语言清晰度主观评价。结果表明:在汉语语言平均频谱干扰噪声作用下,听音位置的声场特性、信噪比和干扰噪声源方向对汉语语言的清晰度有显著影响;相比于房间声学特性和干扰噪声源方向,信噪比对汉语语言清晰度的影响更为显著;汉语语言清晰度随听音位置声场特性的改善和信噪比的提高而提高,随语言信号与噪声位置分开盼角度的增大而提高。  相似文献   

6.
利用Odeon仿真软件,对55个不同听音位置,采用3种方法计算语言传输指数(Speech Transmission lndex,简称STI),并进行比较分析.结果表明,应用早期衰变时间(Early Decay Time,简称EDT)比应用混响时间(T30)计算语言传输指数较为可靠.  相似文献   

7.
可听化技术是室内声学研究的重要手段。在可听化研究中,为了方便,通常采用非个性化双耳房间脉冲响应(BRIR)来代替个性化BRIR,但这种替代可能在某些方面对可听化质量造成影响。为了研究这个问题,通过主观试验比较个性化BRIR和典型非个性化BRIR(KEMAR人工头BRIR)在可听化质量上的差异。首先,在一多媒体教室内,测量得到六名真人受试者和一个KEMAR人工头的BRIR,并与多种声音素材卷积得到双耳试验信号。然后,采用ABX主观比较方法对由受试者本人BRIR和KEMAR人工头BRIR合成的双耳信号进行试听比较。试验结果表明,受试者能通过音色等因素辨别两者的差异,四种试验信号的平均辨别正确率达到93%。这说明,个性化BRIR对可听化质量的影响是可被感知的。  相似文献   

8.
由于传统教学观念的影响,英语听说能力的培养在国内大多数的高职院校并没有得到足够的重视。如何有效提高高职学生的英语听说能力是一个非常值得研究的课题。心理语言学是一门新兴的边缘学科,它研究了人类学习和使用语言的行为和心理过程,不但对探讨语言的起源、语言和思维的关系有重要的理论意义,而且对外语教学有着直接的指导意义,当人们能够理解语言理解、语言产生和语言习得的规律的时候,学习这门语言就轻松许多。因此,心理语言学理论对于解决我国高职英语听说教学中存在的问题有一定的辅助作用。  相似文献   

9.
在用声像法求双耳房间冲激响应的过程中融入了个人化与头相关传递函数,研究了基于个人化双耳房间冲激响应的外部化虚拟声系统.首先通过个人人体参数获取个人化与头相关传递函数,然后用声像法得到前4阶个人化的早期双耳反射声,最后截取前80 ms早期反射声作为个人化双耳房间冲激响应加入到虚拟声系统.主观测听实验结果表明,使用假人双耳房间冲激响应可以改善头中效应而不降低定位精度,而使用个人化双耳房间冲激响应不仅可以改善头中效应,而且可以提高近13%的定位精度.  相似文献   

10.
利用虚拟声环境研究教室语言清晰度   总被引:1,自引:1,他引:0  
教室室内语言清晰度是教室声学研究的重点,而语言清晰度试验是研究教室室内听闻环境最直接的方法.但要找到声环境按照一定规律变化的教室并完成语言清晰度试验,往往很困难.处理教室实测脉冲信号,采用指数衰减法可以构建混响时间按一定规律变化的声环境,而采用噪声混入法则可以获得信噪比不同的虚拟声环境.通过对虚拟声环境下的语言清晰度试验结果进行数据分析,可以获得教室室内最佳混响时间和信噪比的最佳取值,证明了通过构建虚拟声环境来研究教室语言清晰度是可行的.  相似文献   

11.
为了对高速列车车内强噪声环境下的语言清晰度进行定量分析,利用最新语言传输指数间接测量方法及其与汉语语言清晰度的关系,得到不同运行速度和语音声级下车内不同位置的语言清晰度.结果表明,受电弓下部车内位置语言清晰度状况最差;该位置的语言清晰度随速度呈线性规律变化,随语音声级呈二次非线性规律变化.采用多元非线性回归分析,建立以语音声级和列车运行速度为自变量的车内语言清晰度的关系式.试验测试结果与计算结果的标准差为1.75%,拟合优度为0.963,表明该关系式可以较好地模拟三者之间的相关关系.与基于语言清晰度指数的评价方法相比较,该评价方法所需的客观参量测量更简单,更具应用价值.  相似文献   

12.
对24名左利手和24名右利手被试在三种注意条件(刺激驱动、注意左耳和注意右耳)下进行双耳分听汉字测验,检查中国人利手与汉字听觉词汇加工大脑两半球功能优势的关系,同时考察被试的注意偏向对优势效应的影响.结果表明:(1)汉语母语左利手被试加工汉字听觉词汇的大脑功能偏侧化组织明显不同于右利手;(2)右利手被试在刺激驱动条件下的右耳(左半球)优势易受注意偏向的调节出现明显波动;(3)注意偏向对左利手被试的影响主要表现为优势的左耳(右半球)成绩的下降与非优势的右耳(左半球)成绩的提高,这暗示汉语母语左利手者可能存在汉字听觉词汇加工的潜在两半球表征.  相似文献   

13.
针对传统的隐含马尔可夫模型(hidden Markov model,HMM)存在的缺陷,该文提出了一种在识别的后处理阶段使用段长模型的方法,并应用在基于HMM的汉语识别系统上。该方法利用归一化的段长模型对识别系统的解码结果重新打分,比较前后两次算出的分数从而选出更可靠的识别结果。实验表明,通过该方法将段长模型应用在识别过程中,可以显著提高识别系统的性能,大量减少识别结果中的插入错误。数据显示,该方法使识别系统的音节错误率下降了大约10%,识别系统最终的插入错误和删除错误都低于1%。  相似文献   

14.
为了提高主观和客观听力条件下语音可懂度的相关度,提出用耳蜗熵值来衡量语音的可懂度。利用提取的耳蜗熵值分段后的语音作为归一化协方差(normalized covariance measure,NCM)的语音可懂度算法的输入,分析高熵值语音段和低熵值语音段主客观相关系数的高低。结果表明,提取的高耳蜗熵值语音段比低熵值语音段对语音可懂度算法与主观评价的相关性高,高熵值语音段携带有更多的语音信息。  相似文献   

15.
介绍了针对歌曲检索中出现的中英混合现象所开发的中英双语识别系统。在双语混合语音识别中,主要面临的2个问题:①在保证双语识别率的前提下控制系统的复杂度;②有效处理插入语中原用语引起的非母语口音现象。为了解决双语混合现象以及减少统计建模所需的数据量,通过音素混合聚类方法建立起一个统一的双语识别系统。在聚类算法中,提出了一种新型基于混淆矩阵的两遍音素聚类算法(TCM),并将该方法与基于声学似然度准则的聚类方法进行了比较。实验结果表明:利用TCM进行音素聚类的识别性能优于基于声学似然度音素聚类的性能,最终得到的中英双语识别系统在纯英文测试集上的短语错误率(PER)相对基线单英文识别系统下降7.19%;在双语混合测试集上PER相对基线混合模型下降13.78%;同时在纯中文测试集上保持了基线单中文识别系统的性能。  相似文献   

16.
为提高被噪声干扰的语音的可理解性和语音质量,针对用于语音增强的深度复数网络对语音复数谱中关键声学特征提取不充分、关联信息建模不合理的问题,提出了基于多维度注意力机制和复数Conformer的单通道语音增强方法(SE-MDACC)。在复数U-Net架构下引入复数Conformer,对语音幅度和相位的相关性进行建模;利用多维度注意力机制,构造更加丰富的特征来增强卷积层的表示能力;在残差连接中加入注意力门控机制强化重构语音的细节信息。实验结果显示,相比于深度复数卷积递归网络,SE-MDACC的客观评价指标语音质量感知评估和短时客观可懂度分别提升15.299%、1.462%,表明SE-MDACC可充分提取语音声学特征并对幅度和相位相关性进行合理建模,有效提升语音质量和可理解性。  相似文献   

17.
英语虚词非重读形式在语流中是一种常见的语音现象。几乎存在于每个句子中。在一定程度上影响听力的提高.而这种现象在非英语专业听力教学中末受到学生和老师的普遍重视.本文通过对大学英语四级考试中听力考试部分的分析,发现了英语虚词的弱读对听力理解可能造成的影响和困难。探讨了解决这些困难的方法。  相似文献   

18.
TD-PSOLA技术在汉语语音波形编码合成中的应用   总被引:1,自引:0,他引:1  
以时域基音同步叠加(PSOLA)技术和一个全汉语单音节库为合成单元进行汉语语音波形编码合成,针对汉语语音的音高、时长、音强以及音节之间的协同发音效应等影响合成语音质量的主要因素,建立相应音节的声调曲线、时长规则和音节之间协同发音规则等韵律规则,并利用时域基间同步叠加法原理调整合成语音的音高和时长,从而使合成的语音比较清晰自然。  相似文献   

19.
基于多尺度分形维数的汉语语音声韵切分   总被引:10,自引:0,他引:10  
针对低信噪比环境 ,提出一种汉语语音声韵母切分新方法。以语音信号非线性产生机制中存在混沌特性为依据 ,将普通分形维数扩展为多尺度分形维数 ,用于考察语音信号在不同最大观测分辨率下的局部自相似性。利用稳定声韵母段及其之间过渡段在多尺度分形维数上的不同特性能较好地区分二者。由此针对汉语音节“声母 +韵母”的结构特点设计了一种简单而高效的汉语语音声韵母切分方法。在干净语音测试集下测试 ,切分正确率为 95 .2 % ;在信噪比为10 d B的噪声环境下 ,正确率达到 82 .3%。  相似文献   

20.
系统地设计了一个基于局部余弦变换的2.4kb/s低比特率的语音编码器,对局部余弦变换系数采用分维矢量量化方法进行量化,码书设计采用LGB算法。编码中的码书搜索采用树形状快速搜索算法。通过主观非正式听力测试和客观参数评价,从理解性和自然度两方面来看,用设计的2.4kb/s低比特率的编码方法编码的语音质量比FS1015(LPC-10e)编码标准编码的语音质量要好,而且具有较强的鲁棒性,适合于对各种环境中的语音进行编码。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号