毕业论文
您现在的位置: 外耳道炎治疗 >> 中药治疗外耳道炎 >> 正文 >> 正文

耳机主观音质评价

来源:外耳道炎治疗 时间:2020-11-15

目录

生理声学基础

乐音生理物理基础

音色感知基础

自由场人耳朵频率响应曲线

密闭耳道声音再现

耳机频响曲线与好音质

耳机声音质量感知与测量的关系

图1:

一、生理声学基础

1、听觉系统的构造-外耳:

人的耳道的平均直径7mm,平均长度为23mm-28mm,恰好大约等于3KHz的λ/4,所以在此频率会形成四分之一波长谐振峰;

人的耳膜的厚度平均为0.8mm,是一种轻、薄、高弹性的三层复合膜,其上皮层与外耳道皮肤相连;内层与中耳粘液外膜相连;中间层纤维结构给鼓膜以强度与弹性;

2、听觉系统的构造-中耳(如下图2):

鼓膜的机械运动通过锤骨、砧骨及镫骨三块听小骨传递到卵形窗。锤骨固定在鼓膜中层纤维上,镫骨附着在卵形窗上。鼓膜运动,通过听小骨的杠杆作用,带动卵形窗做活塞运动。进一步推动耳蜗内的淋巴液产生流动。从空气,到液体运动,所以三块听小骨起着阻抗匹配的作用;

鼓膜压强P1与镫骨底板压强P2的关系公式如下,F1为鼓膜压力,F2为镫骨底板压力,L1为锤骨力臂,L2为砧骨力臂,A1为鼓膜面积,A2为镫骨底板面积。

P2/P1=A1*L1/(A2*L2)

人鼓膜面积大约为镫骨底板面积13倍,L1=1.3L2,鼓膜屈曲运动压力增益系数为2,所以P2=13*1.3*2=33.8,约增益30.6dB。

图2

3、听觉系统的构造-内耳:内耳的主要组成部分为耳蜗。

耳蜗的主要功能是将机械振动转换为最终传输给大脑处理的神经电脉冲,机械振动是从中耳的镫骨底板通过卵形窗传递给耳蜗的;

耳蜗由一根骨质小管盘旋约2.75圈形成,如下图3a)所示;b)为截面图;c)为耳蜗螺旋结构垂直截面图;d)部分可以看出这个软管被基底膜与前庭膜分为三个部分,前庭阶V与鼓阶T位于外侧,内部充满淋巴液。前庭阶V的末端是卵形窗,鼓阶T的末端是圆形窗。

耳蜗的顶部有一小孔,叫蜗孔,前庭阶与鼓阶的淋巴液在蜗孔处相通

机械振动从镫骨底板通过卵形窗带动耳蜗内的淋巴液流动,液体不能压缩,另一端的圆形窗做相反的运动。这些运动在前庭阶产生行波,并转移到前庭膜与基底膜。

图3

4、听觉系统的构造-内耳:

基底膜的作用是对输入的声音信号进行频谱分析,它的形状在耳蜗底部狭窄而薄,沿着顶部方向逐渐变宽、增厚如下图4所示。

左图为理想的基底膜形状,它沿着展开的耳蜗分布。基底膜在受到声频信号刺激后发生响应,产生振动。

如图5所示,基底膜的窄而薄的部位(底部)对高频响应最好,基底膜的宽而厚的部位(顶部)对低频响应最好。基底膜的宽度与厚度沿着耳蜗逐渐变化,输入的不同的频率的纯音信号将在基底膜的不同位置激发一个最大振幅。输入信号的频率改变,基底膜的最大位移的位置也在改变。低频最大位移位置靠近顶部,高频最大位移位置靠近底部。

基底膜附着的柯蒂氏器器官有大量的毛细胞,基底膜振动会使毛细胞发生变形,形成神经脉冲信号。毛细胞的神经形成螺旋束结构,这就是听觉神经。

图4

图5

5、临界频带:

如图6所示,输入声音信号的每一个频率分量都将在基底膜某一个特定位置发生位移,每个频率分量产生的位移在峰值两侧有一定的程度的延展,如下左图所示。两个频率、振幅相近的声音信号是否能够被听觉分辨,取决于每个分量在基底膜产生的位移包络是否可清晰地分离。

当固定纯音频率F1而改变纯音频率F2时的听感如下图7所示。当F2=F1时,只能听到一个频率。

当F2高于或小于F1时,可以听到声音的振幅有波动性变化,称为拍音。拍音的频率等于IF2-F1I。拍音的振幅在A1+A2与A1-A2之间变化。

当频率差小于12.5HZ时,大多数听音者会察觉到拍音现象。

当频率差大于12.5HZ时,听感逐渐从拍音变成一个音高不明确的不稳定的声音。此不稳定的频率范围因人而异,取决人的听力能力。

听音者开始察觉两个纯音信号从不平稳可分离转变为平稳可分离的频率差对应的带宽称为“临界频带”(CB:criticalbandwidth),即临界频带是主观听感突然发生变化的频带宽度。

乐音是由多个频率成分组成的,了解临界频带的听觉机理在乐音频率分析时的作用,是心理声学研究的基础。

听觉对声音中单个频率的分辨力对于从心理学上理解听觉如何感知音乐是非常重要的,包括旋律、各声、音调、动态等等。

图6

图7

6、噪声引起的听力损失:高强度噪声损伤听力,表现在如下两个方面;

听觉灵敏度降低:噪声使柯蒂氏器中的毛细胞损坏,从而造成毛细胞将声音转换为神经脉冲的效率降低。长时间受噪音影响时,由于毛细胞活性降低,听力将永久性损失。

听觉分辨力受损:耳蜗内临界频带分析结构非常容易损坏,导致分离不同声音成分能力下降,灵敏度也会降低。

图8:噪声暴露对听觉灵敏度的影响,如当在dBA的噪声中暴露分钟,听觉灵敏度降低约30dB;图9噪声暴露对临界频带的影响(频率分辨力降低)。

图8

图9

7、听觉对声源的定位能力:

双耳强度差主要对高频声音的定位起作用,双耳时间差主要对低频声音的定位起作用。在HZ~2.8KHZ频率内,听觉完成这两种定位方法的过渡。双耳对这两个频率之间的声音信号的定位能力不及对其他频率的定位。

上述方法无法完成声源前后方向定位,以及判断声源高度的问题,这类问题还有如下两种方法解决:

1)利用外耳对声波的作用来定位声源的角度和方向。对于5KHZ以上的频率的声音,经过耳廓反射进入耳道的声音,与直接进入耳道的声音存在延时,并产生梳状滤波效应,因此形成了一种与声源方向相关的频谱特性,听觉系统据此判断声音的空间方位。

2)转动头部是解决声像定位不明确的一种有效方法。对于来自后方、前方或上方的声源,头部转动时声源的移动方向是不一样的。这也是耳机会产生头中定位效应的原因,因为声源不随头部的转动而变化。

双耳时间差与强度差的共同作用:在时间差小于us时,双耳时间差可以用强度差来补偿。在us~30ms之间,主要由先导声定位。大于30ms会产生回声。如果先导声的声压级显著低于延迟声,则听觉定位于先导声的现象将消失。

哈斯效应:延时在30ms以内时,听觉将定位于先导声,而不能感觉到延迟声的存在;听觉一般不能感觉到30ms以内的反射声。演播室,音乐厅的基本要求是保证早期反射声在30ms以内到达观众区,以避免这些反射声形成回声(好的设计音乐厅大多在20ms以内)。

二、乐音生理物理基础

1、不同文化背景的音乐所利用的音高组合不同,但人类对音高感知的心理学基础是相同的:

从声学角度讲,一个能被感知音高的声音都是由称为谐波的基频的整数倍的频率成分组成,每个谐波都是一个正弦波。由于听觉系统是根据频率成分分析声音的,因此,这些谐波对理解周期性声波的分析与合成是非常重要的,而且研究各个谐波之间的音乐关系,是西方音乐发展的核心内容。

音高是听觉对声音高低的感觉,音高是随着基频的变化而改变的,基频越大音高越高。

部位学说与时间论是解释听觉音高感知的两个基本理论,它们可以解释人类的听觉系统如何定位和跟踪所接收的声音基频的变化。

音高感知的部位学说与基底膜的频率分析特性有着直接关系,输入声音信号被不同的频率分量刺激基底膜的不同部位。毛细胞在基底膜的每个位置都会进行神经放电,并且刺激与输入声源的频率成分相对应的神经细胞和大脑高级中枢。

神经冲动的时间间隔被听觉系统分析后,得到一些共同的时间间隔,这些时间间隔接近于基频的周期及其倍数,这是音高感知的时间论的基础。听觉根据上述的分析结果感知音高。

在感知音高时,基频不是必须存在的,最低频率成份不是感知音高的基本依据。当基频缺失时,二次谐波是最低频率成份,音高不会因此而提升一个倍频程。人类通常能够分辨前6次谐波,不能分辨7次谐波及以后的谐波。

音高感知会随正弦波的强度在40-90dBSPL之间变化,大于2KHZ的音高会随着声压增强而提高,小于2KHZ的音高会随着声压增强降低,音高2KHZ的基频不变。如下图10所示。

图10

2、音乐上的谐和与不谐和的背后的心理声学基础与临界带宽有关,它可以衡量章程的谐和与不谐和的程度,如下图11为两个纯音信号谐和与不谐和的感知规律:

当两个纯音的频率相等时,感知为完全谐和的音程。

当两个纯音的频率差大于一个临界带宽时,这两个纯音被感知为谐和音程。

当两个纯音的频率差处于临界带宽5%~50%时,这两个纯音被感知为不谐和音程。

当两个纯音的频率差是临界带宽1/4时,这两个纯音的不谐和性达到最大。

图11

三、音色感知基础

1、声音三要素:响度、音调和音色。用于描述音色的术语包括:柔和的、刺耳的、暗淡的、明亮的、尖锐的、圆润的、压抑的、生动的等等。音色是用来描述特定的音高与响度的声音在听感上的质量或声音性质。

声音中唯一一个决定音色的因素是泛音的存在与否以及它们的相对强弱。

当乐音的起振阶段衰减去除后,听音者很难辨别不同的乐器的音色。如把录制的小提琴的乐音和同一音符的小号录音的起振阶段和衰减阶段去除,则听音者很难将二者加以区别。

音色感知心理声学基础是听觉临界带宽随频率变化的特性,它反应了听觉的频谱分析特点。无论乐音的基频f0是多少,其5-7次谐波成分一般不能被听觉分辨出来,而5-7次以下的谐波成分则能够被听觉分辨出来,说明这些谐波成份各自对音色感知起着显著作用。

当乐器(如高音萨克斯管)的稳态频谱包含显著的5-7次谐波成分的音色可以用明亮的、辉煌的、刺耳的等音质评价术语来描述。当乐器(如长笛、长号)的稳态频谱不包含显著的5-7次谐波成分的音色可以用不明亮的或暗淡的、不辉煌的或单调的或不刺耳的或柔和的来描述。由于单簧管的奇次谐波起主导作用,所以单簧管具有鼻音音色。

乐音音色感知的四条一般规律:简单的乐音如音叉共鸣或管风琴封闭式音管产生的声音,听起来比较柔和、愉悦、但欠缺强度,低音单调;包含中等强度的约6次以下的谐波分量的声音听起来更和谐、更具有乐感,与简单乐音相比,音色丰富华丽,在缺失高次谐波的情况下,音色甜美柔和;如果声音只包含奇次谐波分量,则音质空洞,如果包含大量奇次谐波分量,声音鼻音较重。基频较强时,音色较丰富,基频与高次谐波相比不够强时,音质较差;

当高于6次或7次的谐波很显著时,音色比较刺耳和粗糙。属于这类声音的乐器有弓弦乐器、簧音管和人声等等,粗糙高亢的铜管乐器的声音极具穿透力,与其它类似较柔和的乐音相比,更适合于产生力量感。

通过均衡器,将-HZ频率能量衰减,声音变单薄;如果提升2-8KHZ频率能量,则音色更明亮、更多咝声、更刺耳。提升-HZ会更温暖,也可以降低3-7KHZ得到同样的效果。提升2.5-4KHZ会增加歌声的突出感,将歌声带到总体声音的前面。

四、自由场人耳朵频率响应曲线

用BK标准MIC较准扬声器曲线在20Hz-20KHz为一平直曲线,则人耳朵听到的频率响应曲线如下图12所示,第一个峰为耳道λ/4谐振峰,大约在3KHz左右的范围。耳朵听耳机与扬声器都有这个峰。第二个峰是因为头与外耳廓衍射形成的峰,只会在听扬声器时有这种现象。所以,即使扬声器在自由场测试是平的频率响应,但在耳膜处测试仍有图12所示的两个峰,也就是说人在自然状态听的声音,会因为人体,特别是耳朵的结构产生两个高频峰:

图12

3kHz的峰有两个原因:

一是耳廓及耳道入口处的凹陷具有多次反射及衍射,引起输入声音的放大约10dB;

二是耳道中的λ/4谐振引起的10dB放大。如下图13所示

结果是在约3kHz处具有20dB峰值,使声音重度声染色。

图13

五、密闭耳道声音再现

被困在耳道中的振荡静压使耳膜产生的位移,比与正常开腔通过空气传入耳朵振膜而引起膜的振动幅度高约倍或0倍或更多倍。所以入耳式耳机比在开放环境中聆听声音时通常产生的声压高50dB。这是因为耳道中密闭的空气体积可近似等同于快速振荡静压的气动空气活塞。如下图14所示。

图14

如下图15显示了鼓膜总位移与扬声器位移的关系。图16显示了与图15相同的鼓膜位移与扬声器位移数据,不同之处在于鼓膜位移显示为相对于驱动扬声器位移的百分比。在这些结果中,鼓膜位移没有频率依赖性,因为位移取决于与扬声器位移有关的静压而不是扬声器速度。

图15

图16

图17:1cm长的密闭体积内,SPK位移范围从1um到um振动,鼓膜位随SPK位移而增加,对于10到Hz的频率鼓膜位移不随频率而变化。在和0Hz之间的频率下,鼓膜位移随着频率的增加而下降。这是因为在较高频率下,惯性效应阻止鼓膜及其相关结构在力的大小和/或方向变化之前完全响应驱动力。

图17

图18:三种频率下,鼓膜位移占扬声器位移的百分比。鼓膜位移占扬声器位移的百分比被视为高度依赖于频率。较低的频率产生较高的百分比位移和较高的频率产生较低的百分比位移。

图18

图19绘制了密封耳道振荡静压与相同扬声器在开放空间辐射(直接在振膜前面测量)三种不同的频率下的相应声压之比与扬声器位移关系。密封的体积振荡静压高于整个扬声器位移范围内的开放空气峰值声压。鼓膜不能移动时可能出现的最大压力也在该图中绘制。

当入耳式耳机插入耳道中时(确保没有泄漏,密封良好),在耳道密闭小体积中,存在两种声音的传递方式,一是净压振荡效应,二是声波的传导。净压振荡效应可以极大地增强耳道中的SPL(soundpresslevel),特别是在低频时,所以入耳式耳机,较容易得到高的低频响应。

人耳蜗的动态范围比可以听到的声压级范围窄约30%。当声音高于约80到90分贝以上时,会引起镫骨反射,镫骨肌收缩,并由此收紧鼓膜,中耳的响应被压缩以适应耳蜗的动态范围。镫骨肌的收缩也重新定位听小骨以将马镫拉回,减少了转移到内耳椭圆窗的运动幅度。

在耳道中被困体积中的低频段的高SPL,可以容易地超过触发镫骨肌收缩阈值,这会一方面使耳朵灵敏度降低,另一方面,如果导致镫骨反射被一次又一次地触发,会导致可能的听觉疲劳,长时间使用入耳式耳机后会感觉疼痛或受伤,最终造成听力损失。

当耳机有泄漏时,声压降低约20dB(与泄漏程度有关)。所以入耳式耳机的泄漏通常会对频响产生重要影响。

六、耳机频率响应曲线与好音质:详细分析见《ListenerPreferenceForDifferentHeadphoneTargetResponseCurves》,此处只给出结论如下:

模拟HARMAN听音室曲线是最好的,会显著提高耳机主观评价30%(得出这个结论主要是因为受试者认为频响均衡与没有声染色是重要的评估依据)

OLIVE实验中发现年轻人与没有听音经验的人更倾向于更高的低频与高频响应;

图20:蓝色线为入耳式耳机推荐频响曲线,黑色与红色为ONEAR耳机推荐频响曲线。

图21:蓝色为推荐曲线与市场上其它曲线对比图。

图20

图21

七、耳机声音质量感知与测量的关系:详细分析见《therelationshipbetweenperceptionandmeasurementofheadphonesoundquality》,此处只给出结论。

训练过的听音人员,对如下图22A所示6幅耳机,用如下图22B所示打分法,进行双盲测试对比评价;

另对要求听众评论每个耳机的不同声音质量属性(spectral,spatial,dynamicandnonlineardistortions),以解释其耳机偏好的根本原因,结果如如下图23所示。底部负值绝对值越大,该项的音质负面影响权重越大,TOP3为失真,沉闷,声染色。正值越大,则该项对音质评价正相关权重越大,TOP3为很好的频响均衡,宽的声场,低的声染色。

图22

图23

就总的声音质量来看,主观音质最好的耳机是听起来频谱均衡最中性,声染色最低的耳机;

曲线平直,光滑,低频延伸多的主观音质评价好;

主观声音感知到的频谱均衡与实际测试不能完全一致,如下图每个频响测试中的底部绿色虚线为主观感知到的频响曲线,对于高频的一些上下剧烈抖动峰谷不能分辨。

图24

久久为功,破浪重逢

感谢您十五年来与我们的携手同行!声学楼论坛的成长壮大离不开您的

转载请注明:http://www.yxrubber.net/zyzlwedy/5899.html