影音科普:音频领域知识总结

2021-01-22 18:01发布

这是Brent Butterworth近期发表的一篇文章,作者本人授权翻译转载。


1(1).jpg

进入音频论坛或音频网站的评论区,你不可能没见过这样一句话:“一些测试数据很好的产品听起来很糟糕,而一些测试数据不好的产品听起来很不错。”这充其量是不了解相关知识的,最坏的情况则是一个谎言,具体是哪一类取决于是谁说了这样的话。这是一个谎言,有时会让发烧友买到的音频设备表现不佳。

这句话前半句是不正确的,这可以在科学论文和非正式文献的例子中表现出来。下半部分则可能是真的,如果是对个人而言。我一直认为这是一个音频界普遍的说法,在这种情况下,它是错误的。这种陈词滥调反映的不是智慧,而是人们对科学的排斥,据我所知,这些人懒得去研究科学,也没有测量经验。

2(1).jpg

这种情绪最明显的例子之一就出现在这个月,在2020年7月出版的Stereophile杂志上,Herb Reichert对天朗Revolution XT 6扬声器的测评。这篇测评的第一句话写道:“我一直在和前辈们就测量扬声器的新方法进行了角力,游说人们寻找能够更直接地与听众的体验相结合的方法。”在另一篇文章中,同一作者更直接地陈述了他的观点:“作为一种评估工具,或者作为用户满意度的预测指标,如今的测量程序几乎毫无用处。”正如我们将要看到的,这篇综述清楚地说明了为什么测量在评估音频产品时如此重要。

作者的两个陈述都反映出对这个问题的无知。以音箱为例,测量方法已经被证明可以预测86%相关性的用户满意度,这是30多年前建立的。这主要是基于Floyd Toole博士在加拿大国家研究委员会进行的广泛研究,并且在哈曼国际延续。现在,无数的扬声器公司将这些方法作为设计指南。这是因为他们知道,按照这些标准测量的音箱对大多数听众来说都是好的。

有些人些许会指出这个模型会有14%的失败率,但是,14%的音质良好但没有赢得听众的普遍喜爱的音箱不太可能听起来“不好”,除非他们有较高的失真,然而一些测量方法可以很容易地检测到。不管怎样,宣称86%的成功率“几乎毫无用处”是荒谬的。

最近,科学研究已经产生了耳机和耳机的测量结果,可以准确地预测用户的满意度。例如,在AES(国际音频工程协会)论文9878中,“预测听音者对入耳式耳机的偏好评级的统计模型:第2部分——模型的开发和验证”,Sean Olive博士和哈曼国际研究小组的Todd Welti,Omid Khonsaripour报告说,在使用71个听音者的30个耳机的评价中,测试数据和听音者偏好之间的相关性为91%。

3(1).jpg

我同意,测试数据并不能预测人们会喜欢哪种功放、DAC和其他电子产品。但这并不是因为测量中的缺陷,而是因为听众很少同意他们喜欢哪种音频电子设备。例如,盲听测试很少显示出某些型号、品牌或类型放大器之间的明显差异或偏好。对这些产品的评价并没有显示出评论者的偏好趋势;他们倾向于对一些功放和DAC大加赞赏。如果在受控听力测试中,有相当数量的参与者没有表现出对某些音频电子设备的喜爱和对其他音频电子设备的厌恶,那么测试数据或者主观评价就无法预测听音者的偏好。

这其实是一种很委婉的说法。

“一些测试数据不好的产品听起来不错”的想法怎么样?Stereophile技术编辑(前主编)约翰·阿特金森(John Atkinson)提出了一个反对这一说法的有力论据,他在1997年AES演讲的摘要中说,“一旦响应平坦度偏离某个水平(例如,170Hz和17kHz之间的频率加权标准差约为3.5dB),扬声器就不太可能听起来很好,也不可能被推荐。”他在这里谈论的是Stereophile作家推荐的扬声器。研究表明,一个由多个听众组成的小组在盲听测试中可能更不宽容那些测试数据不好的音箱。

4(1).jpg

当然,即使是一个明显有缺陷的音频产品对某些人来说也可能听起来不错。要找到这样的例子,只需看看上述对天朗音箱的评论。阿特金森的测量结果表明,正如他所说,“高音喇叭的电平似乎在高于其他频段3dB和5dB之间保持平衡“会造成这些频段的能量过剩,当我进行测量时,我可以听到MLSSA伪随机噪声信号。”

要想大致了解这是什么声音,把音响系统的高音旋钮调高4dB即可。这样的声音一点也不柔和,也不令人愉快。我不得不考虑工厂使用了错误的高音电阻器来查看测量结果。在一个有多个听众的盲听测试中,比如由加拿大国家研究委员会或者哈曼国际进行的评估,这种音箱几乎肯定得不到好的分数。

然而,我发现在主观评价中没有提到这个缺陷。事实上,测评者将音箱的声音描述为“轻微柔和”,并以“强烈推荐”来结束。至少,根据这篇测评,如果能找到一种能够可靠地预测这位评论者喜欢哪一位演讲者的测量方法,大多数听众可能不会喜欢那些相同的扬声器。

幸运的是,那些阅读测量数据的人得到了真实的故事。那些因为被告知“几乎没用”而忽视测量结果的人,最终可能会购买一个三频均衡明显错误的扬声器。

别误会我——我不介意有人大肆吹捧一款带有巨大缺陷的音频产品,就像我偶尔喜欢听Kiss's Alive专辑一样,我也希望没人会介意!我读过很多这样的评论,很少有人会有灵感去评论它们。但是,仅仅因为不符合你个人的感受而否定世界上一些最有才华的音频科学家几十年的工作,就像声称吉恩·西蒙斯是有史以来最伟大的贝斯手一样轻浮。

我希望音频测评者对他们的业余爱好感到好奇,并希望尽可能了解这方面的一切,但他们中的很大一部分人已经将自己与任何可能使他们的信仰产生动摇的新信息拒之门外。在他们对科学的排斥中,他们让读者和他们的行业陷入了无稽之谈--在很多情况下,他们把读者困在购买性能不佳的产品,然后再出售这些产品来购买其他有缺陷的产品,而不是简单地了解有关音频的关键事实,以便他们能够第一时间购买到好的设备。

5(1).jpg

不过,我很受鼓舞,因为耳机界并没有背负反科学的态度。相反,耳机发烧友们正在组装测试装置,阅读科研论文,并努力了解他们的耳机和耳放是如何工作和相互作用的。然而,他们明白科学只提供指导方针,他们最终必须倾听自己的声音,相信自己的耳朵能做出最终的判断。最重要的是,他们的音乐得到了更好的再现和更多的享受。我认为并希望这就是音频的未来。


相关点评:

6(1).jpg

音频作家布伦特·巴特沃斯(Brent Butterworth)认为,音频界最大的谎言在于测量无法揭示音频产品的好坏。我百分之百同意他的意见。科学告诉我们另一种情况(即测量是有意义的并且是必要的)。

我们的研究表明,正确的测量方法可以准确地预测扬声器和耳机的音质。认为测量并不是衡量音质的有用指标,忽视了大量已发表的科学研究,并成为当今社会和政治中普遍存在的反科学态度的又一例证。这种态度源于无知,或者更糟的是,纯粹的谎言。

Most arguments against the power of science to inform subjective judgement prediction are based on unawareness of and/or failure to appreciate the power of psychology research methods that help meaningfully link objective measurement of physical variables to (average) subjective responses.

大多数反对科学为主观判断预测提供信息的力量的论据,都是基于对心理声学研究方法的不了解和/或忽视,这些方法有助于将物理变量的客观测量与(平均)主观反应有意义地联系起来。——某声学实验室负责人

If it measures good and sounds bad, it is bad. If it measures bad and sounds good, you've measured the wrong thing.

如果测试数据好,但听起来不好,那就是不好。如果测试数据不好,听起来是好的,那么说明你的测试方法错了。

If three decades in the audio industry have taught me anything, it’s this: If you can hear it, you can measure it. If you can hear it and you can’t measure it, you’re measuring the wrong thing.

如果说三十年的音频行业经验告诉了我什么,那就是:如果你能听到,你就可以测量它。如果你能听到却无法测量,那你测量的是错误的东西。——某音频公司CEO

Especially on the consumer side, people tend to believe that the measurement that is the mot easy to understand, is the one that has the biggest importance. Similar to video, everyone is focusing on the number of pixels, but try explaining the concept of a gamma curve to a non-expert, and all you get is blank eyes. Measurements can be revealing, but they can also be misleading.

尤其是在消费者方面,人们倾向于认为,最容易理解的测量是最重要的。与视频类似,每个人都关注像素的数量,但是试着向非专家解释伽马曲线的概念,你得到的只是一双茫然的眼睛。测量可以揭示问题,但也可能产生误导。——丹拿产品总监

7(1).jpg

例如RTINGS的一些测试数据与我所测试以及我所了解的很多测试是存在一定出入的,并且曾经的计算分数并没有心理声学验证(现在我还没有具体关注,不清楚现在是否还是如此)。但依然有人用其中的一些结果去反驳一些事情。


在科学中,反面证据使人们反对一种观点;在宗教中,反面证据使人们反对这个证据。

——Floyd Toole博士

8(1).jpg

不幸的是,在发烧友市场上的不诚实程度是相当惊人的。它使那些真正有质量表现的产品变成了错误信息海洋中的小鱼。——国际音频工程协会副主席

9(1).jpg

啊…这些都不能测量客户在实际收听之前所接触到的音频中毒程度。太多的人用他们的自尊、眼睛和钱包来倾听,而不是用耳朵。

10.png

我感到非常沮丧的是,如此多的“音频测评人”否认了这一事实,并且继续忽视房间对所有扬声器系统的重要影响。

还有一些魔法工程师,他们声称他们相信科学,但更多的是他们自己认为的科学。如果看到对他们不利的证据时,他们所做的只是矢口否认。

11(1).jpg

部分解释以及观点:

现阶段对于音箱的预测模型主要集中立体声音箱系统对于音乐信号回放的音质表现。音质只是衡量一个回放系统的一个维度。还有一个重要的维度即空间印象,也是一些发烧友所俗称的声场。

12.png

我一直希望有朝一日测试数据也可以预测音箱的声像表现。
这正是我们正在努力的。我想可以建立一个预测声场表现的模型。但如果频率响应不正确,那么其他就都不重要。

音箱系统的声场(空间印象)的表现和主观感受受到更多因素的影响,例如房间反射、听音位选择、音箱摆位、音箱自身的指向性等,即便是对于简单的立体声音箱系统。对于多声道系统而言通常会更加复杂,尤其是车载音响系统。但就像上述对话中所说的,如果频率响应不正确,那么其他就都不重要。或者说频率响应/音质是基础。这符合一些权威的科学研究结果以及我个人的专业主观调音经验。

13(1).jpg

Floyd Toole博士在《声音的重现》一书中也有总结:到目前为止我们讨论了很多频率响应的问题,就好像它就是一切。实际上,它差不多就是,如果测量中的频率响应不对,那别的就都没有意义。

即便是从事全职专业主观调音或评价的专业人士,客观数据通常也是必要的,这在一定程度上可以double check一些基础指标,也可以在一定程度上减少工作量。然而这与一些发烧友、销售和音频媒体长久以来所宣称的数据没用或是唯数据论的稻草人攻击是不相符的,只不过不论如何这些人几乎不会去承认。

声场(空间印象)的评估对于一些“耳机发烧友”和没有接触过高品质回放系统与没有足够评价能力的人来说,有时是徒劳的。这就好比和一个四驱车玩家去谈论汽车的避震和操控,有时是徒劳的。我最近在使用一套近30万元的多声道家庭影院游玩使命召唤现代战争和最后生还者2。

14(1).jpg


15(1).jpg


16(1).jpg


17(1).jpg

尤其是后者的声源定位和声场表现极其逼真,录音质量也绝对是业界顶级水准,堪比一些好莱坞电影(只不过剧情实在太弱智,真的是苦了这些用心制作游戏音频的工程师和录音师,白费了他们如此努力的工作)。但这样的声场体验、空间定位与临场感对一些仍然在使用传统的立体声音箱并且没有合理的房间处理和摆位的系统可以说是降维打击,而相比于耳机玩家来说,可能是天壤之别,即便他们经常说一些与音箱系统相同的形容词或者与声场评价毫不相干的形容词。

18(1).jpg

不论是从soundstage和image的声源定位和感知声源宽度,还是LEV环绕感等,耳机都是没有明确或标准的声场的。或者说,从专业主观评价角度来讲,耳机是没有声场的。

我观点是,不能对大众消费者要求太高,因为这根本没必要。一个人的精力是有限的,不可能对所有事物都有详细了解。当你要求别人在某方面必须要达到一定的水平时,自己又是否能面面俱到?或者说即便一个人在某方面很专业,但另一方面可能也很业余,或者说这是必然的。例如摄影水平就很菜。但如果一个看了很多广告、营销故事和一些没有多少科学依据的“声学科普”就自认为自己是很懂行的“资深音频玩家”或者甚至是一些声学行业从业者,对一些很基础的概念和主观评价都不了解却自认为自己很懂并且没有任何依据的反对权威严谨的科学研究结果,是一件很荒唐的事情。

其中某些现象在国内尤为明显,例如,两年前陆续有两个美国人来出差,他们都只是助理工程师级别。然而我认为他们的听音能力、调音能力以及对声音的判断远超国内的一些声学总监。我并没有崇洋媚外,只是我个人认为一部分和调音有关的领域,国内或者说是整个亚洲的总体水平确实和一些西方国家仍然有一定差距,我认为这是事实。

爱因斯坦说过,不是所有可以计算的东西都重要,也不是所有重要的东西都可以计算。然而,长达数十年的大量科学实验告诉我们,一些关于音频主观感知的基础且重要的维度是可以与客观测试数据产生较强的联系的。反而真正需要较强主观评价的维度却很少有人了解和钻研,即便是很多高喊“耳朵收货”和“主观调音”的人,这种荒唐不论在我开始创作还是在我创作之前都贯穿始终。

而这其实印证了:无法测量的并不是声音,而是人性。


原文出处: 理性派HiFi

赞赏支持