Thomas Lund
TC Electronic电子有限公司,丹麦
摘要:
对于DTV、移动电视、手机、网上广播来说,目前最主要的挑战是如何控制节目的格式、语言的可懂度和不同节目之间响度的一致性。现在广播电视的频道越来越多,所以对每个频道的处理需要更加有效率。
这篇论文报告了最近TC与蒙特利尔的麦吉尔(McGill)大学1共同进行的响度研究结果,并且通过ITU和EBU的标准化工作的实施过程,去详细说明通用的、全球化、实时响度,和峰值电平的测量标准 BS.1770,这个标准适用于单声道、立体声、5.1的信号及其相关的制作、外部导入和传输。
dota重金属我们会给出在世界范围内进行数字制作和播出中所采用的结构和工作流程。BS.1770在制作和传输、及含确定元数据传输方面的实时控制,以被证明比依靠需要时间处理动态元数据方式有更好的音质,更少失真。良好的电平控制功能会大大方便节目格式(高清电视HDTV、标清电视SDTV、手机电视和网络等)的联合播出。 本篇论文适合于从事电台,电视台制作、安装及管理的专业人士阅读。主要提供用户和技术信息,不作为任何现有产品的推广使用。
介绍
数字电视(DTV)可以携带更加生机勃勃的音频信号,这意味着更多的通道,更宽的动态范围和更好的频率响应。举个例子来说,放电影时,在音频和视频方面都不会有过多的损失,观众看到的影片基本上与录音棚里混音、剪辑完成的电影差不多。但是,当播放影片的环境发生变化时,就像视频需要彩空间,频率和量化的纠正一样,音频也需要做一些优化处理。
根据作者最近的研究,听众有一个适当定义的动态范围忍耐度,DRT2。当平均电平处于一定的范围内,句子或者音节(组成单词的声音)才会被听音者正确地识别,音乐中的主要乐器才会被听到;突发的干扰,例如过响的效果、失真或者其他不可预 1麦吉尔大学是北美最出的大学之一, 她的音乐媒体与技术研究中心(CIRMMT)在音频界享有很高的声誉,与世界上众多知名研究机构和公司均有着密切的合作。ill.ca
2 DRT= Dynamic Range of Tolerance
知的声音才不会发生。如果电平的波动范围经常超出这个可容忍的范围,那么听音者就会感觉到烦躁。
内螺旋涡流金属分选机DRT就被定义为被选定的平均范围加上峰值电平储备。
DRT依赖于听众的听音环境,具体细节参看图表1。在有非常严重的背景噪声的情况下,例如在不同的交通工具中或者都市喧闹的环境中,再现有宽阔动态范围的信号——音乐或者语言节目,没有失真,不会损伤听音者耳朵,就成了一个挑战。需要注意的是,与限制过多得声音相比,听音者通常更加不接受过宽的动态范围。表面热电阻
看图表1,电视节目的观众通常处于客
厅或者厨房环境中。我们认为这种类型
的素材有一个普通的广播动态范围特
铁路道口报警器
性。
商业广告和普通CD通常有一个更加苛
刻的动态范围,因此在电视节目播出
中,他们听起来响度更大,这是因为对
这类节目的标准化控制只基于峰值电
平。我们认为这种类型的节目有更
“热”的动态范围特性
相反,电影制作的目标是一个完全不同
的听音环境,这个环境更加安静并且可
以还放出较高的响度。这种宽动态范围
的制作也包括古典音乐。我们认为这种
自然的声音有“温和”的动态范围特
性。
图1.不同听音环境下的听众动态范围容
忍度
总结,广播节目制作需要寻求一个适合大多数消费者听音环境的最佳方法。在不同节目源之间,与电视节目消费者需求差别最大的就是电影素材。若想在家庭听音环境中播放电影,并且不损失过多的细节或者不让影片中较响的部分失真的话,我们需要将低电平信号提升12-20dB,峰值储备缩小12-16dB。
定义响度远程电源管理
与电平不同,响度是主观的。听音者对决定性因素——声压级、频率内容和持续性的衡量是不同的。因此,尽管在相似人中[1],对声音响度的定义也呈现出一个不
同听音者的差异性(BLV)1。同时,不同的年龄、性别、文化背景也会进一步的增加这种差异性。而且,同一个人对于响度评估也只是在一定程度上呈现出一致性,这要依赖于在一天中的某段时间,情绪和注意力等。这种差异性称为同一听音者的差异性(WLV)2。
由于差异性的存在,通常的响度测量方法只有在以大量的主观参考测试和可靠统计为基础的情况下才有意义。多年来[2], ITU一直都在以下几个方面进行研究:1)可以避免过载的表头特性;2)能指示主观响度的表头特性;3)能高效使用的表头显示特性;4)评估表头性能和显示特性的方法。他们采用主观听音测试的办法,来出可以对不同音频片段能有最佳电平描述的响度模型。这样就使得设计出一种对于不同长度的音频片断只激发一个平均值单位的简单电平指示表成为可能。这个测试提出了一个接近C计权的相对简单的Leq测量方式,称其为“Leq(RLB)”,在一定的条件下,这是一个好的响度预测器。 与麦吉尔大学合作,TC主持进行了一个额外的听音测试,用来设计一个同时适合短期和长期测量且更精确的响度模型。我们认为只用一个数字来描述一整个节目的电平差异的方法过于简单而且达不到预期设计实时表头的目的,因为不同动态范围的节目或者音频片断可能被分配到相同的数值。
1 BLV = Between Listener Variability
2 WLV = Within Listener Variability
图2.这是一个使用了大范围广播音频素材对响度模型(他们的名称在图表的底端)进行的评估。图表左边的响度模型比图表右边的响度模型更贴近于人耳对响度的反应。在图表顶端的红指示,代表测量出来差别高于6dB的音频片断的数目,数字越高代表响度模型的吻合度越低。
横向切片新的测试为评估不同的响度模型提供了一个坚实的基础。组合数据的使用,使在评价语言、音乐和效果的响度时采用不同模型成为可能,从而在一定程度上扩展了ITU测试的局限性(良好地控制语言)。测试结果的总结在图2中体现出来。这个评估测量法推荐将一组响度模型了分成多个级别。稍微令人吃惊的是,三种被广泛使用的响度测量方法,Zwicker模型、Leq(A)和 Leq(M),不能被推荐作为一个标准,而且将被排除在任何一个等级之外。表现最差的模型就是Leq(A)和 Leq(M),这两个模型在一些声级计和信号分析仪中采用,并且应用于广播和影院响度测量。值得注意的是,上面提到的三种模型的表现都不如采用PPM表进行测量(IEC268-10)来的准确。
因此,我们出了一个简单的Leq(RLB)最为一个基础测量方法,它可以成为未来标准响度模型的基础。TC和其他的厂商均要求制定一个分级标准,这样比Leq (RLB)更加精确的模型就可以应用于要求更加严格的应用环境中。关于更多麦吉尔大学和TC的主观测试的详细信息可以在[1,3]中到。
多声道的响度
以前的主观测试主要采用单声道的素材。写这篇报告的时候,我们只对真实世界的信号——多声道信号的响度,进行过一些少量且仓促的实验[4]。可惜的是,这个工作与早期的测试没有任何的连续性。对于多声道响度的测量,我们引进了新的Leq计权曲线,我们把它称为Leq(R2LB)。
我们用复合的数据库评估Leq(R2LB)测量方法,一点也不出乎意料的是,这种方法揭示出了与采用Leq(RLB)不一样的结果。如果当节目素材和通道数目改变时,加权也要改变的话,那就比较不幸了。因此对多声道信号的响度需要进行更多的实质性研究。需要解答的问题包括:1)到基础的测量方法以及与以前测试的联系;2)指向性与听众听音定位;3)声道计权;4)短期与长期表现与相关性的分析。
短期和长期响度
长期响度测量适合于电平的补偿,收集响度数据或者用于收集元数据,但是忽略相应的实时独表和控制的应用。作者已经参与到两个新型响度模型的开发工作中,他们是“LARM”和“HEIMDAL”。主要的目的是制造出一个精确且动力十足的可评估由语言和音乐组成的音频片断的响度测试仪。两个模型都可以通过调整分析窗口来分别计算短期响度或者长期平均响度
图3展示了一个概念研究的实验抓屏,
在这张图上同时显示了短期和长期响度
的指示。外圈有角度的表头使得显示的
区域被缩小,因为我们没有必要去读那
个LU数值,这样可以显示在画面上。注
意,这个表不是商业成品
图3. 外围有“雷达视角”圈的响度表
电视台控制响度和音频格式的策略
在模拟电视的时代已经出现了不同节目和不同电台电视台之间电平的跳跃现象。当高清电视开始准备播出在动态方面有更大差异电影的时候,这个问题将更加突出。