音频基础知识

阅读: 评论:0

⾳频基础知识
⼀、声⾳的三要素
1.⾳调
⼈⽿对声⾳⾼低的感觉称为⾳调(也叫⾳频)。⾳调主要与声波频率有关。声波的频率⾼,则⾳调也⾼。当我们分别敲击⼀个⼩⿎和⼀个⼤⿎时,会感觉它们所发出的声⾳不同。⼩⿎被敲击后振动频率快,发出的声⾳⽐较清脆,即⾳调较⾼;⽽⼤⿎被敲击后振动频率较慢,发出的声⾳⽐较低沉,即⾳调较低。⼀般⾳频 ⼉童>⼥⽣>男⽣。
⼈⽿听觉⾳频范围是20Hz-20000Hz(做⾳频压缩时不在这个范围内的数据就可以砍掉)。
⾳调波形图(图⽚来⾃慕课⽹)
2.⾳量
也就是响度。⼈⽿对声⾳强弱的主观感觉称为响度。响度和声波振动的幅度有关。⼀般说来,声波振动幅度越⼤则响度也越⼤。当我们⽤较⼤的⼒量敲⿎时,⿎膜振动的幅度⼤,发出的声⾳响;轻轻敲⿎时,⿎膜振动的幅度⼩,发出的声⾳弱。
另外,⼈们对响度的感觉还和声波的频率有关,同样强度的声波,如果其频率不同,⼈⽿感觉到的响度也不同。
⾳量波形图(图⽚来⾃慕课⽹)
3.⾳⾊
也就是⾳品。⾳⾊是⼈们区别具有同样响度、同样⾳调的两个声⾳之所以不同的特性,或者说是⼈⽿对各种频率、各种强度的声波的综合反应。⾳⾊与声波的振动波形有关,或者说与声⾳的频谱结构有关。
⾳叉可产⽣⼀个单⼀频率的声波,其波形为正弦波。但实际上⼈们在⾃然界中听到的绝⼤部分声⾳都具有⾮常复杂的波形,这些波形由基波和多种谐波构成。谐波的多少和强弱构成了不同的⾳⾊。各种发声物体在发出同⼀⾳调声⾳时,其基波成分相同。但由于谐波的多少不同,并且各谐波的幅度各异,因⽽产⽣了不同的⾳⾊。
基波与谐波(图⽚来⾃慕课⽹)
⼆、⾳频的量化与编码
1.⾳频的量化过程
现实⽣活中,我们听到的声⾳都是时间连续的,我们把这种信号叫模拟信号。模拟信号(连续信号)需要量化成数字信号(离散的、不连续的信号)以后才能在计算机中使⽤。如下图所⽰量化过程分为5个步骤:
椒盐噪声1.1 模拟信号
卧式导热油加热器
现实⽣活中的声⾳表现为连续的、平滑的波形,其横坐标为时间轴,纵坐标表⽰声⾳的强弱。
1.2 采样
草地悠波球
按照⼀定的时间间隔在连续的波上进⾏采样取值,如下图所⽰取了10个样。
1.3 量化
将采样得到的值进⾏量化处理,也就是给纵坐标定⼀个刻度,记录下每个采样的纵坐标的值。
1.4 编码
将每个量化后的样本值转换成⼆进制编码。粉尘收集
1.5 数字信号
将所有样本⼆进制编码连起来存储在计算机上就形成了数字信号。
冗余信息包括⼈类听觉范围之外的⾳频信号和被掩蔽掉的⾳频信号。什么是被掩蔽的信号呢?信号的掩蔽分为频域掩蔽和时域掩蔽。
3.1.1 频域掩蔽效应
车载厨房
⼈类听觉范围是20-20000Hz,但这并不意味着只要是这个频率范围内的声⾳都可以听到,能否听到还与声⾳的分贝⼤⼩有关,有个分贝临界值,⾼于这个临界值的声⾳才能听到,低于这个临界值的声⾳就听不到,在不同的频率下这个临界值是不⼀样的。如下图所⽰,横坐标为频率,纵坐标为分贝值,图中的⿊⾊曲线就是这个临界值曲线,所以位于曲线下⽅的声⾳是听不到的。
还有⼀种情况,⽐如2个⾳调差不多的⼈同时说话,⼀个声⾳很⼤,⼀个声⾳很⼩,声⾳⼩的会受到声⾳⼤的影响,导致声⾳⼩的⽆法被听到。如下图所⽰,红⾊的柱⼦是⼀个很⼤分贝的声⾳,它会产⽣掩蔽效应将与它频率相近的⼩分贝的声⾳掩蔽掉,红柱⼦两边的蓝⾊曲线就是它的掩蔽范围曲线,紫⾊柱⼦都在它的掩蔽曲线覆盖的范围内,所以紫⾊柱⼦代表的声⾳是听不到的;⽽绿⾊柱⼦不在其范围内,所以是可以听到的。核反应堆的慢化剂
频域掩蔽效应
3.1.2 时域掩蔽效应
除了同时发出的声⾳之间有掩蔽现象之外,在时间上相邻的声⾳之间也有掩蔽现象,称为时域掩蔽。时域掩蔽⼜分为超前掩蔽和滞后掩蔽,如下图所⽰。产⽣时域掩蔽的主要原因是⼈的⼤脑处理信息需要花费⼀定的时间。⼀般来说,超前掩蔽很短,只有⼤约5~20ms,⽽滞后掩蔽可以持续50~200ms。
时域掩蔽效应
3.2 哈夫曼⽆损编码
将⼈类⽆法识别的声⾳信号删除掉后,对剩余的声⾳信号继续进⾏压缩编码,经过这种压缩后再还原
时是可以复原到和原来⼀样的数据的(当然,复原也只是复原到压缩前的状态,那些删除的⼈类⽆法识别的部分是不能复原的),所以称为⽆损压缩。
四、⾳频编解码器
4.1 常见⾳频编解码器
常见的⾳频编解码器包括OPUS、AAC、Vorbis、Speex、iLBC、AMR、G.711等。⽬前泛娱乐化直播系统采⽤rtmp协议,⽀持AAC和Speex。
性能上来看,OPUS > AAC > Vorbis,其它的逐渐被淘汰。
下图为⾳频编解码器性能对⽐,横坐标是码率,纵坐标是⾳频的采样⼤⼩等级划分(⽐如采样⼤⼩为8bit是窄带⾳频,采样⼤⼩为16bit是宽带⾳频)。
⾳频编解码器性能对⽐(绿⾊的为免费开源,蓝⾊为不开源,红⾊为收费。)
4.2 AAC编解码器介绍
AAC(Advanced Audio Coding)编解码器应⽤范围特别⼴,编解码的⾳频质量⾼保真,它出现的⽬的是取代mp3格式,因为mp3是有损压缩,对⾳频质量有⼀定损耗,⽽AAC对于原始数据的损耗就会⼩很多,⽽且压缩率很⾼。⽬前市⾯上90%以上的直播系统都是⽤的AAC(虽然OPUS

本文发布于:2023-05-17 17:21:10,感谢您对本站的认可!

本文链接:https://patent.en369.cn/patent/4/103449.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:掩蔽   频率   声波   信号   有关   时域   振动   采样
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2022 Comsenz Inc.Powered by © 369专利查询检索平台 豫ICP备2021025688号-20 网站地图