3A音频算法如何改善音频清晰度
分享:

近年来,音视频会议产品提升着工作协同的效率,在线教育产品突破着传统教育形式的种种限制,娱乐互动直播产品丰富着生活社交的多样性,背后都离不开音视频通信技术的优化与创新,其中音频信息内容传递的流畅性、完整性、可懂度直接决定着用户之间的沟通质量。但在音视频设备使用过程中,经常遇到的噪音、回声甚至啸叫,要如何避免?

 

回声和啸叫是因为扬声器发出的声音被麦克风拾取后导致的,而3A音频算法可以将噪音、回声消除后再输出,因此拥有3A音频算法的设备输出的音质会更纯净、更清晰。那么,什么是3A音频算法呢?

 

3A音频处理技术,是声学回声消除(AEC)、背景噪声抑制(ANS)、自动增益控制(AGC)三种音频算法的合称。在音频数据的处理过程中,在音频数据采集完成之后需要进行预处理,3A音频算法是预处理的关键。


图片1.png

音频处理流程图

 

AEC 回声消除算法原理及详解

回声消除(AEC)是指在二线传输的两个方向上同时间、同频谱地占用线路,在线路两个方向传输的信号完全混在一起,本端发信号的回波就成为了本端信号的干扰信号,利用自适滤波器可抵消回波以达到较好的接收信号质量,即为回声消除。回声消除的原理就是利用接收到的音频与本地采集的音频做对比,添加反向的人造回声,将远端的声音消除。

 

在容易产生回声的通信场合,自适应回声消除算法是一项不可缺少的技术,其主要应用领域有视频会议系统、可视电话终端、移动通信或声控系统及会议麦克风等。尤其在视频会议系统和免提语音通话中,回声的存在严重影响会议质量,特别是在企业远程会议中,由于传输延时加大,回声的影响更加恶劣明显。

 

ANS 背景噪声抑制方法和作用

背景噪声抑制(ANS)指的是将声音中的背景噪声识别并进行消除的处理。背景噪声分平衡噪声和瞬时噪声,平稳噪声频谱稳定,瞬时噪声频谱能量方差小,利用噪声的特点,对音频数据添加反向波形处理即可消除。目前,对于平稳的噪声已经有很多种简单方法能够成功抑制,但是生活中常见的一些瞬态噪声却依然缺乏好办法。

 

瞬态噪声的共同特点就是突发性极强,在时域上呈振荡衰弱的形式,持续时间在十几毫秒至上百毫秒不等,在频域上分布很宽,瞬态噪声的频谱基本上是和正常语音的频谱混叠在一起,很难进行抑制。

 

AGC 自动增益算法实现与影响

自动增益控制(AGC)主要用于调整音量幅值,提高语音通信系统在带噪声环境中的性能。

人们正常交谈的音量在 40-60dB 之间,低于 25dB 的声音听起来很吃力,而超过 100dB 的声音会让人感到不适,AGC 的作用就是将音量调整到人接受的范围。

 

音频响度及麦克风拾音控制是保证音视频沟通质量的重要技术手段,一般来说,音频标准、传输条件、人为失误等因素都可能导致音频信号之间出现声音突变或者响度不一致的情况,这时候就需要对音频信号放大或缩小以得到自然清晰的语音通信。

 

明日实业在音视频领域有着二十多年的技术积累和沉淀,并将AI技术应用到了3A音频算法中来提升语音体验,在回声消除上,明日实业新的AI算法在双讲场景中更有效地解决了漏回音、丢字等问题,基于AI的降噪算法在键盘鼠标敲击或喝水咳嗽的突发噪声场景下也能快速实现噪声抑制,同时通过AI技术大大提升了人声检测的精确度,改善自动增益的效果,为企业远程音视频会议协作场景带来音质更纯净、听感更自然的听觉体验。

 

VC460头尾图4.png


内容来源:网络整理