噪声广泛存在于现实生活中,所以在对噪声比较敏感的场合下,经常要求对噪声进行分离,由于需要噪声分离的场合对噪声的算法需求及程度的不同,实现噪声抑制的方法也有所区别,下面为大家介绍数字音频处理器在会议系统、法院系统、录播系统、教育系统等应用场景中常见的两种降噪算法:ANS(噪声抑制)&AI CASA(智能语音分离)。
ANS(噪声抑制)
经验让我们总结出了可以针对大多数噪声的特异点,那就是“持续且稳态”;ANS又称自适应噪声抑制算法(Adaptive Noise Suppression),它是以噪声规律为灵感,采集外界的声波信号进滤波器,根据这一逻辑判断其是否是噪声波。然而这种区别人声、噪声的方法相对简单,虽可满足大部分要求不高的场景,但无法做到不影响人声、音乐等一些所需音源;和噪声重合的部分会被压制,较稳态的音乐会被误认为噪声。
同时,这种算法只会对满足逻辑判断条件的音频进行处理,也就是说不满足条件的,都将被认定为有效音频直接通过:
事实上,并不是所有短促无规律的声音都是有效音源,如:金属碰撞声,吃东西,敲键盘、翻书声等。当出现此类噪声时,因其未满足相应条件,所以并不会对此类噪声产生积极的处理,这就导致我们在使用一些降噪设备时,会出现某些噪声无法压制的情况,从而大大影响终端用户的工作及生活体验。这时,AI CASA(智能语音分离)成了更好的选择。
AI CASA(语音分离)
NO“ANS”,IS“CASA”
AI CASA是一种基于宽度学习的声源分离技术。简单来说将CASA声源分离理论借助宽度学习工具与数字音频处理器有机结合,从而实现智能去除非人声信号。
这种算法多用于噪声源多样、声场情况复杂、对声音要求较高的场景(如精品录播课堂,讨论型会议室等),对各类噪声都能做到有效压制且最大程度保障人声的饱满和高还原度。
AI CASA(智能语音分离)特点
CASA声源分离:让计算机模仿人类对听觉信号的处理过程进行建模,从而具备和人类一样从复杂混合声源中感知声音、处理声音、解释声音的能力;
10万+小时宽度学习:将有效音源及噪声样本进行学习的同时能对周围声场环境进行分析,使其对音频的识别能力大大提升,从而最大程度上保证“人声分离”,实现智能去除非人声信号。
总结及使用场景
参考了以上两种算法的介绍,我们不难得出:AI CASA在对噪声的处理上明显优于ANS。ANS降噪能满足大多数的场景,但降噪能力有限,无法对人声和噪声进行精准区分;AI CASA可智能去除非人声信号,提升语音清晰度,同时声音还原度高、延时低。在一些声场环境复杂、噪声源较多且收听质量要求高的场所可以给予现场用户更好的体验。
深圳同创音频技术有限公司是一家专业DSP音频处理系统的OEM/ODM量产方案供应商&制造服务商。我们始终坚持坚持以研发为根本、以技术为核心,基于我们的空间原生音频算法共生平台为客户提供会议、法院、教育、主题公园等应用场景的DSP整体解决方案,主营产品包括数字音频处理器、Dante I/O、DSP&Dante模组、PoE功放模块等系列产品。
在多年市场经验累积下,我们持续精耕,在数字音须领域的技术水平及研发能力处于全国同行前列。是国家高新技术企业,已获多项国家专利与软件著作权,且与国内众多T研究及生产机构有良好的合作关系,已服务过国内外多个品牌,完成多款产品OEM/ODM个性化定制。
同创人坚守“诚信、感恩、负责任”的核心价值观,秉承“谦卑、忠诚、创新、协作、担当、积极主动、坚韧不拔”的企业精神,始终精诚团结、追求卓越。为客户提供优质产品和专业服务。坚信创新是产品的灵魂、质量是企业的生命,严守产品选材的每一项标准、生产的每一道工艺、服务的每一个细节,为客户创造最大价值。