双擎AI降噪
双擎 AI 降噪
双擎 AI 降噪是华为在 FreeBuds Pro 5(2026)上首发的主动降噪架构,核心特征是两颗非对称 DSP 处理器分别负责低频和高频降噪,配合 NPU 驱动的 AI 场景识别,实现 -55dB 的业界最深降噪深度和 40Hz–5000Hz 的超宽带降噪频率覆盖。
为什么需要"双擎"?
低频降噪 vs 高频降噪:完全不同的物理需求
| 维度 | 低频降噪(40–1500Hz) | 高频降噪(1500–5000Hz) |
|---|---|---|
| 典型噪声 | 飞机引擎、地铁轰鸣、空调 | 键盘声、人声、杯盘碰撞 |
| 波长 | 长(100Hz = 3.4m) | 短(3000Hz = 11cm) |
| 所需延迟精度 | 极高(微秒级误差→抵消失效) | 中等 |
| 所需处理带宽 | 窄带 | 宽带 |
| 算法重点 | 精确相位反相 | 快速自适应滤波 |
> 核心矛盾:传统单 DSP 需要在"极低延迟"和"宽带处理"之间折中。低延迟需要简化算法(窄带),宽带处理需要复杂算法(延迟大)。
双擎方案用一个 DSP(A)专做窄带低延迟,另一个 DSP(B)专做宽带处理——各自最优。
技术架构
``
┌──────────────────────────────┐
│ 双擎 AI 降噪 全链路 │
└──────────────────────────────┘
│
┌──────────────────────┼──────────────────────┐
▼ ▼ ▼
┌─────────────┐ ┌─────────────┐ ┌─────────────┐
│ 前馈麦克风 │ │ 反馈麦克风 │ │ NPU 场景引擎│
│ (耳外噪声) │ │ (耳内残余) │ │ (AI 识别) │
└──────┬──────┘ └──────┬──────┘ └──────┬──────┘
│ │ │
└────────────────────┼──────────────────────┘
▼
┌───────────────────────┐
│ 信号路由分配器 │
│ (根据频率分离信号) │
└───────────┬───────────┘
│
┌────────────────┴────────────────┐
▼ ▼
┌──────────────────┐ ┌──────────────────┐
│ DSP-A:低频降噪 │ │ DSP-B:高频降噪 │
│ 精度优先 │ │ 带宽优先 │
│ │ │ │
│ • 40–1500Hz │ │ • 1500–5000Hz │
│ • 延迟 <10μs │ │ • 自适应滤波 │
│ • 高精度相位抵消 │ │ • 宽带反相 │
│ • 关注引擎/风噪 │ │ • 关注人声/键盘/ │
└────────┬─────────┘ │ 碰撞声 │
│ └────────┬──────────┘
└─────────────┬──────────────────┘
▼
┌───────────┐
│ 输出合路 │
│ (频域拼接) │
└─────┬─────┘
▼
┌───────────┐
│ 扬声器 │
│ (反相声波)│
└───────────┘
``
降噪深度 -55dB 的物理含义
分贝(dB):对数单位
降噪深度从 -50dB 提升到 -55dB 看似只多了 5dB,但声能量(Sound Pressure Level, SPL)是对数关系:
| 降噪深度 | 残留声能量(相对原始) | 降低倍数 |
|---|---|---|
| -30dB | 1/1000 | 1000× |
| -40dB | 1/10,000 | 10,000× |
| -45dB | 1/31,623 | ~31,600× |
| -50dB | 1/100,000 | 100,000× |
| -55dB | 1/316,228 | ~316,000× |
> -55dB 意味着残留噪音能量仅为原始噪音的 1/316,228。从 -50dB 到 -55dB,能量降低了 3.16 倍。
为什么-55dB 是当前 TWS 的物理极限?
进一步提升降噪深度面临三个物理瓶颈:
1. 被动隔音:硅胶套的物理隔音决定了"底噪"——ANC 再强也无法消除硅胶套没挡住的高频 2. 麦克风本底噪声:MEMS 麦克风自身有 ~25dBA 的本底噪声,这成为 ANC 电路的噪声地板 3. 反馈环路稳定性:反馈式 ANC 在深度降噪时容易产生正反馈啸叫("水床效应"),需要极精密的声学设计
降噪宽度:被忽视的关键参数
降噪不仅看深度(dB),还要看宽度(有效频率范围):
| 产品 | 降噪深度 | 降噪有效频率范围 |
|---|---|---|
| FreeBuds Pro 3 | -50dB | 40–3000Hz |
| FreeBuds Pro 5 | -55dB | 40–5000Hz |
| AirPods Pro 2 | -48dB | 50–2500Hz |
为什么宽度重要?
- 飞机引擎:100–300Hz → 所有 ANC 都能覆盖 - 人声:200–2000Hz → 降噪宽度需要覆盖到 2000Hz - 键盘声:500–3000Hz → 需要覆盖到 3000Hz+ - 金属碰撞声:2000–5000Hz → 只有超宽带降噪才能处理
> 苹果 AirPods Pro 2 的 ANC 在低频表现出色,但在中高频(人声、键盘)降噪效果明显弱于 FreeBuds Pro 5。这就是降噪带宽的差距。
AI 场景识别
双擎架构的第三个核心是 NPU 场景引擎: - 识别颗粒度:比智慧动态降噪的"三档切换"更细——识别 100+ 种声学场景 - 实时性:每 50ms 更新一次场景识别结果(传统方案 ~200ms) - 预处理:NPU 在 DSP 之前先做场景判断,通知 DSP-A 和 DSP-B 各自调整参数
典型场景和策略:
| 场景 | DSP-A(低频策略) | DSP-B(高频策略) |
|---|---|---|
| 飞机 | 深度降噪,聚焦 80–300Hz | 轻度降噪(飞机高频噪声少) |
| 咖啡馆 | 中度降噪 | 增强降噪(杯盘碰撞 + 人声噪杂) |
| 办公室 | 轻度(空调低频) | 增强(键盘声是高频) |
| 户外步行 | 增强(风噪是低频) | 中度 |
| 地铁 | 深度(轮轨 100–500Hz) | 增强(报站人声 + 金属声) |
相关笔记
- 麒麟音频芯片——麒麟 A3 双 DSP + NPU 的硬件平台 - 智慧动态降噪——用户侧的"三档智能切换"体验 - ANC主动降噪——ANC 的物理原理和三种架构 - 华为耳机——搭载双擎 AI 降噪的产品 - 静谧通话——通话方向的双擎(VPU + DSP + NPU) - L2HC 编解码——高码率传输保障了处理链路末端的信号质量