大模型语音交互方案
大模型语音交互方案
端侧云端混合 AI 方案,连接本地高效与云端智能
概览
Realtek 提供了离在线结合的大模型语音交互的解决方案,通过本地芯片的高效语音处理与云端大模型的认知能力协同,提升了人机交互体验。
方案优势
高速稳定 Wi-Fi 赋能芯片语音交互
- 支持多种网络传输协议,适配不同云端服务商
- 高吞吐量和低延时,AI 应答快速响应
- 网络稳定性高,AI 对话更流畅
专业灵活的多媒体框架
- 支持多种格式音频播放
- 高品质音频,完美畅听体验
- 灵活多样的接口,兼容不同场景需求
本地 AI 算法功能全面覆盖
- AFE(声学前端):包含回声消除、波束成形、噪声抑制、自动增益、声源定位等信号处理
- KWS(唤醒词检测):支持固定唤醒词和用户自定义唤醒词,本地精准快速响应
- VAD(语音端点检测):准确检测语音或静音,提高识别可靠性
- ASR(语音识别):支持离线语音指令识别,实时响应本地控制
应用场景
| 场景 | 方案 |
|---|---|
| 智能家居 |
|
| 智能玩具 |
|
| 会议系统 |
|
推荐 IC 型号
| 特性 | RTL8721Dx | RTL8726E | RTL8713E | RTL8730E |
|---|---|---|---|---|
| AFE 单麦(识别模式) | Y | Y | Y | Y |
| AFE 单麦(通话模式) | - | Y | Y | Y |
| AFE 双麦(识别模式) | - | Y | Y | Y |
| AFE 三麦(识别模式) | - | Y | Y | Y |
| AEC(识别模式) | Y | Y | Y | Y |
| AEC(通话模式) | - | Y | Y | Y |
| BF(识别模式) | - | Y | Y | Y |
| BF(通话模式) | - | - | - | - |
| NS(识别模式) | Y | Y | Y | Y |
| NS(通话模式) | - | Y | Y | Y |
| AGC(识别模式) | Y | Y | Y | Y |
| AGC(通话模式) | - | Y | Y | Y |
| SSL(识别模式) | - | Y | Y | Y |
| SSL(通话模式) | - | - | - | - |
| KWS 固定唤醒词 | Y | Y | Y | Y |
| KWS 自定义唤醒词 | - | Y | Y | Y |
| VAD | Y | Y | Y | Y |
| ASR | - | Y | Y | Y |



