大模型语音交互方案
概述
Realtek 提供了离在线结合的大模型语音交互的解决方案,通过本地芯片的高效语音处理与云端大模型的认知能力协同,提升了人机交互体验。
方案优势
亮点
高速稳定 Wi-Fi 赋能芯片语音交互
支持多种网络传输协议,适配不同云端服务商
高吞吐量和低延时,AI 应答快速响应
网络稳定性高,AI 对话更流畅
专业灵活的多媒体框架
支持多种格式音频播放
高品质音频,完美畅听体验
灵活多样的接口,兼容不同场景需求
本地 AI 算法功能全面覆盖
AFE(声学前端):包含回声消除、波束成形、噪声抑制、自动增益、声源定位等信号处理
KWS(唤醒词检测):支持固定唤醒词和用户自定义唤醒词, 本地精准快速响应
VAD(语音端点检测):准确检测语音或静音,提高识别可靠性
ASR(语音识别):支持离线语音指令识别,实时响应本地控制
应用场景
Realtek 大模型语音交互方案广泛应用于以下场景:
场景 |
方案 |
---|---|
智能家居 |
|
智能玩具 |
|
会议系统 |
|
软件开发资源
硬件开发资源
推荐 IC 型号
特性 |
||||
---|---|---|---|---|
AFE 单麦(识别模式) |
Y |
Y |
Y |
Y |
AFE 单麦(通话模式) |
- |
Y |
Y |
Y |
AFE 双麦(识别模式) |
- |
Y |
Y |
Y |
AFE 三麦(识别模式) |
- |
Y |
Y |
Y |
AEC(识别模式) |
Y |
Y |
Y |
Y |
AEC(通话模式) |
- |
Y |
Y |
Y |
BF(识别模式) |
- |
Y |
Y |
Y |
BF(通话模式) |
- |
- |
- |
- |
NS(识别模式) |
Y |
Y |
Y |
Y |
NS(通话模式) |
- |
Y |
Y |
Y |
AGC(识别模式) |
Y |
Y |
Y |
Y |
AGC(通话模式) |
- |
Y |
Y |
Y |
SSL(识别模式) |
- |
Y |
Y |
Y |
SSL(通话模式) |
- |
- |
- |
- |
KWS 固定唤醒词 |
Y |
Y |
Y |
Y |
KWS 自定义唤醒词 |
- |
Y |
Y |
Y |
VAD |
Y |
Y |
Y |
Y |
ASR |
- |
Y |
Y |
Y |