大模型语音交互方案

Top Picture

大模型语音交互方案

端侧云端混合 AI 方案,连接本地高效与云端智能

概览

Realtek 提供了离在线结合的大模型语音交互的解决方案,通过本地芯片的高效语音处理与云端大模型的认知能力协同,提升了人机交互体验。

Smart Voice System

方案优势

高速稳定 Wi-Fi 赋能芯片语音交互
  • 支持多种网络传输协议,适配不同云端服务商
  • 高吞吐量和低延时,AI 应答快速响应
  • 网络稳定性高,AI 对话更流畅
专业灵活的多媒体框架
  • 支持多种格式音频播放
  • 高品质音频,完美畅听体验
  • 灵活多样的接口,兼容不同场景需求
本地 AI 算法功能全面覆盖
  • AFE(声学前端):包含回声消除、波束成形、噪声抑制、自动增益、声源定位等信号处理
  • KWS(唤醒词检测):支持固定唤醒词和用户自定义唤醒词,本地精准快速响应
  • VAD(语音端点检测):准确检测语音或静音,提高识别可靠性
  • ASR(语音识别):支持离线语音指令识别,实时响应本地控制

应用场景

场景 方案
智能家居
  • 本地快速响应设备控制,如灯光、窗帘、空调等
  • 云端回复天气、菜谱、新闻等
智能玩具
  • 本地快速响应设备控制,如播放、音量操作等
  • 云端解答百科问题、讲故事等
会议系统
  • 本地信号处理、降噪
  • 云端转录会议内容、提炼大纲

开发资源

SDK icon SDK 下载 查看
Doc icon AIVoice 开发指南 查看
Doc icon 声源硬件设计要求 查看
App icon 云端平台参考:扣子 查看
Contact icon 联系我们 查看

推荐 IC 型号

特性 RTL8721Dx RTL8726E RTL8713E RTL8730E
AFE 单麦(识别模式) Y Y Y Y
AFE 单麦(通话模式) - Y Y Y
AFE 双麦(识别模式) - Y Y Y
AFE 三麦(识别模式) - Y Y Y
AEC(识别模式) Y Y Y Y
AEC(通话模式) - Y Y Y
BF(识别模式) - Y Y Y
BF(通话模式) - - - -
NS(识别模式) Y Y Y Y
NS(通话模式) - Y Y Y
AGC(识别模式) Y Y Y Y
AGC(通话模式) - Y Y Y
SSL(识别模式) - Y Y Y
SSL(通话模式) - - - -
KWS 固定唤醒词 Y Y Y Y
KWS 自定义唤醒词 - Y Y Y
VAD Y Y Y Y
ASR - Y Y Y