大模型语音交互方案

概述

Realtek 提供了离在线结合的大模型语音交互的解决方案,通过本地芯片的高效语音处理与云端大模型的认知能力协同,提升了人机交互体验。

solution_smtvoice_system

方案优势

亮点

高速稳定 Wi-Fi 赋能芯片语音交互

  • 支持多种网络传输协议,适配不同云端服务商

  • 高吞吐量和低延时,AI 应答快速响应

  • 网络稳定性高,AI 对话更流畅

专业灵活的多媒体框架

  • 支持多种格式音频播放

  • 高品质音频,完美畅听体验

  • 灵活多样的接口,兼容不同场景需求

本地 AI 算法功能全面覆盖

  • AFE(声学前端):包含回声消除、波束成形、噪声抑制、自动增益、声源定位等信号处理

  • KWS(唤醒词检测):支持固定唤醒词和用户自定义唤醒词, 本地精准快速响应

  • VAD(语音端点检测):准确检测语音或静音,提高识别可靠性

  • ASR(语音识别):支持离线语音指令识别,实时响应本地控制

应用场景

Realtek 大模型语音交互方案广泛应用于以下场景:

场景

方案

智能家居

  • 本地快速响应设备控制,如灯光、窗帘、空调等

  • 云端回复天气、菜谱、新闻等

智能玩具

  • 本地快速响应设备控制,如播放、音量操作等

  • 云端解答百科问题、讲故事等

会议系统

  • 本地信号处理、降噪

  • 云端转录会议内容、提炼大纲

软件开发资源

硬件开发资源

推荐 IC 型号

特性

RTL8721Dx

RTL8726E

RTL8713E

RTL8730E

AFE 单麦(识别模式)

Y

Y

Y

Y

AFE 单麦(通话模式)

-

Y

Y

Y

AFE 双麦(识别模式)

-

Y

Y

Y

AFE 三麦(识别模式)

-

Y

Y

Y

AEC(识别模式)

Y

Y

Y

Y

AEC(通话模式)

-

Y

Y

Y

BF(识别模式)

-

Y

Y

Y

BF(通话模式)

-

-

-

-

NS(识别模式)

Y

Y

Y

Y

NS(通话模式)

-

Y

Y

Y

AGC(识别模式)

Y

Y

Y

Y

AGC(通话模式)

-

Y

Y

Y

SSL(识别模式)

-

Y

Y

Y

SSL(通话模式)

-

-

-

-

KWS 固定唤醒词

Y

Y

Y

Y

KWS 自定义唤醒词

-

Y

Y

Y

VAD

Y

Y

Y

Y

ASR

-

Y

Y

Y