关键词:BLE, Audio, Opus
1、前言
在无线蓝牙领域,既能满足超低功耗,又能进行全双工语音通讯,一直是市场上的需
求,比如:无线门铃,短距离对讲机等应用。针对 BLE 语音相关的应用场景,ST 推出了FP-AUD-BVLINKWB1 这个软件包供客户评估。
本文将对这个软件包展开介绍,该软件包主要包含以下特性:
• 使用 Opus v1.3 编码和解码,通过 BLE 实现全双工立体音频流。
• 使用自定义 BlueVoiceOPUS 协议,通过 API 即可使用 Opus 功能。
• 源码包含数字音频捕获和处理。
• 可以通过 USB 进行音频流的回放。
• 可使用麦克风扩展板 X-NUCLEO-CCA02M2 + Nucleo 开发板 P-NUCLEO-WB55
的组合或者探索板 STM32WB5MM-DK。• 兼容 STBLESensor App。
• 免费开源。
感兴趣的话欢迎从以下网址下载该软件包进行评估:
https://www.st.com/en/embedded-software/fp-aud-bvlinkwb1.html
2、软件介绍
2.1. 软件架构
• Hardware Abstraction: 硬件抽象层,使用了 STM32 的 HAL 库提供底层的硬件驱动。
• BSP 层:在 HAL 层之上,提供了板级支持包,包含了 SPI, ADC, LED 和 User Button
等驱动。
• Middleware 层:中间件层,主要包含了以下内容:
o STM32 WPAN:提供 BLE,Thread,Zigbee 等协议相关的接口 API,本应用
只使用了 BLE 协议。
o USB Device:提供各种不同 USB device 类的实现,本应用中只使用了 USB
Audio 类。
o PDM Lib:提供了数字麦克风 PDM 信号到 PCM 信号转换的软件实现。
o OPUS:开源第三方的 OPUS 库,版本 v1.3。
2.2. Opus 简介
Opus 是完全开源免费的高通用性音频编解码协议,由 Internet Engineering Task
Force (IETF)标准化。
Opus 可以处理广泛的音频应用,包括 IP 语音、视频会议、游戏内聊天,甚至远程现场音乐表演。它可以从低比特率窄带语音缩放到非常高质量的立体声音乐,并且具备以下特点:
• 比特率范围:6kb /s 到 510 kb/s
• 采样率范围:8kHz(窄带)到 48kHz(全带) • 帧大小:2.5 ms 到 60 ms
• 比特率,采样率,可动态调节帧大小
• 支持固定比特率(CBR)和可变比特率(VBR)
• 支持语音和音乐
• 支持单声道和立体声
• 最多支持 255 个通道
• 良好的鲁棒性和丢包隐藏能力
• 支持浮点和定点
2.3. BlueVoiceOPUS 协议
BlueVoiceOPUS 是自定义协议,Central 和 Peripheral 是 GAP 层的角色,在点对点通讯中,主动发起连接请求的设备为 Central。在 GATT 协议中,Server 接受请求和命令,将数据保存在属性中。Client 实施服务发现流程,并向 Server 请求数据。
如果是单向的非对称语音系统,那么具备麦克风的设备可以定义为 Server,Cient 客户端可以主动或被动接收 Server 的语音数据流。
如图 2,FP-AUD-BVLINKWB1 提供了双向的系统,双方设备都具备语音的能力,所以双方都实现了 GATT Server 以及 Client 的角色。并且,Server 的语音数据基于
notification 性质,将以异步的方式主动发送给 Client。
2.3.1. BlueVoiceOPUS 服务
ATT 协议用于在设备中进行数据交换,ATT 的最小实体称为属性。GATT 服务由各种服务组成,其中服务由服务申明属性作为起始,每一个服务又包含若干特性,特性由任意属性或属性描述符组成。
表 1 是典型的 BLE 服务的属性表,其中包含了 1 个服务申明以及 3 个特性。Audio 特性用来通知对方设备音频数据。Ctrl 特性通知对方设备控制数据,比如播放,暂停等。Music 特性用来通知对方音乐数据,该特性只在 ST BLE Sensor APP 中实现,取代 Audio特性,用来传输压缩后的 48KHz 立体音乐。
2.3.2. BLUEVoiceOPUS 实现
在 Middleware 层,和 BlueVoiceOPUS 协议相关的文件包括:
• bvopus_service_stm:该文件管理所有和 BLE 相关的功能,包括添加服务和添加特性,以及数据的接收和发送。其中包含了一个简单的数据封包和解析协议。
• opus_interface_stm:该文件实现了 Opus 编码器和 BlueVoiceOPUS 服务的接口。提供简单的 API 用于 Opus 初始化,配置,数据压缩和解压等。
2.4. 应用层介绍
在软件包中包含了三个主要的工程:
• BVLCentral:作为主设备主动发起连接,并提供 BlueVoiceOPUS 服务。
• BVLPeripheral:作为从设备广播,并提供 BlueVoiceOPUS 服务。
• BVLPeripheral_FullBand:作为从设备广播,提供 BlueVoiceOPUS 服务, 可以通过BLE 接收立体声音乐,但目前只能和 ST BLE Sensor 相连。
BVLCentral 和 BVLPeripheral 分别烧录到 WB55 的开发板中,分别作为主机和从机,通过开启或停止音频通知,可以达到三种不同类型的通讯:单工,半双工和全双工。
• 当设备在输出音频流时,应用层负责语音的获取,数据压缩和封包,然后通过BlueVoiceOPUS 协议发送出去。
• 当设备在接收音频流时,应用层通过从 BlueVoiceOPUS 协议中接收 BLE 数据包,然后解包和解码 OPUS 语音数据。通过 P-NUCLEO-WB55 上的 SW1 控制打开或关闭语音流通道。通过 LED 显示设备的状态。
• 广播/发现状态:绿色 LED 闪烁
• 连接状态:蓝色 LED 缓慢闪烁
• 语音流状态:蓝色 LED 正常闪烁
• 接收状态:蓝色 LED 稳定点亮(不闪烁)
• 全双工状态:蓝色 LED 快速闪烁(双方设备)
BVLCentral 可以由 APP(ST BLE Sensor)代替,完成设备和手机端的全双工语音通讯。
整个应用流程如图 3 所示,整个流程介绍如下:• 从设备广播,主设备发起连接,直到连接建立成功。
• 双方互相完成服务和特性发现流程。
• 从设备通过按钮,请求打开特性通知,主设备打开通知,从设备发送语音流,此时状态为语音流状态。
• 相反地,主设备通过按钮,请求打开特性通知,从设备打开通知,主设备发送语音流,此时状态变为全双工状态。
• 可以通过按钮,开关语音流,改变语音流状态。
3、系统部署指导
3.1. 两块 STM32WB 开发板之间的全双工音频流
如上图 4 ,可以使用 P-NUCLEO-WB55 开发板与一块麦克风扩展板 X-NUCLEO-CCA02M2 进行组合。然后分别烧录 BVLCentral 工程和 BVLPeripheral 工程。当双方设备建立连接以后,通过 Nucleo 上的 SW1 按钮,就可以建立起半双工或全双工的语音流了。麦克风扩展板可以对语音信号以 8kHz 或 16kHz 进行采集,并通过 BlueVoiceOPUS 协议传输,当对方设备接收到语音数据后,通过 USB 保留到本地,然后使用 Audacity 或其他语音软件播放。
如上图 5,也可以使用 STM32WB5MM-DK 进行同样的操作,该开发板使用了 STM32WB5MM的模组,并且板载了一块 OLED 显示屏供开发。
当然也可以使用图 4 和图 5 的组合,只要一块烧录的是主机程序,另一块烧录的是从机程序即可。
3.2. STM32WB 开发板和手机之间的全双工音频流
除了上面的配置方法外,ST 还提供了 ST BLE Sensor 手机 APP 供测试。
如图 6,手机可以作为主设备,扫描然后连接 STM32WB55 开发板,建立全双工的音频流的 BLE 链路。语音信号可以从开发板采集,发送到手机侧进行播放。也可以从手机侧采集,发送到开发板后,再通过 USB 进行播放。
3.3. STM32WB 开发板和手机之间的立体声音乐播放
上面介绍的都是 8kHz/16kHz 的语音流,该软件包还提供了全带(Full-Band)的 48kHz 立体声音乐流方案。
图7. 48kHz 立体声音乐流方案
如图 7,手机扫描设备后,发起并建立连接,完成 GATT 服务发现流程,然后通过按钮打开特性的通知属性,建立全带音频流。APP 使用 OPUS 对手机内音乐进行压缩和封包,然后通过BLE 发送给开发板。开发板通过 USB 将数据导出到 PC 上,最后使用 Audacity 或其他语音软件进行播放或刻录。
© THE END
▽点击“阅读原文”,可下载原文档