同步操作将从 gmsh917/ESP32_Auduino_LLM 强制同步,此操作会覆盖自 Fork 仓库以来所做的任何修改,且无法恢复!!!
确定后同步将在后台操作,完成时将刷新页面,请耐心等待。
本项目基于ESP32实现了一个智能语音助手,主要特点:
讯飞服务(必需)
其它大模型服务(可选)
下载天问Block(http://www.twen51.com/new/twen51/index.php),可以在浏览器搜索教程。 打开天问Block->个人中心(登录)->使用数据线连接asrpro设备,鼠标移至未连接,选择一键安装驱动,安装完成后,未连接会变成对应的驱动->项目(打开项目)->选择我这个项目的asrpro文件夹中的“esp32AI助手.hd”打开->修改你想要的唤醒词(默认:你好九歌)和打断命令词(默认:九歌)->点击生成模型,等待完成->点击2M编译下载
使用vscode中的platformIO插件,天问Block
https://serial.keysking.com
设置参考:
模块引脚 | ESP32连接 | ESP32-S3连接 |
---|---|---|
VDD | 3.3V | 3.3V |
GND | GND | GND |
SD | GPIO22 | GPIO42 |
WS | GPIO15 | GPIO1 |
SCK | GPIO4 | GPIO2 |
模块引脚 | ESP32连接 | ESP32-S3连接 |
---|---|---|
Vin | VIN | V5IN |
GND | GND | GND |
LRC | GPIO27 | GPIO7 |
BCLK | GPIO26 | GPIO6 |
DIN | GPIO25 | GPIO5 |
模块引脚 | ESP32连接 | ESP32-S3连接 |
---|---|---|
VDD | VIN | V5IN |
GND | GND | GND |
SCL | GPIO18 | GPIO12 |
SDA | GPIO23 | GPIO11 |
RST | GPIO12 | GPIO15 |
DC | GPIO32 | GPIO16 |
CS | GPIO5 | GPIO10 |
模块引脚 | ESP32连接 | ESP32-S3连接 |
---|---|---|
5V | VIN | V5IN |
GND | GND | GND |
PB5 | RX2(GPIO16) | RX2(GPIO19) |
PB6 | TX2(GPIO17) | TX2(GPIO20) |
PA2 | GPIO19 | GPIO3 |
引脚 | ESP32连接 | ESP32-S3连接 |
---|---|---|
正极 | GPIO33 | GPIO38 |
负极 | GND | GND |
每次回答完毕后,会有提示音播放,提示音文件存储在esp32的SPIFFS中,存储方法:连接好esp32,然后依次点击图中指示的位置。
网络连接通过读取ESP32 flash的NVS中存储的Wi-Fi信息实现。设备启动后开始联网时,板载LED会闪烁,屏幕显示相应的连接状态信息。esp32处于无网状态时,ESP32启动AP模式,创建临时网络热点ESP32-Setup(初始密码为12345678)。手机或电脑连接此网络后,浏览器输入192.168.4.1,出现配置网页界面,通过该网页界面,即可进行网络的配置。
音乐播放白嫖了网易云的音乐服务器,通过如下的链接即可访问音乐文件(vip音乐不支持)。
https://music.163.com/song/media/outer/url?id=音乐数字id.mp3
音乐播放通过读取ESP32 flash的NVS中存储的音乐信息实现。esp32处于无网状态时,ESP32启动AP模式,创建临时网络热点ESP32-Setup(初始密码为12345678)。手机或电脑连接此网络后,浏览器输入192.168.4.1,出现配置网页界面,通过该网页界面,即可进行音乐信息的添加与删除。
需要注意的点:比较长的音乐名建议不要写全,因为stt不一定识别的出来,可能只能识别出一部分,然后就是尽量不要写英文名称,因为英文识别准确率太烂了。还有就是部分音乐播放到中间会重新开始播放,好像是网易云的问题。
通过相关的语音指令,可以实现音量的调节与显示,led灯的开关。在AI说话时,按下boot键说出调节音量和开关灯的指令,esp32做出对应的反应后会继续刚才没说完的话。
在音乐正在播放时,按下boot键说出”暂停播放”指令,即可暂停播放,再按下boot键说出”恢复播放”指令,即可恢复播放。
在和AI进行对话时,通过说出“切换模型”指令(要具体的说出切换为第几个大模型或者大模型具体的名字),目前可以在15款大模型之间进行切换。
使用一块1.8寸(128x160)RGB_TFT屏幕显示用户与大模型的对话内容等信息
开启dufs服务,配置好监听端口,esp32与开启dufs服务的设备需处于同一wifi下,使用唤醒词唤醒设备后,当设备处于待机状态或说话状态时,使用命令词丁真、坤坤、牢大即可触发对应的壁纸显示、语音和音乐。
setup初始化:
loop循环:
本项目基于 Esp32_VoiceChat_LLMs 改进开发
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。