🎤 微软语音合成工具,使用 Electron + Vue + ElementPlus + Vite 构建,将文字转为语音MP3。
hatTTS是专门为对话场景设计的文本转语音模型,例如LLM助手对话任务。它支持英文和中文两种语言。最大的模型使用了10万小时以上的中英文数据进行训练。在HuggingFace中开源的版本为4万小时训练且未SFT的版本.
一个基于云端语音识别的智能控制设备,类似于天猫精灵,小爱同学。采用的芯片为stm32f407,wm8978,esp8266。
基于websocket实现浏览器端文本、视频、语音的即时通讯,以及实时语音转文字