LiberSonora,寓意“自由的声音”,是一个 AI 赋能的、强大的、开源有声书工具集,包含智能字幕提取、AI标题生成、多语言翻译等功能,支持 GPU 加速、批量离线处理
使用 Deepseek + Cursor 开发 ❤
中文版 | English Version
项目官网及最新文档:https://libersonora.github.io/
📚 开源自由
🚀 便捷部署
🧩 模块化设计
🔧 灵活定制
💡 创新功能
项目的愿景是打造一个全方位的有声书生态系统,分三个阶段逐步实现:
🎯 解决的核心问题:
✨ 功能:
如果您对此感兴趣,可以到 🎧 全平台有声书播放器需求整理 提出想法
🎯 解决的核心问题:
✨ 功能:
✨ 功能:
⏳ 受个人时间和精力限制,项目进展可能较为缓慢。计划先实现一二期的核心功能,再逐步完善细节。
💖 如果您喜欢这个项目,欢迎赞助支持我们的开发!
有声书资源均来自互联网,仅供效果参考和学习,若有侵犯著作权利请联系我删除
若想转换你正在听的有声书,但又不想搭建环境,可以到 📚有声书转换体验区 留言
书名 | 下载链接 | 提取码 | 备注 |
---|---|---|---|
《资本论.马克思》 | https://pan.quark.cn/s/7d2e048b0747 | uhjP | 经典政治经济学著作,中文 |
《苦难辉煌.金一南》 | https://pan.quark.cn/s/b37fd2be9d50 | Mhud | 现代历史题材作品,中文 |
《毛泽东选集》 | https://pan.quark.cn/s/db5d332ca110 | 1Vvr | 中文 |
《Alice's Adventures in Wonderland.Lewis Carroll》 | https://pan.quark.cn/s/2699b5b63abc | FNx8 | 爱丽丝梦游仙境,源语言英语+标题英语+字幕自动翻译中文 |
《Romeo and Juliet.William Shakespeare》 | https://pan.quark.cn/s/27cb7de6f7ce | pjJ9 | 罗密欧与朱丽叶,源语言英语+标题英语+字幕自动翻译中文 |
语言 | 支持状态 | 备注 |
---|---|---|
中文(zh-CN) | ✅ 支持 | 源语言,翻译目标语言 |
英语(en) | ✅ 支持 | 源语言,翻译目标语言 |
日语(ja) | ✅ 支持 | 翻译目标语言 |
法语(fr) | ✅ 支持 | 翻译目标语言 |
德语(de) | ✅ 支持 | 翻译目标语言 |
注意:多语言字幕翻译功能依赖于本地大模型,翻译质量可能因模型版本和上下文理解能力而有所不同
软件名称 | 本地音乐 | 本地字幕支持 | 多语言字幕兼容 | 备注 |
---|---|---|---|---|
网易云音乐 | 支持 | 支持 | 兼容 | |
小米音乐 | 支持 | 支持 | 兼容 | 单语言字幕正常,但多语言字幕进度条会偏快 |
QQ音乐 | 支持 | 不支持 | 不兼容 | 只能云搜索歌词 |
酷狗音乐 | 支持 | 不支持 | 不兼容 | 只能云搜索歌词 |
酷我音乐 | 支持 | 不支持 | 不兼容 | 只能云歌词 |
汽水音乐 | 不支持 | 不支持 | 不兼容 | |
咪咕音乐 | 支持 | 不支持 | 不兼容 | |
喜马拉雅 | 不支持 | 不支持 | 不支持 | 不能导入 |
懒人听书 | 不支持 | 不支持 | 不支持 | 不能导入 |
番茄畅听 | 支持 | 不支持 | 不支持 | 导了两次,导入时不能选文件夹部分导入,卡崩了 |
蜻蜓FM | 不支持 | 不支持 | 不支持 | 不能导入 |
MacOS Apple Music | 支持 | 不支持 | 不支持 | 不能导入 lrc/src 音频 |
相比之下,目前的商业播放器在本地有声书播放场景上,还是网易云兼容性好点,但网易云的本地音乐没有进度记录或已播放的功能,切回到他的在线音乐之后很难找回进度,这也是想做全平台开源有声书播放器的原因之一
注:项目依赖安装和模型下载已配置国内镜像,但 docker 的代理得自行设置,安装速度取决于网速和服务器性能,安装依赖大概15分钟,推理模型下载取决于网速,一般十分钟内
克隆项目仓库:
git clone https://github.com/LiberSonora/LiberSonora
进入项目目录:
cd LiberSonora
启动 Docker 容器:
docker-compose -f docker-compose.gpu.yml up -d
查看容器运行日志:
docker-compose -f docker-compose.gpu.yml logs -f
访问用户界面:
打开浏览器,访问 xxx.xxx.xxx.xxx:8651
(将 xxx.xxx.xxx.xxx 替换为您的服务器 IP 地址)
API 端点:
API 服务可通过 xxx.xxx.xxx.xxx:8652
访问(将 xxx.xxx.xxx.xxx 替换为您的服务器 IP 地址)
项目名称 | 项目地址 | 用途 |
---|---|---|
ClearerVoice-Studio | https://github.com/modelscope/ClearerVoice-Studio | 移除背景音 |
FFmpeg | https://github.com/FFmpeg/FFmpeg | 音频转码 |
FunASR | https://github.com/modelscope/FunASR | 字幕提取 |
Ollama | https://github.com/ollama/ollama | 大模型推理 |
Qwen2.5 | https://github.com/QwenLM/Qwen2.5 | 大模型推理 |
MiniCPM | https://github.com/OpenBMB/MiniCPM | 大模型推理 |
Sanic | https://github.com/sanic-org/sanic | 对外暴露 API 接口 |
Streamlit | https://github.com/streamlit/streamlit | 页面交互 |
StreamlitAntdComponents | https://github.com/nicedouble/StreamlitAntdComponents | 页面交互,实现步骤条 |
项目主要包含三个核心服务:
services/streamlit: 负责提供用户界面和交互功能。
clear-voice: 用于音频背景音移除处理。
funasr: 处理语音识别和字幕生成。
克隆并进入项目目录:
git clone https://github.com/LiberSonora/LiberSonora
cd LiberSonora
启动开发环境:
docker-compose -f docker-compose.gpu.yml up -d
修改代码:
services/streamlit
目录下的代码,保存后 UI 会自动刷新。docker-compose -f docker-compose.gpu.yml restart {service}
通过以上步骤,您可以方便地进行开发和测试。记得及时提交您的更改并推送到代码仓库。
如果您在使用过程中遇到任何问题或有改进建议,欢迎通过以下方式反馈:
我们会认真查看每一个 issue,并尽快回复。
本项目采用 MIT 许可证。
您可以在项目根目录的 LICENSE
文件中查看完整的许可证文本。
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。