# ai-recording-assistant
**Repository Path**: lypyinping/ai-recording-assistant
## Basic Information
- **Project Name**: ai-recording-assistant
- **Description**: 基于阿里云通义听悟的 AI 录音助手全栈源码,支持语音转文字、AI 会议纪要、说话人识别、待办事项提取、金句精选等功能,内置套餐计费、推广分销、聚合支付,开箱即用,适合个人开发者快速搭建 AI 语音 SaaS 产品。技术栈:Spring Boot 3.5 + React 19 + MySQL + Redis。
- **Primary Language**: Unknown
- **License**: Not specified
- **Default Branch**: master
- **Homepage**: None
- **GVP Project**: No
## Statistics
- **Stars**: 0
- **Forks**: 1
- **Created**: 2026-05-06
- **Last Updated**: 2026-05-06
## Categories & Tags
**Categories**: Uncategorized
**Tags**: None
## README
# 🎙️ AI 录音助手
**智能语音转文字 · 会议记录 · AI 内容分析**
[](LICENSE)
[](mailto:lzfapi@163.com)
[](https://openjdk.org/projects/jdk/17/)
[](https://spring.io/projects/spring-boot)
[](https://react.dev/)
[](https://www.typescriptlang.org/)
**🌐 在线试用:[ailuyin.isqqw.com](https://ailuyin.isqqw.com/)**
---
## 📖 项目简介
AI 录音助手是一款基于阿里云通义听悟的智能音频处理平台,支持音视频文件上传、语音转文字、AI 内容分析(摘要、章节、待办事项、金句精选、说话人识别)等功能,并内置完整的用户体系、套餐计费、推广分销系统。
### 💡 适合哪些人使用
本项目是一套**开箱即用的商业级 SaaS 源码**,特别适合:
- **个人开发者 / 独立创业者** — 无需从零搭建,直接部署上线,快速切入 AI 语音赛道,考虑非公司团队使用,各服务支持个人申请
- **外包 / 接单开发者** — 完整前后端源码,二次开发效率极高,可快速交付客户
- **小团队创业** — 内置用户体系、计费、推广分销,核心商业闭环已打通,专注运营即可
- **AI 工具站创业者** — 语音转写 + AI 分析是当前高需求场景,市场空间大
### 🚀 商业化优势
- ✅ **完整商业闭环** — 注册、转写、付费、推广、提现全链路打通,部署即可运营
- ✅ **低启动成本** — 核心依赖阿里云通义听悟按量计费,无需自建 AI 模型,前期投入极低
- ✅ **自带裂变增长** — 内置四级推广分销体系,用户带用户,降低获客成本
- ✅ **前后端分离** — 后端 API 稳定,前端可按品牌需求自由定制 UI
- ✅ **移动端就绪** — 完整适配手机端,覆盖更广用户群体
- ✅ **可扩展性强** — 基于 RuoYi-Vue-Plus 企业级框架,权限、多租户、日志等基础设施完备
### ✨ 核心功能
**🎵 音频上传与转写**
- 支持 MP3、MP4、WAV、M4A、AAC、FLAC、OGG 等主流音视频格式
- 单文件最大支持 500MB,支持批量上传多个文件
- 实时显示上传进度与转写进度(双层进度监控)
- 对接阿里云通义听悟,高精度中文语音识别
**🤖 AI 智能分析**
- **全文摘要** — 自动提炼会议/录音核心内容
- **章节速览** — 按话题自动分段,快速定位关键内容
- **待办事项** — 自动提取会议中的行动项,支持完成状态管理
- **金句精选** — 提炼重要发言,支持情感标签(积极/中性/消极)
- **思维导图** — 基于 AntV G6 可视化展示内容结构
- **口语书面化** — 将口语化转写内容优化为书面表达
**👥 说话人识别**
- 自动区分多位说话人,按颜色区分显示
- 支持自定义说话人姓名,修改后全文同步更新
- 转写文本与说话人一一对应,时间轴精确定位
**🎧 音频播放**
- 内置 WaveSurfer.js 波形播放器,可视化音频波形
- 点击转写文本自动跳转到对应音频时间点
- 支持播放速度调节(0.5x ~ 2x)
**📁 录音管理**
- 文件夹分类管理,支持自定义文件夹颜色与图标
- 收藏标记、回收站、彻底删除
- 列表搜索、按日期/时长排序
- 会议标题与摘要自动生成,支持手动编辑
**📤 内容导出**
- 转写文本支持导出为 Word(.docx)文档
- 会议纪要一键导出
**💰 套餐与计费**
- 新用户赠送免费转写时长
- 多档套餐可选(按分钟包)
- 按需充值(按实际转写分钟数扣费)
- 余额明细流水查询
- 对接虎皮椒聚合支付(微信/支付宝),支持测试模式
**🔗 推广分销**
- 专属推广链接 + 邀请码
- 四级推广员体系(初级/中级/高级/VIP),佣金比例 10%~40%
- 被邀请人付费后自动计算佣金
- 佣金结算周期配置,支持申请提现
- 推广数据看板(推荐人数、有效用户、累计佣金)
**👤 用户体系**
- 手机号注册(短信验证码)/ 邮箱注册
- 修改昵称、头像上传
- 修改密码(自动清除其他设备登录态)
- 工作台数据统计(转写时长、文件数量、待办事项)
**📱 移动端适配**
- 完整响应式布局,适配手机与平板
- 移动端菜单、弹窗、播放器均针对触屏优化
---
## 🖼️ 界面预览
### 首页

### 录音列表

### 录音详情

### 会议纪要

### 工作台

### 套餐中心

### 推广中心

---
## 🏗️ 项目结构
```
git_ai_luyin/
├── server/ # 后端 Java 服务
│ ├── ruoyi-admin/ # 启动入口模块
│ ├── ruoyi-common/ # 公共组件(OSS、Redis、安全、日志等)
│ ├── ruoyi-modules/
│ │ ├── ruoyi-meeting/ # 核心业务:会议录音、AI分析、支付、推广
│ │ ├── ruoyi-system/ # 系统管理
│ │ └── ruoyi-generator/ # 代码生成
│ ├── ruoyi-extend/ # 扩展服务(监控、定时任务)
│ └── script/sql/ # 数据库初始化脚本
│
└── web/ # 前端 React 应用
├── src/
│ ├── pages/ # 页面组件
│ ├── components/ # 通用组件
│ ├── services/ # API 请求层
│ ├── hooks/ # 自定义 Hook
│ └── types/ # TypeScript 类型定义
└── public/
```
---
## 🛠️ 技术栈
### 后端
| 技术 | 版本 | 说明 |
|------|------|------|
| Java | 17 | 运行环境 |
| Spring Boot | 3.5.9 | 基础框架 |
| RuoYi-Vue-Plus | 5.5.2 | 基础脚手架 |
| MyBatis-Plus | 3.5.14 | ORM 框架 |
| Sa-Token | 1.44.0 | 认证授权 |
| Redis / Redisson | 3.52.0 | 缓存 / 分布式锁 |
| MySQL | 8.0+ | 主数据库 |
| 阿里云通义听悟 | - | 语音转写 AI 能力 |
| 阿里云 OSS | - | 音频文件存储 |
| 虎皮椒支付 | - | 聚合支付(微信/支付宝) |
### 前端
| 技术 | 版本 | 说明 |
|------|------|------|
| React | 19 | UI 框架 |
| TypeScript | 5.9 | 类型系统 |
| Vite | 7 | 构建工具 |
| Tailwind CSS | 4 | 样式框架 |
| shadcn/ui | - | 组件库(基于 Radix UI) |
| TanStack Query | 5 | 数据请求管理 |
| React Router | 7 | 路由 |
| WaveSurfer.js | 7 | 音频波形播放 |
| AntV G6 | 5 | 思维导图 |
---
## 🚀 快速开始
### 💰 部署成本参考
| 资源 | 说明 | 费用参考 |
|------|------|---------|
| 云服务器 | 2核4G,运行后端服务 | ≈ ¥50~100/月 |
| MySQL | 云数据库或自建 | ≈ ¥0~50/月 |
| Redis | 云缓存或自建 | ≈ ¥0~30/月 |
| 阿里云 OSS | 音频文件存储,按用量计费 | ≈ ¥0.12/GB/月 |
| 阿里云通义听悟 | 语音转写,按分钟计费 | ≈ ¥0.12/分钟(可转嫁用户) |
| 域名 + SSL | 可选 | ≈ ¥50~100/年 |
> 转写费用由用户付费承担,平台可设置合理溢价,**边运营边盈利**。
详细部署步骤请参考:
- **[后端部署文档](docs/DEPLOYMENT_SERVER.md)**
- **[前端部署文档](docs/DEPLOYMENT_WEB.md)**
- **[第三方服务配置指南](docs/THIRD_PARTY_SERVICES.md)**
- **[数据库初始化指南](docs/DATABASE_SETUP.md)**
### 环境要求
| 依赖 | 版本要求 |
|------|---------|
| JDK | 17+ |
| Maven | 3.8+ |
| MySQL | 8.0+ |
| Redis | 6.0+ |
| Node.js | 18.18+ |
| npm | 8.9+ |
---
## 📋 第三方服务依赖
运行本项目需要申请以下第三方服务:
| 服务 | 用途 | 申请地址 |
|------|------|---------|
| 阿里云通义听悟 | 语音转文字核心能力 | [tingwu.aliyun.com](https://tingwu.aliyun.com/) |
| 阿里云 OSS | 音频文件存储 | [aliyun.com/product/oss](https://www.aliyun.com/product/oss) |
| 虎皮椒支付(支持个人) | 微信/支付宝聚合支付 | [xunhupay.com](https://xunhupay.com/) |
| 短信服务(支持个人) | 手机号注册验证码 | [短信宝 smsbao.com](https://www.smsbao.com/)(默认)/ 阿里云 / 腾讯云 |
| 邮件服务(支持个人) | 邮箱注册验证码 | [阿里云邮件推送](https://www.aliyun.com/product/directmail)(推荐)/ 任意 SMTP |
---
## 🤝 贡献
欢迎提交 Issue 和 Pull Request。
---
## 📄 许可证
本项目基于 **GNU AGPL v3** 协议开源,并附加商业授权条款。
### 开源使用
个人学习、研究、非商业用途遵循 [AGPL v3](LICENSE) 即可免费使用。
### 商业授权
以下场景需要获得商业授权:
- 将本项目部署为 SaaS 平台并向用户收费
- 将本项目集成至闭源商业产品中
- 基于本项目进行二次开发并商业销售
- 企业内部商业部署
**联系获取商业授权:**
- 📧 邮箱:lzfapi@163.com
- 💬 微信:lizhongfeng1993
后端框架基于 [RuoYi-Vue-Plus](https://gitee.com/dromara/RuoYi-Vue-Plus)(MIT License)。
---
## 🙏 致谢
- [RuoYi-Vue-Plus](https://gitee.com/dromara/RuoYi-Vue-Plus) — 优秀的 Java 后端脚手架
- [阿里云通义听悟](https://tingwu.aliyun.com/) — 强大的语音 AI 能力
- [shadcn/ui](https://ui.shadcn.com/) — 精美的 React 组件库
---
## 🏷️ 关键词
`AI录音` `语音转文字` `会议记录` `音频转写` `智能会议纪要` `通义听悟` `语音识别` `AI助手`
`SaaS源码` `开源SaaS` `个人创业` `独立开发` `副业项目` `AI工具` `AI应用`
`Spring Boot` `React` `RuoYi` `若依` `前后端分离` `Java开源项目`
`会议管理系统` `录音管理` `音频分析` `摘要生成` `待办事项提取` `说话人识别`
`推广分销` `佣金系统` `裂变增长` `计费系统` `聚合支付` `虎皮椒支付`
`speech-to-text` `meeting-minutes` `audio-transcription` `ai-summary`