# interview-guide
**Repository Path**: SnailClimb/interview-guide
## Basic Information
- **Project Name**: interview-guide
- **Description**: 基于 Spring Boot 4.0 + Java 21 + Spring AI + PostgreSQL + pgvector + RustFS + Redis,实现简历智能分析、AI模拟面试、知识库RAG检索等核心功能。非常适合作为学习和简历项目,学习门槛低,帮助提升求职竞争力、主打就业的实战项目。
- **Primary Language**: Unknown
- **License**: AGPL-3.0
- **Default Branch**: master
- **Homepage**: https://javaguide.cn/zhuanlan/interview-guide.html
- **GVP Project**: No
## Statistics
- **Stars**: 355
- **Forks**: 175
- **Created**: 2025-12-26
- **Last Updated**: 2026-04-14
## Categories & Tags
**Categories**: Uncategorized
**Tags**: SpringAI, SpringBoot, JPA, Postgresql, Redis
## README
**智能 AI 面试官平台** - 基于大语言模型的简历分析和模拟面试系统
[](https://openjdk.org/)
[](https://spring.io/projects/spring-boot)
[](https://react.dev/)
[](https://www.typescriptlang.org/)
[](https://www.postgresql.org/)
---
## 项目介绍
InterviewGuide 是一个集成了简历分析、模拟面试(文字 + 语音)和知识库管理的智能面试辅助平台。系统利用大语言模型(LLM)、向量数据库和实时语音技术,为求职者和 HR 提供智能化的简历评估和面试练习服务。
## 系统架构

**异步处理流程**:
简历分析、知识库向量化和面试报告生成采用 Redis Stream 异步处理,这里以简历分析和知识库向量化为例介绍一下整体流程:
```
上传请求 → 保存文件 → 发送消息到 Stream → 立即返回
↓
Consumer 消费消息
↓
执行分析/向量化任务
↓
更新数据库状态
↓
前端轮询获取最新状态
```
状态流转: `PENDING` → `PROCESSING` → `COMPLETED` / `FAILED`。
## 配套教程
本项目承诺**完整功能免费开源**,也不会做所谓的 Pro 版或“付费解锁核心功能”之类的设计。
如果你想学习这个项目,或者希望把它作为个人项目经历 / 毕设选题,我也整理了一套相对细致的教程:从基础设施搭建、核心业务实现,到最后如何在面试中讲清楚思路与亮点,尽量把容易卡住的地方讲透。
如果你确实需要更系统的辅导,可以点这里了解详情(**教程为付费内容**,主要是想覆盖一些时间成本,望理解,感谢支持):[《SpringAI 智能面试平台+RAG 知识库》](https://javaguide.cn/zhuanlan/interview-guide.html)。
## 技术栈
### 后端技术
| 技术 | 版本 | 说明 |
| --------------------- | ----- | ----------------------------- |
| Spring Boot | 4.0.1 | 应用框架 |
| Java | 21 | 开发语言(虚拟线程) |
| Spring AI | 2.0.0-M4 | AI 集成框架 |
| PostgreSQL + pgvector | 14+ | 关系数据库 + 向量存储 |
| Redis + Redisson | 6+ / 4.0.0 | 缓存 + 消息队列(Stream) |
| Apache Tika | 2.9.2 | 文档解析 |
| iText 8 | 8.0.5 | PDF 导出 |
| MapStruct | 1.6.3 | 对象映射 |
| SpringDoc OpenAPI | 3.0.2 | API 接口文档 |
| DashScope SDK | 2.22.7 | 语音识别/合成(Qwen3 ASR/TTS)|
| WebSocket | - | 语音面试实时双向通信 |
| Gradle | 8.14 | 构建工具 |
技术选型常见问题解答:
1. 数据存储为什么选择 PostgreSQL + pgvector?PG 的向量数据存储功能够用了,精简架构,不想引入太多组件。
2. 为什么引入 Redis?
- Redis 替代 `ConcurrentHashMap` 实现面试会话的缓存。
- 基于 Redis Stream 实现简历分析、知识库向量化等场景的异步(还能解耦,分析和向量化可以使用其他编程语言来做)。不使用 [Kafka](https://javaguide.cn/high-performance/message-queue/kafka-questions-01.html) 这类成熟的消息队列,也是不想引入太多组件。
3. 构建工具为什么选择 Gradle?个人更喜欢用 Gradle,也写过相关的文章:[Gradle核心概念总结](https://javaguide.cn/tools/gradle/gradle-core-concepts.html)。
### 前端技术
| 技术 | 版本 | 说明 |
| ----------------- | ----- | -------------- |
| React | 18.3 | UI 框架 |
| TypeScript | 5.6 | 开发语言 |
| Vite | 5.4 | 构建工具 |
| Tailwind CSS | 4.1 | 样式框架 |
| React Router | 7.11 | 路由管理 |
| Framer Motion | 12.23 | 动画库 |
| Recharts | 3.6 | 图表库 |
| Lucide React | 0.468 | 图标库 |
| React Big Calendar| 1.19 | 面试日历组件 |
## 功能特性
### 简历管理模块
- **多格式解析**:支持 PDF、DOCX、DOC、TXT 等多种简历格式。
- **异步处理流**:基于 Redis Stream 实现异步简历分析,支持实时查看处理进度(待分析/分析中/已完成/失败)。
- **稳定性保障**:内置分析失败自动重试机制(最多 3 次)与基于内容哈希的重复检测。
- **分析报告导出**:支持将 AI 分析结果一键导出为结构化的 PDF 简历分析报告。
### 模拟面试模块
- **Skill 驱动出题**:内置 10+ 面试方向(Java 后端、阿里/字节/腾讯专项、前端、Python、算法、系统设计、测开、AI Agent 等),每个方向由 `SKILL.md` 定义考察范围、难度分布和参考知识库。
- **历史题目去重**:出题时自动排除已有会话中问过的题目,避免重复考察。
- **面试阶段时长联动**:总时长滑块拖动后,各阶段(自我介绍、技术考察、项目深挖、反问环节)按时比自动分配。
- **智能追问流**:支持配置多轮智能追问(默认 1 条),模拟多轮问答场景。
- **统一评估架构**:文字面试和语音面试共用同一套评估引擎(分批评估 + 结构化输出 + 二次汇总 + 降级兜底),评估结果可对比。
- **报告一键导出**:支持异步生成并导出详细的 PDF 模拟面试评估报告。
- **面试中心入口**:面试中心页整合文字面试和语音面试入口,支持继续面试和重新面试。
### 面试安排模块
- **邀请解析**:规则 + AI 双引擎,支持飞书/腾讯会议/Zoom 格式,自动提取公司、岗位、时间、会议链接
- **日历管理**:日/周/月视图 + 拖拽调整 + 列表视图
- **状态流转**:定时任务自动过期,手动标记待面试/已完成/已取消
- **面试提醒**:可配置提醒,避免错过面试
### 语音面试模块
实时语音对话面试,WebSocket + 千问3 语音模型(ASR/TTS/LLM 统一 API Key):
- **实时流式对话**:句子级并发 TTS,边生成边合成边播放,首包延迟 200ms
- **服务端 VAD**:自动断句,实时字幕(含中间结果)
- **回声防护 + 手动提交**:避免 AI 语音被误录入
- **多轮上下文记忆 + 暂停/恢复**:超时自动暂停
- **Micrometer 埋点**:TTS/ASR 延迟、会话时长等指标
> **已知问题**:端到端延迟偏高(服务端音频中转)、无耳机时回声泄漏、TTS 音色单一、弱网音频断续。后续计划探索 WebRTC、客户端 VAD 降噪、端到端语音模型等方案。
### 知识库管理模块
- **文档智能处理**:支持 PDF、DOCX、Markdown 等多种格式文档的自动上传、分块与异步向量化。
- **RAG 检索增强**:集成向量数据库,通过检索增强生成(RAG)提升 AI 问答的准确性与专业度。
- **流式响应交互**:基于 SSE(Server-Sent Events)技术实现打字机式流式响应。
- **智能问答对话**:支持基于知识库内容的智能问答,并提供直观的知识库统计信息。
### TODO
- [x] 问答助手的 Markdown 展示优化
- [x] 知识库管理页面的知识库下载
- [x] 异步生成模拟面试评估报告
- [x] Docker 快速部署
- [x] 添加 API 限流保护
- [x] 前端性能优化(RAG 聊天 - 虚拟列表)
- [x] 模拟面试增加追问功能
- [x] 语音面试功能(基于 Qwen3 实时语音模型)
- [x] 面试安排管理(智能解析 + 日历视图)
- [x] Skill 驱动出题(10+ 面试方向 + 参考知识库)
- [x] 统一面试评估架构(文字/语音共用评估引擎)
- [x] 面试历史题目去重
- [x] 面试中心页(整合文字/语音入口)
- [x] 语音面试 LLM 流式输出 + 句子级并发 TTS
- [x] 语音面试暂停/恢复 + 手动提交 + 回声防护
- [ ] 打通模拟面试和知识库
- [ ] 语音面试接入 WebRTC 降低延迟
- [ ] 语音面试支持更多 TTS 音色
## 效果展示
### 简历与面试
面试中心:

Skill 出题 + JD 解析:

简历库:

简历上传分析:

简历分析详情:

面试记录:

面试详情:

模拟面试:

面试安排

### 知识库
知识库管理:

问答助手:

## 项目结构
```
interview-guide/
├── app/ # 后端应用
│ ├── src/main/java/interview/guide/
│ │ ├── App.java # 主启动类
│ │ ├── common/ # 通用模块
│ │ │ ├── config/ # 配置类
│ │ │ ├── exception/ # 异常处理
│ │ │ └── result/ # 统一响应
│ │ ├── infrastructure/ # 基础设施
│ │ │ ├── export/ # PDF 导出
│ │ │ ├── file/ # 文件处理
│ │ │ ├── redis/ # Redis 服务
│ │ │ └── storage/ # 对象存储
│ │ └── modules/ # 业务模块
│ │ ├── interview/ # 模拟面试模块
│ │ ├── interviewschedule/ # 面试安排模块
│ │ ├── voiceinterview/ # 语音面试模块
│ │ ├── knowledgebase/ # 知识库模块
│ │ └── resume/ # 简历模块
│ └── src/main/resources/
│ ├── application.yml # 应用配置
│ └── prompts/ # AI 提示词模板
│
├── frontend/ # 前端应用
│ ├── src/
│ │ ├── api/ # API 接口
│ │ ├── components/ # 公共组件
│ │ ├── pages/ # 页面组件
│ │ ├── types/ # 类型定义
│ │ └── utils/ # 工具函数
│ ├── package.json
│ └── vite.config.ts
│
└── README.md
```
## 快速开始
环境要求:
| 依赖 | 版本 | 必需 | 说明 |
| ------------- | ---- | ---- | ---------------------------------------- |
| JDK | 21+ | 是 | 开发语言 |
| Node.js | 18+ | 是 | 前端构建 |
| Docker | - | 推荐 | 一键启动依赖服务(PostgreSQL/Redis/RustFS)|
> 如果不用 Docker,需要自行安装 PostgreSQL 14+(含 pgvector 扩展)、Redis 6+ 和 S3 兼容存储。
### 1. 克隆项目
```bash
git clone https://github.com/Snailclimb/interview-guide.git
cd interview-guide
```
### 2. 配置环境变量
后端通过环境变量读取配置,**`cp .env.example .env` 对 `./gradlew bootRun` 不生效**(`.env` 仅被 Docker Compose 识别),需要通过 `export` 设置。推荐写入 shell 配置文件永久生效:
```bash
# ⚠️ 必填:AI API 密钥(阿里云 DashScope,申请地址:https://bailian.console.aliyun.com/)
export AI_BAILIAN_API_KEY=your_api_key
# 可选:AI 模型(默认 qwen-plus,可改为 qwen-max、qwen-long 等)
export AI_MODEL=qwen-plus
```
**永久生效方法**(重启终端后仍然有效):
```bash
# macOS / Linux(zsh)
echo 'export AI_BAILIAN_API_KEY=your_api_key' >> ~/.zshrc
source ~/.zshrc
# Linux(bash)
echo 'export AI_BAILIAN_API_KEY=your_api_key' >> ~/.bashrc
source ~/.bashrc
```
### 3. 启动依赖服务(可选)
项目提供了 `docker-compose.dev.yml`,可一键启动 PostgreSQL、Redis、RustFS(S3 兼容存储)三个依赖:
```bash
# 启动依赖服务
docker compose -f docker-compose.dev.yml up -d
# 停止依赖服务
docker compose -f docker-compose.dev.yml down
# 停止并清除数据
docker compose -f docker-compose.dev.yml down -v
```
启动后默认账号:
| 服务 | 地址 | 账号 | 密码 |
| ------------ | ---------------- | --------------- | --------------- |
| PostgreSQL | `localhost:5432` | `postgres` | `123456` |
| Redis | `localhost:6379` | - | - |
| RustFS 控制台 | `localhost:9001` | `rustfsadmin` | `rustfsadmin` |
> **注意**:首次启动后需浏览器访问 [http://localhost:9001](http://localhost:9001) 登录 RustFS 控制台,手动创建名为 `interview-guide` 的 Bucket。如果本地已有 MinIO 或其他 S3 兼容存储,也可以直接使用,在 `application.yml` 中修改对应的连接配置即可。
### 4. 启动应用
**后端:**
```bash
./gradlew bootRun
```
后端服务启动于 `http://localhost:8080`
**前端:**
```bash
cd frontend
pnpm install
pnpm dev
```
前端服务启动于 `http://localhost:5173`
## Docker 快速部署
本项目提供了完整的 Docker 支持,可以一键启动所有服务(前后端、数据库、中间件)。
Docker Compose 编排了 6 个服务:PostgreSQL(pgvector)、Redis、MinIO(S3 兼容存储)、MinIO Bucket 初始化、Spring Boot 后端、React 前端(Nginx)。数据通过 Docker 命名卷持久化,`docker-compose down` 不会丢失数据。
### 1. 前置准备
- 安装 [Docker](https://www.docker.com/products/docker-desktop/) 和 Docker Compose
- 申请阿里云百炼 API Key(用于 AI 对话功能,申请地址:)
### 2. 快速启动
在项目根目录下执行:
`.env.example` 中的 PostgreSQL、Redis、MinIO 已与 `docker-compose.yml` 对齐(数据库用户 `postgres` / 密码 `password`,MinIO `minioadmin` / `minioadmin`)。复制为 `.env` 后主要填写 `AI_BAILIAN_API_KEY`;若你曾在旧版本中使用过不同的库密码或对象存储密钥,请同步修改 `.env`,必要时重建 Postgres 卷以免旧数据与密码不一致。
```bash
# 1. 复制环境变量配置文件
cp .env.example .env
# 2. 编辑 .env 文件,填入 AI 配置
# vim .env
# 必填:AI_BAILIAN_API_KEY=your_key_here
# 可选:AI_MODEL=qwen-plus # 默认值为 qwen-plus
# # 也可以改为 qwen-max、qwen-long 等其他可用模型
#
# 多 LLM 提供商支持(可选):
# APP_VOICE_INTERVIEW_LLM_PROVIDER=dashscope # 默认使用 DashScope
# # 也支持:minimax, openai, deepseek, lmstudio
# # 如需使用其他提供商,请参考 .env.example 中的配置说明
#
# 面试参数配置(可选):
# APP_INTERVIEW_FOLLOW_UP_COUNT=1 # 每个主问题生成追问数量(默认 1)
# APP_INTERVIEW_EVALUATION_BATCH_SIZE=8 # 回答评估分批大小(默认 8)
# 3. 构建并启动所有服务
docker-compose up -d --build
```
> **仅启动依赖服务**:如果只想本地开发调试(用 `./gradlew bootRun` 启动后端),可以只启动基础设施:`docker compose up -d postgres redis minio createbuckets`。将 `.env.example` 复制为 `.env` 并填写 `AI_BAILIAN_API_KEY` 即可,默认账号与 `docker-compose.yml` 一致。
### 3. 服务访问
启动完成后,您可以通过以下地址访问各个服务:
| 服务 | 地址 | 默认账号 | 默认密码 | 说明 |
| ---------------- | ---------------------------------------------- | ------------ | ------------ | ---------------------- |
| **前端应用** | [http://localhost](http://localhost) | - | - | 用户访问入口 |
| **后端 API** | [http://localhost:8080](http://localhost:8080) | - | - | RESTful API |
| **接口文档** | [http://localhost:8080/swagger-ui.html](http://localhost:8080/swagger-ui.html) | - | - | SpringDoc/Swagger UI |
| **MinIO 控制台** | [http://localhost:9001](http://localhost:9001) | `minioadmin` | `minioadmin` | 对象存储管理 |
| **MinIO API** | `localhost:9000` | - | - | S3 兼容接口 |
| **PostgreSQL** | `localhost:5432` | `postgres` | `password` | 数据库 (包含 pgvector) |
| **Redis** | `localhost:6379` | - | - | 缓存与消息队列 |
### 4. 常用运维命令
```bash
# 查看服务状态
docker-compose ps
# 查看后端日志
docker-compose logs -f app
# 拉取新代码后重新构建部署
docker-compose up -d --build
# 停止并移除所有服务(数据保留在 Docker 卷中)
docker-compose down
# 停止服务并清除数据卷(慎用,会删除数据库和文件)
docker-compose down -v
# 清理无用镜像(构建产生的中间层)
docker image prune -f
```
## 使用场景
| 用户角色 | 使用场景 |
| --------------- | -------------------------------------- |
| **求职者** | 上传简历获取分析建议,进行模拟面试练习 |
| **HR/招聘人员** | 批量分析简历,评估候选人能力 |
| **培训机构** | 提供面试培训服务,管理知识库资源 |
## 常见问题
### Q: 数据库表创建失败/数据丢失
检查 JPA 的 `ddl-auto` 配置。`ddl-auto` 模式对比:
| 模式 | 行为 | 适用场景 | 数据保留 |
| -------- | ------------------------------- | ------------- | -------- |
| **update** | 智能模式:表不存在自动创建,存在则增量更新 | **开发环境(推荐)** | ✅ 保留 |
| create | 无条件删除并重建所有表 | 仅首次建表时使用 | ❌ 删除 |
| validate | 只验证,不修改 | 生产环境 | ✅ 保留 |
| none | 什么都不做 | 生产环境 | ✅ 保留 |
**推荐配置(已默认)**:
```yaml
jpa:
hibernate:
ddl-auto: update # 首次启动自动创建表,后续保留数据并增量更新
```
⚠️ **注意**:避免使用 `create` 模式,否则每次重启都会删除所有数据!
### Q: 知识库向量化失败
当 `initialize-schema: false` 时,Spring AI **不会自动创建** `vector_store` 表。
```java
spring:
ai:
vectorstore:
pgvector:
initialize-schema: true
```
建议开发环境设置为 true,方便快速启动。生产环境设置为 false,手动管理数据库 schema,避免意外变更。
### Q: 简历分析失败
检查一下阿里云 DashScope API KEY 是否配置正确(申请地址:)。
### Q: 简历分析一直显示"分析中"?
检查 Redis 连接和 Stream Consumer 是否正常运行。查看后端日志确认是否有错误。
### Q: PDF 导出失败或中文显示异常?
项目已内置中文字体(珠圆玉润仿宋),支持跨平台导出。如遇到问题,请检查:
- 字体文件是否存在:`app/src/main/resources/fonts/ZhuqueFangsong-Regular.ttf`
- 检查日志中的字体加载信息
- 确认 iText 依赖是否正确
### Q: Windows PowerShell 下后端日志中文乱码?
**原因简述**:后端与 Logback 按 **UTF-8** 输出日志;中文 Windows 下控制台默认多为 **GBK(代码页 936)**,且 PowerShell 的 `$OutputEncoding`、控制台编码若未统一为 UTF-8,显示时就会把同一串字节解释错,出现乱码。
**本项目已做的配置**(一般无需再改):根目录 `gradle.properties`(Gradle 进程 UTF-8)、`app/src/main/resources/logback-spring.xml`(控制台日志 UTF-8)、`app/build.gradle` 中 `bootRun` 的 JVM 参数(含 `file.encoding` / `stdout.encoding` / `stderr.encoding`)。
**仍乱码时(PowerShell 侧)**:在启动 `./gradlew bootRun` 的同一终端先执行下面一段;或写入 **PowerShell 配置文件**(`$PROFILE`)以便每次自动生效:
```powershell
chcp 65001 | Out-Null
[Console]::OutputEncoding = [System.Text.UTF8Encoding]::new($false)
[Console]::InputEncoding = [System.Text.UTF8Encoding]::new($false)
$OutputEncoding = [System.Text.UTF8Encoding]::new($false)
```
新建或编辑配置文件:`if (!(Test-Path $PROFILE)) { New-Item -Path $PROFILE -ItemType File -Force }`,再 `notepad $PROFILE` 将上述内容粘贴保存;新开终端后生效,或执行 `. $PROFILE` 立即加载。若提示脚本无法执行,可执行一次:`Set-ExecutionPolicy -Scope CurrentUser -ExecutionPolicy RemoteSigned`。
在 PowerShell 中建议使用 `.\gradlew.bat :app:bootRun`(或仓库根目录的 `.\gradlew.bat`),避免与执行策略、路径解析相关的问题。
## 贡献
欢迎提交 Issue 和 Pull Request!
## 许可证
AGPL-3.0 License(只要通过网络提供服务,就必须向用户公开修改后的源码)