# 语音心理训练器（AI辅助提升语言能力）

**Repository Path**: truman71/psy_ai_smile

## Basic Information

- **Project Name**: 语音心理训练器（AI辅助提升语言能力）
- **Description**: 语音训练器是一款基于人工智能的语音训练与心理特征分析软件，旨在帮助用户提升演讲、面试、汇报等场景下的表达能力和心理状态。
- **Primary Language**: Unknown
- **License**: Not specified
- **Default Branch**: main
- **Homepage**: None
- **GVP Project**: No

## Statistics

- **Stars**: 0
- **Forks**: 0
- **Created**: 2026-02-10
- **Last Updated**: 2026-03-03

## Categories & Tags

**Categories**: Uncategorized

**Tags**: 语音, 心理, AI辅助, 学习, 心理测试

## README

# 音商研究所

基于通义千问AI的语音训练与心理特征分析系统

## 技术栈

- **前端**: React 18 + Vite + TailwindCSS + React Router
- **后端**: Node.js + Express + SQLite
- **AI**: 通义千问API (qwen-max模型)
- **语音分析**: Librosa (Python语音特征提取)

## 功能模块

1. **注册**: 语音采集 + AI心理诊断
2. **训练**: 演讲/工作汇报/面试三场景实时语音分析，AI反馈（500字以内）
3. **心理测试**: 定期语音特征采集 + AI分析（500字以内）
4. **我的**: 数据展示与历史记录

## 快速开始

```bash
# 1. 安装依赖
npm install
cd backend && npm install
cd ../frontend && npm install

# 2. 配置后端环境变量
cd ../backend
cp .env.example .env
# 编辑.env文件，配置通义千问API Key

# 3. 启动服务
# 方式一：从根目录启动（同时启动前后端）
cd ..
npm run dev

# 方式二：分别启动
# 终端1 - 启动后端（端口3001）
cd backend && npm run dev

# 终端2 - 启动前端（端口3000）
cd frontend && npm run dev
```

## 环境配置

### 后端配置 (backend/.env)

```env
PORT=3001
TONGYI_API_KEY=sk-xxxxxxxxxxxxxxxxxxxxxxxx  # 您的通义千问API Key
DB_PATH=./database.sqlite
```

### 获取通义千问API Key

1. 访问 [阿里云百炼平台](https://bailian.console.aliyun.com/)
2. 开通通义千问服务
3. 创建API Key并复制到 `.env` 文件

## 项目结构

```
yinshang-institute/
├── backend/              # 后端服务
│   ├── src/
│   │   ├── config/       # 配置文件（数据库、AI API）
│   │   ├── routes/       # API路由
│   │   └── server.js     # 服务器入口
│   ├── database.sqlite   # SQLite数据库
│   └── package.json
├── frontend/             # 前端应用
│   ├── src/
│   │   ├── components/   # 组件
│   │   ├── pages/        # 页面
│   │   ├── store/        # 状态管理
│   │   └── services/     # API服务
│   └── package.json
├── start_backend.bat     # 后端启动脚本
├── start_react.bat       # 前端启动脚本
└── README.md
```

## AI模型配置

项目使用通义千问qwen-max模型，提供高质量的语音分析和心理评估：

- **训练反馈**: 从角色角度深入分析，字数不超过500字
- **心理测试**: 简洁清晰，直接指出核心特征，字数不超过500字

## 语音特征处理

项目只提交声音特征数据，不提交音频文件，保护用户隐私：

- 音高特征 (f0)
- 音强特征 (intensity)
- MFCC特征
- 节奏特征
- 谱熵特征

## API文档

### 认证相关

- `POST /api/auth/register` - 用户注册
- `POST /api/auth/login` - 用户登录

### 训练相关

- `GET /api/training/scenarios` - 获取训练场景列表
- `GET /api/training/scenario/:id` - 获取场景规则
- `POST /api/training/record` - 保存训练记录
- `GET /api/training/history/:userId` - 获取训练历史

### 心理测试相关

- `GET /api/psychological/texts` - 获取测试文本
- `POST /api/psychological/submit` - 提交心理测试
- `GET /api/psychological/history/:userId` - 获取测试历史

### 用户相关

- `GET /api/user/:userId` - 获取用户完整信息
- `PUT /api/user/settings` - 更新用户配置

## 移动端适配

- 响应式设计，完美适配各种手机屏幕
- 触摸友好的交互体验
- 毛玻璃效果和流畅动画

## 注意事项

1. 首次运行需要配置通义千问API Key
2. SQLite数据库会自动创建在backend目录
3. 开发模式下后端运行在 3001 端口，前端运行在 3000 端口
4. 训练录音停止后会自动提交AI分析

## 版本历史

- **v2.0.0** (2026-03-03): 项目更名为"音商研究所"，移除Streamlit前端，专注React开发
- **v1.1.0** (2026-02-12): 集成Librosa语音处理，添加训练反馈功能，AI模型升级至qwen-max
- **v1.0.0** (2026-02-09): 初始版本发布，包含核心功能

## License

MIT