# 语音心理训练器(AI辅助提升语言能力) **Repository Path**: truman71/psy_ai_smile ## Basic Information - **Project Name**: 语音心理训练器(AI辅助提升语言能力) - **Description**: 语音训练器是一款基于人工智能的语音训练与心理特征分析软件,旨在帮助用户提升演讲、面试、汇报等场景下的表达能力和心理状态。 - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: main - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2026-02-10 - **Last Updated**: 2026-03-03 ## Categories & Tags **Categories**: Uncategorized **Tags**: 语音, 心理, AI辅助, 学习, 心理测试 ## README # 音商研究所 基于通义千问AI的语音训练与心理特征分析系统 ## 技术栈 - **前端**: React 18 + Vite + TailwindCSS + React Router - **后端**: Node.js + Express + SQLite - **AI**: 通义千问API (qwen-max模型) - **语音分析**: Librosa (Python语音特征提取) ## 功能模块 1. **注册**: 语音采集 + AI心理诊断 2. **训练**: 演讲/工作汇报/面试三场景实时语音分析,AI反馈(500字以内) 3. **心理测试**: 定期语音特征采集 + AI分析(500字以内) 4. **我的**: 数据展示与历史记录 ## 快速开始 ```bash # 1. 安装依赖 npm install cd backend && npm install cd ../frontend && npm install # 2. 配置后端环境变量 cd ../backend cp .env.example .env # 编辑.env文件,配置通义千问API Key # 3. 启动服务 # 方式一:从根目录启动(同时启动前后端) cd .. npm run dev # 方式二:分别启动 # 终端1 - 启动后端(端口3001) cd backend && npm run dev # 终端2 - 启动前端(端口3000) cd frontend && npm run dev ``` ## 环境配置 ### 后端配置 (backend/.env) ```env PORT=3001 TONGYI_API_KEY=sk-xxxxxxxxxxxxxxxxxxxxxxxx # 您的通义千问API Key DB_PATH=./database.sqlite ``` ### 获取通义千问API Key 1. 访问 [阿里云百炼平台](https://bailian.console.aliyun.com/) 2. 开通通义千问服务 3. 创建API Key并复制到 `.env` 文件 ## 项目结构 ``` yinshang-institute/ ├── backend/ # 后端服务 │ ├── src/ │ │ ├── config/ # 配置文件(数据库、AI API) │ │ ├── routes/ # API路由 │ │ └── server.js # 服务器入口 │ ├── database.sqlite # SQLite数据库 │ └── package.json ├── frontend/ # 前端应用 │ ├── src/ │ │ ├── components/ # 组件 │ │ ├── pages/ # 页面 │ │ ├── store/ # 状态管理 │ │ └── services/ # API服务 │ └── package.json ├── start_backend.bat # 后端启动脚本 ├── start_react.bat # 前端启动脚本 └── README.md ``` ## AI模型配置 项目使用通义千问qwen-max模型,提供高质量的语音分析和心理评估: - **训练反馈**: 从角色角度深入分析,字数不超过500字 - **心理测试**: 简洁清晰,直接指出核心特征,字数不超过500字 ## 语音特征处理 项目只提交声音特征数据,不提交音频文件,保护用户隐私: - 音高特征 (f0) - 音强特征 (intensity) - MFCC特征 - 节奏特征 - 谱熵特征 ## API文档 ### 认证相关 - `POST /api/auth/register` - 用户注册 - `POST /api/auth/login` - 用户登录 ### 训练相关 - `GET /api/training/scenarios` - 获取训练场景列表 - `GET /api/training/scenario/:id` - 获取场景规则 - `POST /api/training/record` - 保存训练记录 - `GET /api/training/history/:userId` - 获取训练历史 ### 心理测试相关 - `GET /api/psychological/texts` - 获取测试文本 - `POST /api/psychological/submit` - 提交心理测试 - `GET /api/psychological/history/:userId` - 获取测试历史 ### 用户相关 - `GET /api/user/:userId` - 获取用户完整信息 - `PUT /api/user/settings` - 更新用户配置 ## 移动端适配 - 响应式设计,完美适配各种手机屏幕 - 触摸友好的交互体验 - 毛玻璃效果和流畅动画 ## 注意事项 1. 首次运行需要配置通义千问API Key 2. SQLite数据库会自动创建在backend目录 3. 开发模式下后端运行在 3001 端口,前端运行在 3000 端口 4. 训练录音停止后会自动提交AI分析 ## 版本历史 - **v2.0.0** (2026-03-03): 项目更名为"音商研究所",移除Streamlit前端,专注React开发 - **v1.1.0** (2026-02-12): 集成Librosa语音处理,添加训练反馈功能,AI模型升级至qwen-max - **v1.0.0** (2026-02-09): 初始版本发布,包含核心功能 ## License MIT