# smart bigdata user behavior analysis **Repository Path**: donglab-zzu/smart-bigdata-user-behavior-analysis ## Basic Information - **Project Name**: smart bigdata user behavior analysis - **Description**: 本系统是面向企业的智能大数据用户行为分析平台,提供账号登录、核心指标看板、行为分析、留存分析、漏斗转化、热力图等功能,支持实时指标监控、多维度筛选、明细溯源与数据导出。可快速洞察用户活跃、新增、留存、转化全链路数据,助力运营定位瓶颈、优化策略,提升业务效率与用户价值。 - **Primary Language**: Unknown - **License**: MIT - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2026-04-09 - **Last Updated**: 2026-04-09 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 智能大数据用户行为分析系统 ## 项目简介 智能大数据用户行为分析系统(UBA)是一个基于Python + Flask + Pandas + Matplotlib的用户行为分析平台,用于帮助企业分析用户行为数据,提供核心指标看板、行为分析、事件分析、留存分析等功能。 ## 技术栈 - **后端**:Python 3.8+, Flask - **数据分析**:Pandas, NumPy - **数据可视化**:Matplotlib, Seaborn - **其他**:JSON, datetime ## 功能特性 - 📊 **核心指标看板**:DAU、MAU、新用户、留存率、转化率等 - 👤 **行为分析**:用户活动趋势、转化率趋势、漏斗分析 - 🎯 **事件分析**:事件指标、事件触发趋势、事件分布 - 🔄 **留存分析**:多日留存率、留存趋势 - 💾 **数据导出**:支持CSV、Excel格式 - 📈 **数据可视化**:热力图、折线图、柱状图、饼图 - 🌐 **RESTful API**:标准化接口设计 - 🧪 **模拟数据**:内置模拟数据生成功能 ## 快速开始 ### 1. 环境要求 - Python 3.8 或更高版本 - pip 包管理器 ### 2. 安装依赖 ```bash # 克隆项目后进入目录 cd 智能大数据 # 安装依赖 pip install -r requirements.txt ``` ### 3. 启动服务 ```bash # 方法1:直接运行 python src/app.py # 方法2:使用启动脚本(Linux/Mac) chmod +x run.sh ./run.sh ``` ### 4. 访问系统 服务启动后,可通过以下地址访问: - **首页**:http://localhost:5000/ - 系统概览和API端点列表 - **健康检查**:http://localhost:5000/health - 服务状态检查 ## API接口 ### 核心指标 - `GET /api/metrics` - 获取核心指标 - `GET /api/core_metrics` - 获取详细核心指标 ### 行为分析 - `GET /api/behavior/analysis` - 获取用户行为分析 - `GET /api/behavior/funnel` - 获取漏斗分析 ### 事件分析 - `GET /api/event/metrics` - 获取事件指标 - `GET /api/event/trend` - 获取事件触发趋势 - `GET /api/event/distribution` - 获取事件分布 ### 留存分析 - `GET /api/retention` - 获取留存率 - `GET /api/retention/details` - 获取留存详细数据 ## 项目结构 ``` 智能大数据/ ├── src/ # 主源码目录 │ ├── __init__.py │ ├── analyzer.py # 用户行为分析器(主类) │ ├── app.py # Flask入口、启动文件 │ ├── behavior.py # 行为分析接口 │ ├── calculator.py # DAU/MAU/留存/转化率计算 │ ├── config.py # 项目配置 │ ├── event.py # 事件分析接口 │ ├── metrics.py # 核心指标接口 │ ├── mock_data.py # 模拟数据生成 │ └── retention.py # 留存分析接口 ├── docs/ # 文档 │ └── user_manual.md # 操作手册精简版 ├── tests/ # 测试(简单示例) │ └── test_metrics.py ├── utils/ # 工具类 │ ├── __init__.py │ ├── export.py # Excel/CSV导出 │ └── visual.py # 绘图与图表工具 ├── .gitignore # Git忽略文件 ├── README.md # 项目说明(必须完整) ├── requirements.txt # 依赖清单 └── run.sh # 启动脚本(可选) ``` ## 核心模块说明 ### 1. 核心分析器 (`src/analyzer.py`) - `UserBehaviorAnalyzer` 类:用户行为分析的核心类,包含用户行为数据的管理和基础指标计算 - 提供用户数量、活跃用户、事件数量、平均会话时长等基础指标 ### 2. 指标计算器 (`src/calculator.py`) - `MetricsCalculator` 类:负责计算DAU、MAU、留存率、转化率、漏斗分析等高级指标 - 提供详细的用户行为分析功能 ### 3. 模拟数据生成 (`src/mock_data.py`) - 生成模拟的用户行为数据,用于系统演示和测试 - 可调整用户数量、时间范围等参数 ### 4. 接口模块 - `src/metrics.py`:核心指标接口 - `src/behavior.py`:行为分析接口 - `src/event.py`:事件分析接口 - `src/retention.py`:留存分析接口 ### 5. 工具类 - `utils/export.py`:提供数据导出功能,支持CSV和Excel格式 - `utils/visual.py`:提供数据可视化功能,生成各种图表 ## 配置管理 - `src/config.py`:项目配置文件,包含Flask配置、上传文件配置、数据配置等 - 支持开发环境和生产环境的配置切换 ## 测试 - `tests/test_metrics.py`:核心指标计算的单元测试 - 运行测试:`python -m unittest tests/test_metrics.py` ## 数据说明 - 系统使用内置的模拟数据进行演示 - 数据存储在内存中,重启服务后会重新生成 - 可扩展为从数据库、日志文件等读取真实数据 ## 扩展与定制 1. **数据源扩展**:修改 `src/analyzer.py` 中的 `UserBehaviorAnalyzer` 类,从数据库或文件读取真实数据 2. **指标扩展**:在 `src/calculator.py` 中的 `MetricsCalculator` 类中添加新的指标计算方法 3. **API扩展**:在 `src` 目录中添加新的接口模块文件 4. **可视化扩展**:在 `utils/visual.py` 中添加新的图表类型 ## 部署建议 - **开发环境**:直接运行 `python src/app.py` - **生产环境**:建议使用 Gunicorn 或 uWSGI 作为WSGI服务器,并配置 Nginx 作为反向代理 ## 依赖清单 - Flask:Web框架 - pandas:数据处理 - numpy:数值计算 - matplotlib:数据可视化 - seaborn:高级数据可视化 - openpyxl:Excel文件处理 ## 许可证 MIT License ## 贡献 欢迎提交Issue和Pull Request! ## 联系方式 - 项目主页:https://gitee.com/your-username/智能大数据 - 作者:智能大数据团队