# 影评情感分析与推荐系统 **Repository Path**: tukc/work ## Basic Information - **Project Name**: 影评情感分析与推荐系统 - **Description**: 期末作业 - **Primary Language**: Python - **License**: MulanPSL-2.0 - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2026-01-04 - **Last Updated**: 2026-01-04 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 影评情感分析与推荐系统 本项目是一个基于 Python 的端到端影评处理平台,涵盖了数据采集、清洗预处理、情感分析、机器学习推荐以及前端可视化展示。 ## 项目结构 - `data/`: 存储原始数据和处理后的 CSV 文件。 - `src/`: 核心算法模块。 - `data_generator.py`: 筛选1000 条影评数据。 - `data_processing.py`: 使用 jieba 进行中文分词和数据清洗。 - `sentiment_analysis.py`: 使用 SnowNLP 进行情感打分(0-1)和分类。 - `recommendation.py`: 基于 TF-IDF 和余弦相似度的电影推荐模型。 - `templates/`: Flask 前端模板。 - `app.py`: Flask 后端服务,提供 API 接口。 - `main.py`: 项目启动脚本,一键运行全流程。 - `requirements.txt`: 项目依赖库。 ## 关键技术 1. **数据清洗**: 使用 `pandas` 和 `jieba` 进行中文文本分词及停用词过滤。 2. **情感分析**: 利用 `SnowNLP` 计算影评情感倾向分数,量化用户主观评价。 3. **推荐算法**: 基于内容的推荐(Content-based Filtering),通过计算电影评论向量的余弦相似度推荐同类电影。 4. **可视化**: 前端使用 `ECharts` 绘制情感分布饼图和电影排行柱状图,使用 `Tailwind CSS` 构建响应式界面。 ## 运行指南 1. **安装依赖**: ```bash pip install -r requirements.txt ``` 2. **一键启动**: ```bash python main.py ``` 该脚本会自动生成数据、处理数据并启动 Web 服务器。 3. **访问系统**: 在浏览器打开 `http://127.0.0.1:5000` 即可使用。 ## 创新点 - **端到端流程**: 从底层数据生成到顶层应用展示的完整链路。 - **实时分析**: 支持用户输入自定义影评并实时返回情感分析结果和推荐列表。 - **直观展示**: 整合了多维度的可视化图表,体现数据驱动决策的思想。