# first-python-demo **Repository Path**: wangxiaoxiaocode/first-python-demo ## Basic Information - **Project Name**: first-python-demo - **Description**: 【聊天记录深度分析系统】你的第一个Python示例代码,适合零基础新手。 - **Primary Language**: Unknown - **License**: MIT - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 1 - **Forks**: 1 - **Created**: 2025-12-02 - **Last Updated**: 2026-01-05 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README ### 聊天记录深度分析系统 _ 专为职场人与学生打造的Python数据分析实战项目 | 一键生成专业级分析报告_ - 一、项目价值:精准解决情侣聊天分析的核心痛点 基于情感关系与数据分析的双重视角,我发现多数情侣在关系复盘时,常面临“感性认知为主、缺乏量化依据、互动模式模糊”的问题。本项目通过标准化流程设计,为情侣关系分析提供三大核心价值: - 「量化关系互动」:将情侣聊天记录转化为可落地的数据分析结果,用客观数据呈现双方的参与度、沟通频率、情感倾向,规避“凭感觉判断”的主观偏差; - 「清晰互动模式」:自动梳理聊天中的情感动态、活跃时段、沟通风格,帮你看清彼此的相处节奏,识别关系中的亮点与待优化点; - 「可视化复盘报告」:一键生成交互式分析报告,包含聊天趋势、情感解读等核心内容,可作为情侣间理性沟通、深度了解彼此的重要参考。 核心逻辑:输入情侣聊天记录Excel文件,系统自动完成“数据清洗→互动统计→可视化生成→情感深度解读→报告输出”全流程,全程无需人工干预,让关系分析更理性、更精准。 - 二、文件结构与核心功能 chat-academic-analyzer/ ├── chat_analyzer.py # 主程序文件(核心执行脚本) ├── your_chat_data.xlsx # 聊天记录数据源(需用户自备,Excel格式) ├── analysis_results/ # 自动生成的结果目录 │ └── academic_analysis_report.html # 最终输出的交互式分析报告 └── README.md # 项目使用说明文档 核心功能亮点(适配情侣场景) 1. 智能数据适配:自动识别Excel文件中的发送者、时间、内容字段,无需手动整理数据格式,兼容微信、QQ等主流聊天工具的导出规范; 2. 情感导向分析框架:集成情感心理学相关理论,从情感基调、表达习惯、支持模式、冲突处理、亲密度表现五大维度,输出贴合情侣场景的深度解读; 3. 生活化可视化:生成6类核心图表(每日聊天趋势、双方参与度分布、消息长度特征、活跃时段热力图等),配色简洁清晰,附带易懂的解读,非专业人士也能轻松看懂; 4. 隐私安全优先:所有数据仅在本地处理,聊天记录不会上传至任何服务器,API调用仅传输少量文本样本用于分析,全程保障隐私安全。 - 三、标准化操作指南(零门槛上手) 以下流程经过多轮验证,严格按步骤执行即可确保运行成功。所有操作均无需专业编程基础,聚焦“执行动作”而非“技术原理”。 步骤1:配置Python基础环境 若未安装Python,需先完成环境搭建: 1. 访问Python官网,下载并安装「3.8~3.11版本」(推荐3.9,兼容性最优); 2. 安装时必须勾选「Add Python to PATH」(关键步骤,缺失会导致后续命令执行失败); 3. 验证安装:打开命令提示符(Windows)/终端(Mac),输入python --version,若显示版本号则配置成功。 步骤2:安装依赖库 打开命令提示符/终端,复制以下命令并回车执行,等待所有库安装完成(出现“Successfully installed”即代表成功): pip install pandas numpy matplotlib seaborn jieba wordcloud requests fpdf 注:若出现网络超时,可重复执行命令;若提示“权限不足”,Windows系统可右键命令提示符选择“以管理员身份运行”,Mac系统在命令前添加sudo。 步骤3:获取DeepSeek API Key(核心授权) 深度分析功能依赖DeepSeek大模型,需获取个人专属API密钥(免费额度满足个人使用需求): 1. 访问DeepSeek官网,使用手机号完成注册/登录(国内用户直接支持,无需科学上网); 2. 登录后点击右上角头像,选择「API密钥」/「Keys管理」,点击「创建新密钥」; 3. 生成后复制密钥(以“sk-”开头的字符串),妥善保存(密钥为个人隐私,不可泄露,丢失需及时重置)。 步骤4:准备聊天记录数据源 聊天记录获取方式如下图: ![输入图片说明](22.png)![输入图片说明](33.png) 需按以下规范整理Excel文件(.xlsx格式),否则会导致数据识别失败: 关键规范: - 表头必须严格为「聊天对象、日期时间、聊天内容」(一字不差,区分中英文符号); - 文件需与主程序(academic_chat_analyzer.py)放在同一目录; - 文件名建议使用英文/数字(如“chat_data.xlsx”),避免中文或特殊符号。 步骤5:配置API密钥 用记事本/VS Code打开主程序文件(chat_analyzer.py),定位到文件末尾: if __name__ == "__main__": DEEPSEEK_API_KEY = "你的API 密钥" # 请替换为您的实际API密钥 CHAT_FILE_PATH = None # 设置为None自动查找,或指定具体文件路径 将「DEEPSEEK_API_KEY」后的字符串替换为步骤3获取的个人API密钥(保留前后引号,不可多删/多加字符),替换后按「Ctrl+S」保存文件。 步骤6:运行程序 1. 确认Excel数据源与主程序在同一目录; 2. 在该目录空白处按住「Shift」键+右键,选择「在此处打开命令窗口」(Windows)/「打开终端」(Mac); 3. 输入以下命令并回车: python academic_chat_analyzer.py 1. 按系统引导操作:① 输入Excel文件序号;② 输入工作表序号; 2. 等待分析完成:系统会显示「正在调用DeepSeek API进行分析...」,无需操作,数据量较大时需等待1~3分钟。 步骤7:查看分析报告 分析完成后,目录会自动生成「analysis_results」文件夹,打开该文件夹,双击「academic_analysis_report.html」文件(默认用浏览器打开),即可查看完整报告: - 核心数据概览:总消息数、分析时长、参与度占比等关键指标卡片; - 可视化图表:6类专业图表+分析师视角解读; - 学术深度分析:基于沟通理论的多维度解读; - 报告支持截图、打印,可直接用于职场汇报或学术复盘。 - 四、技术栈与拓展应用场景 核心技术栈 均为商业数据分析职场高频工具,掌握后可直接迁移至工作场景: - 数据处理:Pandas(数据清洗、统计)、NumPy(数值计算); - 可视化:Matplotlib(基础图表)、Seaborn(商业级配色与布局); - 文本处理:Jieba(中文分词)、WordCloud(词云生成,可选扩展); - 大模型集成:DeepSeek API(文本深度分析); - 报告生成:HTML+CSS(交互式报告,适配多终端)。 拓展应用场景 本项目除核心的情侣聊天分析外,修改数据源后也可适配以下生活化/轻职场场景: 1. 「闺蜜/挚友聊天分析」:梳理长期相处中的沟通模式,看清彼此的支持方式与互动节奏; 2. 「亲子沟通评估」:分析与家人的聊天记录,了解情感表达差异,优化亲子沟通方式; 3. 「轻量职场沟通分析」:处理小型团队/项目组的聊天记录,快速掌握信息流转效率与核心沟通节点; 4. 「学习实践案例」:作为Python数据分析的实战项目,涵盖数据处理、可视化、API集成等核心技能,适合新手入门练习。 - 五、常见问题排查(FAQ) 聚焦新手高频问题,按以下逻辑排查可快速解决: 1. 报错「ModuleNotFoundError: No module named 'xxx'」原因:依赖库未安装或安装不完整。解决方案:单独安装缺失的库,命令格式为pip install 库名(如pip install pandas)。 2. 系统提示「未找到Excel文件」原因:文件路径错误、后缀不符或表头规范错误。解决方案:① 确认文件与主程序在同一目录;② 确认文件后缀为.xlsx;③ 核对表头为「聊天对象、日期时间、聊天内容」。 3. DeepSeek分析空白/报错(状态码401)原因:API密钥错误或失效。解决方案:① 重新核对API密钥(确保以“sk-”开头,无多余空格);② 登录DeepSeek官网确认密钥状态;③ 检查网络是否可访问DeepSeek官网。