# financialbigdata **Repository Path**: be-dependent-on/financialbigdata ## Basic Information - **Project Name**: financialbigdata - **Description**: 金融大数据学习 - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 1 - **Forks**: 1 - **Created**: 2025-12-01 - **Last Updated**: 2025-12-01 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # FinancialAnalysis3 ## 介绍 FinancialAnalysis3 是一个专注于金融数据分析的项目,包含数据获取、预处理和可视化等功能。项目旨在帮助用户从原始金融数据中提取有价值的信息并进行分析。 ## 软件架构 本项目主要由以下模块组成: - **爬虫模块**:用于从新浪财经获取历史分红数据。 - **预处理模块**:对获取的原始数据进行清洗和标准化处理。 - **可视化模块**:提供数据可视化功能,如生成折线图和饼图。 - **工具模块**:包含辅助工具,如查看 Excel 文件内容等。 ## 安装教程 1. 克隆项目到本地: ```bash git clone https://gitee.com/yne1129/financialbigdata.git ``` 2. 安装依赖: ```bash pip install requests pandas openpyxl ``` 3. 确保 Python 环境版本为 3.x。 ## 使用说明 ### 爬取新浪财经历史分红数据 运行以下命令爬取数据: ```bash python sina_dividend_scraper.py ``` 爬取的数据将保存为 Excel 文件。 ### 预处理数据 运行以下命令对数据进行预处理: ```bash python sina_dividend_preprocessor.py ``` 预处理后的数据将保存为新的 Excel 文件。 ### 查看 Excel 文件内容 运行以下命令查看 Excel 文件内容: ```bash python view_excel_data.py ``` ## 数据说明 ### 原始数据字段 - 股票代码 - 股票名称 - 分红年度 - 每股派息 - 每股送股 - 每股转增 - 公告日期 - 股权登记日 - 除权除息日 - 红股上市日 ### 预处理后新增字段 - 上市日期标准化 - 数值字段标准化 ## 注意事项 - 爬虫模块设置了默认的页面范围和请求间隔,请根据实际需求调整参数。 - 预处理模块会检查数据形状和重复项,确保数据质量。 - 数据可视化模块提供简单的图表生成功能,可扩展支持更多图表类型。 ## 参与贡献 欢迎提交 Pull Request 或报告 Issues。如果你希望添加新功能或改进现有代码,请遵循以下步骤: 1. Fork 项目。 2. 创建新分支。 3. 提交代码更改。 4. 提交 Pull Request。 ## 特技 - 自动化爬取和预处理金融数据。 - 支持多种数据可视化图表。 - 提供简单易用的命令行接口。 如需更多帮助,请查看项目文档或联系项目维护者。