# HTML2Excel_02
**Repository Path**: waitusz/HTML2Excel_02
## Basic Information
- **Project Name**: HTML2Excel_02
- **Description**: 提取网页中指定的公司报表信息,存入Excel
- **Primary Language**: Python
- **License**: Not specified
- **Default Branch**: master
- **Homepage**: None
- **GVP Project**: No
## Statistics
- **Stars**: 0
- **Forks**: 2
- **Created**: 2021-07-17
- **Last Updated**: 2022-08-31
## Categories & Tags
**Categories**: Uncategorized
**Tags**: None
## README
### 使用说明
---
#### 1.功能
- 爬取网页并解析获取指定内容
- 存储Excel
#### 2.类型
- 存在特定legend标签:解析提取内容
- 不存在特定legend标签:跳过
#### 3.Type
- 存在三种Type:分别存放于Type1,Type2,Type3
- 仅存在两种Type:存放于Type1,Type3,Type2被置空
#### 4.用法
##### 4.1Python解释器运行程序
替换程序入口处的 \#paras参数
- base_dir: Excel Demo所在文件夹路径
- excel_demo: Excel文件名称
- sheet_name: sheet名称
##### 4.2 运行exe程序
若需封装程序,联系作者。
#### 5.结果
- Excel保存到当前程序运行路径的Excels文件夹下
- 出错的网页信息保存到当前程序运行路径的error.log文件中
- 出错指的是:
- 获取html页面出错,可能是网络不稳定或者爬虫被禁止
- 寻找特定legend标签出错,可能是没有指定的标签信息或者标签信息格式不同于已知
- 寻找Type出错,可能是没有Type
- 寻找特定公司信息出错,可能是没有相应的带有指定标签的公司
#### 6.获取帮助
author:yooongchun
wechat:18217235290