代码拉取完成,页面将自动刷新
同步操作将从 bangenlanbai/Tianyan 强制同步,此操作会覆盖自 Fork 仓库以来所做的任何修改,且无法恢复!!!
确定后同步将在后台操作,完成时将刷新页面,请耐心等待。
[TOC]
mysql
,当然也可以是其他数据库,只需要更改其config.py
文件中的相关配置。main.py
- 项目入口文件models.py
- 数据库实体db_helper.py
- 数据库操作根file_helper.py
- 文件操作config.py
- 项目配置geetest2
包 - 来自于github 开源项目 破解天眼的滑动验证码spider.py
- 爬虫程序viewmodel.py
- 继承自db_helper的BaseModel 根senior_people.csv
- 公司高管信息(包含所有维度)illegals_data.csv
- 公司违规信息(所有维度)字段名称 | 字段类型 | 字段属性 | 字段注解 |
---|---|---|---|
company_id | varchar(20) | 主键 | 公司id |
company_name | varchar(50) | 公司名称 | |
mod_time | datetime | 默认值 写入时间 | 修改时间 |
字段名称 | 字段类型 | 字段属性 | 字段注解 |
---|---|---|---|
id | varchar(20) | 主键 | id |
name | varchar(5) | 姓名 | |
age | int | 年龄 | |
sex | varchar(1) | 性别 | |
eduaction | varchar(5) | 学历 | |
resume | text | 个人简介 | |
mod_time | datetime | 修改时间 |
字段名称 | 字段类型 | 字段属性 | 字段注解 |
---|---|---|---|
group_id | int | 主键 | 分组id |
group_name | varchar(5) | 分组名称-(董事会,监事会,高管) |
字段名称 | 字段类型 | 字段属性 | 字段注解 |
---|---|---|---|
id | int | 主键,自增 | 主键id |
company_id | varchar(20) | 外键 | 公司id |
group_id | int | 外键 | 分组id |
person_id | varchar(20) | 外键 | 人员id |
position | varchar(50) | 职称描述 | |
start_date | date | 任职开始日期 | |
end_date | date | 任职结束日期 | |
report_date | date | 公告日期 | |
mod_time | datetime | 默认值-写入时间 | 修改时间 |
字段名称 | 字段类型 | 字段属性 | 字段注解 |
---|---|---|---|
id | int | 主键,自增 | 主键id |
company_id | varchar(20) | 外键 | 公司id |
person_id | varchar(20) | 外键 | 人员id |
money | varchar(10) | 薪资金额 | |
number_of_shares_with_unit | varchar(10) | ||
mod_time | datetime | 默认值-写入时间 | 修改时间 |
字段名称 | 字段类型 | 字段属性 | 字段注解 |
---|---|---|---|
id | int | 主键,自增 | 主键id |
company_id | varchar(20) | 外键 | 违规公司id |
disposer | varchar(50) | 外键 | 处理机构 |
default_type | varchar(10) | 违规类型 | |
illegal_act_withlink | text | 违规详情 | |
punish_type | varchar(10) | 处理类型-(惩罚类型) | |
punish_explain_withlink | text | 处理详情 | |
punish_object | varchar(20) | 被处理对象 | |
announcement_date | date | 公告日期 | |
currency_unit | varchar(10) | 涉及金额 | |
mod_time | datetime | 默认值-(写入时间) | 修改时间 |
https://www.tianyancha.com/search/p{}/key='company_name'
https://www.tianyancha.com/pagination/seniorPeople.xhtml
接口:https://www.tianyancha.com/pagination/corpIllegals.xhtml
违规信息太少了 根据上面的董监高接口猜出来的
由于时间问题,这块内容未实现,下面只是一些想法
echart.js
图表库)比如可以做一个 公司高管薪资水平图表本项目仅仅只用与面试(某面试)若用于其他用途,请自行承担相关责任!!
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。