# National-Data **Repository Path**: kongdd/National-Data ## Basic Information - **Project Name**: National-Data - **Description**: 国家统计局的国家数据网站数据抓取器,可以直接使用1978-2016所有年鉴指标的csv数据 - **Primary Language**: Python - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 1 - **Forks**: 0 - **Created**: 2019-08-25 - **Last Updated**: 2022-09-21 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 国家统计局数据抓取器 数据来自国家统计局的国家数据网站 http://data.stats.gov.cn/index.htm ## 年鉴数据 ### 直接使用 即网站的年度数据,在`data/zb`下有可以直接使用的*所有*指标的1978-2014年的csv文件(现在可以抓2016年数据了, 不过不重复上传到GitHub上,可以用下面的gbk版或自己运行。) ,当然特定时候没值就是空。 Excel可能对这里使用的无BOM UTF8编码处理有问题而导致乱码。如遇问题,可修改命令行中的`--encoding`选项 为gbk或者使用我另外转的1978-2016年数据gbk编码版 (就不重复上传占仓库大小了)。 ### 使用脚本 ```shell $ python main.py --type year --date 1978-2016 --dest data2016 --tree tree2016 ``` 另外吐槽一下其实数据没压缩也才10+Mb。那些统计年鉴都是塞了一堆图才那么大的。