# 爬取链家数据 **Repository Path**: no-prosperity/crawling-linker-data ## Basic Information - **Project Name**: 爬取链家数据 - **Description**: 将爬虫数据存入mongodb,使用python读取mongodb数据并进行可视化分析 - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 4 - **Forks**: 0 - **Created**: 2021-06-14 - **Last Updated**: 2025-06-05 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 爬取链家房源数据 #### 介绍 将爬虫数据存入mongodb,使用python读取mongodb数据并进行可视化分析,MongoDB是文档数据库,采用BSON的结构来存储数据。在文档中可嵌套其他文档类型,使得MongoDB具有很强的数据描述能力。本节案例使用的数据为链家的租房信息,源数据来自于链家网站,所以首先要获取网页数据并解析出本案例所需要的房源信息,然后将解析后的数据存储到MongoDB中,最后基于这些数据进行城市租房信息的查询和聚合分析等。 #### 所需环境 Python3 MongoDB:v3.6 #### 步骤 1.使用python将爬虫数据存入mongodb 分析租房信息首先要获取原始的房源数据,本例使用python爬虫技术获取链家网页的新房楼盘信息。如图所示,对房源信息进行分析需要获取房源所在区域、小区名、房型、面积、具体位置、价格等信息。 2.使用python读取mongodb数据并进行可视化分析 ####结果图 ![输入图片说明](https://images.gitee.com/uploads/images/2021/0614/034905_47f4ec50_9257523.png "屏幕截图.png") ![输入图片说明](https://images.gitee.com/uploads/images/2021/0614/034617_c4bc88d2_9257523.png "屏幕截图.png") ![输入图片说明](https://images.gitee.com/uploads/images/2021/0614/034634_171dad9c_9257523.png "屏幕截图.png")