# film_tickets **Repository Path**: robotke/film_tickets ## Basic Information - **Project Name**: film_tickets - **Description**: No description available - **Primary Language**: Python - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2019-02-19 - **Last Updated**: 2020-12-19 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README ## 电影票查询 #### 运行环境 - python 3+ - django 1.10 - linux/windows #### 运行依赖包 - requests - bs4 - lxml - python-Levenshtein - django-import-export #### 如何使用 `git clone https://github.com/zx576/film_tickets` 进入项目文件夹 创建超级用户 `python manage.py createsuperuser` 依次输入用户名和密码即可 `python manage.py runserver` django 自检无误后,在浏览器输入 `127.0.0.1:8000/movie` #### 文件说明 文件结构分为三大块 1. 文件夹 douban_movie 该部分使用豆瓣 api 每日更新上映电影 2. 文件夹 movie_tickets 该部分包含了几个电影票网站的电影院信息爬虫以及某电影院某电影排片信息爬虫 3. django 项目 ##### douban_movie get_douban_in_thrater.py 包含了以下作用: - 爬取当日上映的前 10 部电影 - 比对目前数据库的上映影片,更新数据库 - 找到评分最高的影片,设置置顶 ##### movie_tickets database/ 包含了该爬虫项目的数据库处理方法,数据库为 sqlite3 gene_dt.py 通用的数据库数据库处理方法,包含了建表、查询、写入、删除等 其他以 dt 结尾的文件 继承了 gene_dt.py 中的通用类,不同的网站对应了不同的数据库 table 其他以 citycode 结尾的文件 在对应电影票网上可下载到的城市代码数据 spiders/ 下面 4 个文件表示不同网站的爬虫 utils/ decorators.py 一个装饰器辅助开发文件 headers.py 包含了收集的 headers proxy.py 获取代理 rep.py 使用代理重新对 requests 请求做了一层包装 settings.py 一些基本的设置 show.py 命令行获取电影排片信息 #### 项目思路 1. 使用爬虫爬取各电影票网站所有的电影院链接 2. 使用豆瓣 API 获取当日上映的电影信息 3. django 显示电影信息,提供给用户选择电影院的接口 4. 将电影院信息发送到 django 后台进行查询,爬取对应的排片信息显示给用户 #### 一些技术细节 1、 ajax 加载 本项目使用到了比较多的 ajax 加载技术,给出前后端的一份代码 示例: 实现功能:选择区/县,发送到后台,提取出电影院 html 代码 ```html