30 Star 112 Fork 94

老男孩Python全栈21期 / 教学计划

 / 详情

day104爬虫作业

待办的
成员
创建于  
2019-08-28 15:31

1.完善需求文档
2.使用打码平台识别12306验证码

评论 (19)

Bobo 创建了任务

1.5/2

import re
import base64
headers={
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.100 Safari/537.36',
#     'Connection': 'keep-alive',

}
s=requests.Session()
url='https://kyfw.12306.cn/otn/resources/login.html'
url='https://kyfw.12306.cn/passport/captcha/captcha-image64?login_site=E&module=login&rand=sjrand&1566980745733&callback=jQuery1910500591329861616_1566980496040&_=1566980496044'
s.get(url,headers=headers)
page_text=s.get(url,headers=headers).text
print(page_text)
b64_image = re.findall(r'{"image":"(.*?)",', page_text, re.S)[0]
image_data = base64.b64decode(b64_image)
with open(r"./12306.jpg", "wb") as f:
    f.write(image_data)

# tree=etree.HTML(page_text)
# src=tree.xpath('//*[@id="J-loginImg"]/@src')[0]
img_text=getCodeImgText('./12306.jpg',9004)
print('识别内容',img_text)

登录 后才可以发表评论

状态
负责人
里程碑
Pull Requests
关联的 Pull Requests 被合并后可能会关闭此 issue
分支
开始日期   -   截止日期
-
置顶选项
优先级
参与者(20)
1548935 hsingpu 1645711009 4904202 lizhongren 1578976784 4909883 qianniao2122 1578976916 4904423 zengyi1995 1578976788 4909133 zjx1120 1578976899 Avatar default
加载更多
1
https://gitee.com/old_boy_python_stack_21/teaching_plan.git
git@gitee.com:old_boy_python_stack_21/teaching_plan.git
old_boy_python_stack_21
teaching_plan
教学计划

搜索帮助