代码拉取完成,页面将自动刷新
# -*- coding: utf-8 -*-
import sys
import re
def printf(s):
print s.decode('utf8').encode('gbk')
s=open(r'data/1255010203.html').read()
s=s.decode('gbk').encode('utf8')
s=s.replace('\n','')
r=r'''学号.+?\>.+?\>(.+?)\<.+?
姓名.+?\>.+?\>(.+?)\<.+?
身份证号.+?\>.+?\> (.+?)\<.+?
户口详细地址.+?\>.+?\> (.+?)\<.+?
家庭电话.+?\>.+?\> (.+?)\<.+?
宿舍地址.+?\>.+?\> (.+?)\<.+?
宿舍电话.+?\>.+?\> (.+?)\<.+?
手机号.+?\>.+?\>(.+?)\<.+?
'''
l=re.compile(r,re.X).findall(s)
printf(str(l))
printf(l[0][0])
printf(l[0][1])
printf(l[0][2])
printf(l[0][3])
printf(l[0][4])
printf(l[0][5])
printf(l[0][6])
printf(l[0][7])
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。