代码拉取完成,页面将自动刷新
'''
初
参考嵩天老师代码
'''
import requests
from bs4 import BeautifulSoup
import bs4
def gettext(url): #获取url内容
try:
r = requests.get(url)
r.raise_for_status()
r.encoding = r.apparent_encoding
return r.text
except:
return ''
def filllist(ulist,html): #解析HTML文本格式
soup = BeautifulSoup(html,'html.parser')
for tr in soup.find('tbody').children:
if isinstance(tr,bs4.element.Tag):
tds = tr('td')
ulist.append([tds[0].string,tds[1].string,tds[2].string])
def printlist(ulist,num): #按照格式化列表输出
print("{:^10}\t{:^6}\t{:^10}".format("排名","学校","总分"))
for i in range(num):
u = ulist[i]
print("{:^10}\t{:^6}\t{:^10}".format(u[0],u[1],u[2]))
uinfo = []
url = 'http://www.zuihaodaxue.com/zuihaodaxuepaiming-zongbang-2020.html'
html = gettext(url)
filllist(uinfo,html)
printlist(uinfo,10)
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。