代码拉取完成,页面将自动刷新
#导入
from bs4 import BeautifulSoup
import re
import urllib.request
import time
from selenium import webdriver
browser = webdriver.Edge() # 创建browser对象
#打开网站
browser.get('https://news.fzu.edu.cn/yxfd.htm')
i = 1
time.sleep(15)# 等待页面加载完成
html = browser.page_source# 获取页面源代码
soup = BeautifulSoup(html, "lxml") # 解析HTML
list = []# 创建一个空列表list,用于存储图片链接
lis = soup.select("img")# 使用CSS选择器获取所有img标签
x = 1
for ls in lis:
image_name = "images/" + str(x) + ".jpg"# 图片保存路径
x = x +1
image_url = "https://xcb.fzu.edu.cn" + str(ls["src"])# 图片链接
print(image_url)
try:
urllib.request.urlretrieve(image_url, filename=image_name) # 下载图片并保存到本地
except urllib.error.URLError as error:
print(error)
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。