master

分支 (1)

管理

管理

master

data-collection-and-fusion
/
作业1
/
实践作业13.py

#导入
from bs4 import BeautifulSoup
import re
import urllib.request
import time
from selenium import webdriver
browser = webdriver.Edge()	# 创建browser对象
#打开网站
browser.get('https://news.fzu.edu.cn/yxfd.htm')
i = 1
time.sleep(15)# 等待页面加载完成
html = browser.page_source# 获取页面源代码
soup = BeautifulSoup(html, "lxml") # 解析HTML
list = []# 创建一个空列表list，用于存储图片链接
lis = soup.select("img")# 使用CSS选择器获取所有img标签

x = 1
for ls in lis:
    image_name = "images/" + str(x) + ".jpg"# 图片保存路径
    x = x +1
    image_url = "https://xcb.fzu.edu.cn" + str(ls["src"])# 图片链接
    print(image_url)
    try:
        urllib.request.urlretrieve(image_url, filename=image_name) # 下载图片并保存到本地
    except urllib.error.URLError as error:
        print(error)