1 Star 0 Fork 0

黄昕怡/数据采集与融合

加入 Gitee
与超过 1200万 开发者一起发现、参与优秀开源项目,私有仓库也完全免费 :)
免费加入
文件
该仓库未声明开源许可证文件(LICENSE),使用请关注具体项目描述及其代码上游依赖。
克隆/下载
实践作业13.py 891 Bytes
一键复制 编辑 原始数据 按行查看 历史
黄昕怡 提交于 2024-10-16 12:45 +08:00 . 作业1
#导入
from bs4 import BeautifulSoup
import re
import urllib.request
import time
from selenium import webdriver
browser = webdriver.Edge() # 创建browser对象
#打开网站
browser.get('https://news.fzu.edu.cn/yxfd.htm')
i = 1
time.sleep(15)# 等待页面加载完成
html = browser.page_source# 获取页面源代码
soup = BeautifulSoup(html, "lxml") # 解析HTML
list = []# 创建一个空列表list,用于存储图片链接
lis = soup.select("img")# 使用CSS选择器获取所有img标签
x = 1
for ls in lis:
image_name = "images/" + str(x) + ".jpg"# 图片保存路径
x = x +1
image_url = "https://xcb.fzu.edu.cn" + str(ls["src"])# 图片链接
print(image_url)
try:
urllib.request.urlretrieve(image_url, filename=image_name) # 下载图片并保存到本地
except urllib.error.URLError as error:
print(error)
Loading...
马建仓 AI 助手
尝试更多
代码解读
代码找茬
代码优化
1
https://gitee.com/fufubuff/data-collection-and-fusion.git
git@gitee.com:fufubuff/data-collection-and-fusion.git
fufubuff
data-collection-and-fusion
数据采集与融合
master

搜索帮助