代码拉取完成,页面将自动刷新
opts = webdriver.ChromeOptions()
# opts.add_argument('--incognito') # 无痕模式
prefs = {'profile.default_content_settings.popups': 0, 'download.default_directory': 'D:\\爬虫\\知网文章-PDF'}
opts.add_experimental_option('prefs', prefs)
# 截图
element=driver.find_element_by_xpath('//*[@id="vImg"]')
# 选择存储路径
element.screenshot('C:\\Users\\zjl\\Desktop\\web数据挖掘\\web_img\\save.jpg')
with open(r'C:\\Users\\zjl\\Desktop\\web数据挖掘\\web_img\\save.jpg', 'rb') as f:
f1 = f.read()
f1_base64 = str(base64.b64encode(f1), 'utf-8')
def check_file():
E = os.listdir("D:\\爬虫\\测试")
file_nmb = len(E)
return file_nmb
# 加载时间过长
def timeout():
print("进行超时处理")
driver.set_page_load_timeout(10)
while True:
try:
new_url = driver.current_url
driver.get(new_url)
break
except:
pass
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。