# 网页爬虫工具 **Repository Path**: mrchai/web-crawler-tool ## Basic Information - **Project Name**: 网页爬虫工具 - **Description**: 一个强大的 Chrome 扩展程序,用于提取网页中的图片、视频和音频资源。 - **Primary Language**: Unknown - **License**: MIT - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2025-04-27 - **Last Updated**: 2025-04-27 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 网页资源提取器 (Web Resource Extractor) 一个强大的 Chrome 扩展程序,用于提取网页中的图片、视频和音频资源。 ## 功能特点 - 🖼️ **图片提取** - 支持常规图片标签 - 支持背景图片 - 支持懒加载图片 - 实时预览和下载 - 🎥 **视频提取** - 支持原生视频标签 - 支持主流视频平台嵌入视频(YouTube、Bilibili等) - 支持自定义视频属性 - 显示视频尺寸信息 - 🎵 **音频提取** - 支持原生音频标签 - 显示音频时长信息 - 支持多种音频格式 - 🔄 **实时更新** - 支持动态加载内容检测 - 自动识别新增资源 - 无需刷新页面 - 📥 **批量下载** - 支持单个资源下载 - 支持批量下载所有资源 - 智能文件命名 ## 安装方法 1. 下载或克隆本仓库到本地 ```bash git clone https://github.com/your-username/web-resource-extractor.git ``` 2. 打开 Chrome 浏览器,访问 `chrome://extensions/` 3. 开启右上角的"开发者模式" 4. 点击左上角的"加载已解压的扩展程序" 5. 选择本仓库所在的文件夹 ## 使用方法 1. 点击浏览器工具栏中的扩展图标,打开资源提取面板 2. 切换标签页查看不同类型的资源: - 图片标签:显示所有图片资源 - 视频标签:显示所有视频资源 - 音频标签:显示所有音频资源 3. 对于每个资源,你可以: - 预览资源内容 - 查看资源详细信息(尺寸、时长等) - 点击下载按钮下载单个资源 - 点击"下载所有"按钮批量下载 ## 技术特性 - 使用 Chrome Extension Manifest V3 - 原生 JavaScript 实现,无需第三方依赖 - 使用 MutationObserver 监听页面变化 - 支持资源去重和智能过滤 - 异步资源加载和延迟处理 - 响应式界面设计 ## 项目结构 ``` ├── manifest.json # 扩展配置文件 ├── popup.html # 弹出窗口界面 ├── popup.js # 弹出窗口逻辑 ├── content.js # 内容脚本 ├── background.js # 后台脚本 ├── styles/ │ └── popup.css # 样式文件 └── icons/ # 图标资源 ``` ## 浏览器兼容性 - Chrome 88+ - Edge 88+(基于 Chromium) - 其他基于 Chromium 的浏览器(版本要求:支持 Manifest V3) ## 注意事项 - 部分网站可能限制资源访问或下载 - 某些动态加载的资源可能需要滚动页面才能检测到 - 受浏览器安全策略限制,某些跨域资源可能无法预览 - 下载速度取决于网络状况和资源大小 ## 贡献指南 欢迎提交 Issue 和 Pull Request! 1. Fork 本仓库 2. 创建你的特性分支 (`git checkout -b feature/AmazingFeature`) 3. 提交你的改动 (`git commit -m 'Add some AmazingFeature'`) 4. 推送到分支 (`git push origin feature/AmazingFeature`) 5. 打开一个 Pull Request ## 开源协议 本项目基于 MIT 协议开源,详见 [LICENSE](LICENSE) 文件。 ## 更新日志 ### v1.0.0 (2024-01) - 初始版本发布 - 支持图片、视频、音频资源提取 - 实现实时更新和批量下载功能