Watch Star Fork

鬼画符 / templatespiderJavaApache-2.0

扒网站工具,看好哪个网站,指定好URL,自动扒下来做成模版。所见网站,皆可为我所用! http://www.wang.market
克隆/下载
xnx3 最后提交于 2018-02-10 14:18 add spider.jar
取消
提示: 由于 Git 不支持空文件夾,创建文件夹后会生成空的 .keep 文件
2018-01-04 17:32
2018-02-10 14:18
Loading...
README.md 2.89 KB

所见网站,皆可为我所用-templatespider

看好哪个网站,指定好URL,自动扒下来做成模版。并且所下载的css、js、图片、html文件会自动分好类保存到特定文件夹!
项目最初目的为 网市场云建站系统(CMS建站系统) 因模版量少而做。用了之前写的 xnx3 ,以及 Jsoup 。

软件下载

不说没用的,不吹多牛,能直接用,产生价值才是真的!

Windows 系统

点击此处下载 Windows平台 运行软件 软件下载后,解压即可直接使用!

Mac、Linux 系统

点击此处下载可运行jar包 前提是需自行安装JDK8。jar下载后可直接打开运行。

项目分支简介

  1. 看着网上哪个网站好,可用此软件将其下载,变为模版,可以供网市场云建站、帝国CMS、织梦CMS等各大建站系统使用 application/spider.zip
  2. 下载的模版,采用人工智能,自动进行计算识别,将其转化,导出网市场云建站可使用的模版,做到一键导入使用!(尚未完成)
templatespider                      GitHub目录
├─SourceCode                        项目源代码
│  ├─lib                            依赖的 jar 包
│  ├─src                            java 源码
└─application                       可直接运行的应用(下载后可直接部署起来运行)
  └─spider.zip                      扒网站工具的 Windows 应用程序

软件界面

image

使用步骤

  1. 将要扒取的网站页面的网址粘贴进去
  2. 点击左下方“开始抓取”按钮
  3. 等待抓取完毕,自动打开下载好的文件夹

使用示例

例如,我要拔取 qiye1.wscso.com 这个网站中的首页、关于我们、新闻列表三个页面,拔取下来做成模板,扒网站工具中可以这么设置URL:

http://qiye1.wscso.com
http://qiye1.wscso.com/gongsijieshao.html
http://qiye1.wscso.com/xinwenzixun.html

设置如下图所示 image

设置好后,点击左下角的“开始提取”按钮,便开始了自动扒这几个设置好的页面。

扒完后,会自动打开下载好的文件夹。例如,上面拔取的结果:

image

可以看到,扒取下来的网页算是很规范的模板页。可以直接打开模板页进行浏览查看。

项目点评 ( 32 )

你可以在登录后,对此项目发表评论

6_float_left_people 6_float_left_close