# getHerbal

**Repository Path**: minknown/getHerbal

## Basic Information

- **Project Name**: getHerbal
- **Description**: 一个中草药爬虫案例 -基于易语言
- **Primary Language**: Unknown
- **License**: Not specified
- **Default Branch**: main
- **Homepage**: None
- **GVP Project**: No

## Statistics

- **Stars**: 0
- **Forks**: 0
- **Created**: 2023-11-15
- **Last Updated**: 2023-11-15

## Categories & Tags

**Categories**: Uncategorized

**Tags**: None

## README

# epachong
一个中草药爬虫案例 -基于易语言
**该项目是由于亲戚朋友的委托编写，抓取 https://m.xjlz365.com 站点上的所有中草药信息，包括疗效等其他草药信息，最终存入简单的txt文本文件中。**
****
## 实现方法  
1：需要在运行目录下新建data、nr两个文件夹存放抓取结果。  
2：运行前建议关闭360后再运行。  
3：确保type.txt文件的存在和文件内容含有分类。  
****
## 要点：  
温馨提示：爬虫请合理使用，禁止用于干坏事。  
****
## 其他说明： 
type.txt存放的是网站首页展示的所有方剂分类名。一行一个，每行用|隔开，如anshenfang/安神方吧，表示这是一个名为安神方的分类。anshenfang是其代号或者拼音拼写。  
data目录存放的是是点击进入分类页的所有药方名称列表信息。如我们点击“安神方”。链接为 https://m.xjlz365.com/zyg/fangji/anshenfang/ 则可看到所有药方名称，由于该分类下的药方列表有多页，所有文件名尾部用_X表示页数  
nr目录存放的是进入某药方的信息，目前取得的信息是药房成分和图片URL。如果需要扩展也可以获得页面上的其他信息（如药方来源、主治、用法等）。  
数据存取非SQL。txt简易模式。  
数据统计：139个大药剂分类，350页药方，总计大约9500个药方  
****
## 效果图：  
我成功跑起来了，并抓取到了很多中草药和药方：  
![image](readme.png)