代码拉取完成,页面将自动刷新
package WebFinder
import (
"gitee.com/fierce_wolf/go-web-crawler/WebCrawler"
"regexp"
)
type Text struct {
Param string // 输入参数
List []*WebCrawler.WebElement // 手机号码的相关元素,其中text字段被识别为手机号码
}
func (e *Text) GetList() []*WebCrawler.WebElement {
return e.List
}
func (e *Text) Find(els []*WebCrawler.WebElement) []*WebCrawler.WebElement {
e.List = make([]*WebCrawler.WebElement, 0)
// 参数的准备:正则表达式
regexp := regexp.MustCompile(e.Param)
originals := WebCrawler.Site.FindElements(els, WebCrawler.Filter{
Mode: WebCrawler.ModeRegexp,
Param: regexp,
})
for _, el := range originals {
matches := regexp.FindAllString(el.Text, -1) // -1表示返回所有匹配项
if len(matches) == 1 {
clone := el.Clone()
clone.Text = matches[0]
e.List = append(e.List, clone)
}
}
return originals
}
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。