Ai
1 Star 1 Fork 0

灵狐/go-web-crawler

加入 Gitee
与超过 1200万 开发者一起发现、参与优秀开源项目,私有仓库也完全免费 :)
免费加入
文件
克隆/下载
FindText.go 908 Bytes
一键复制 编辑 原始数据 按行查看 历史
灵狐 提交于 2025-05-10 20:35 +08:00 . 更新
package WebFinder
import (
"gitee.com/fierce_wolf/go-web-crawler/WebCrawler"
"regexp"
)
type Text struct {
Param string // 输入参数
List []*WebCrawler.WebElement // 手机号码的相关元素,其中text字段被识别为手机号码
}
func (e *Text) GetList() []*WebCrawler.WebElement {
return e.List
}
func (e *Text) Find(els []*WebCrawler.WebElement) []*WebCrawler.WebElement {
e.List = make([]*WebCrawler.WebElement, 0)
// 参数的准备:正则表达式
regexp := regexp.MustCompile(e.Param)
originals := WebCrawler.Site.FindElements(els, WebCrawler.Filter{
Mode: WebCrawler.ModeRegexp,
Param: regexp,
})
for _, el := range originals {
matches := regexp.FindAllString(el.Text, -1) // -1表示返回所有匹配项
if len(matches) == 1 {
clone := el.Clone()
clone.Text = matches[0]
e.List = append(e.List, clone)
}
}
return originals
}
Loading...
马建仓 AI 助手
尝试更多
代码解读
代码找茬
代码优化
Go
1
https://gitee.com/fierce_wolf/go-web-crawler.git
git@gitee.com:fierce_wolf/go-web-crawler.git
fierce_wolf
go-web-crawler
go-web-crawler
v1.0.1

搜索帮助