使用scrapy框架爬取数据,数据库选用MongoDB和Redis,先爬取知乎上回答过同一类问题的用户群体(代号A)及其粉丝群体(代号B),从B中根据关注A的数量筛选出最佳粉丝群体(代号B+),再从A中根据其在B+中的粉丝数量筛选出最佳用户(代号A+).
最近更新: 接近5年前DeepPavlov 是一个开源的对话 AI 库,基于 TensorFlow 和 Keras 构建,其作用是: NLP 和对话系统研究; 实现和评估复杂对话系统
最近更新: 5年前抽取关系节点,以neo4j存储到图数据库中,为图中的关系做推荐服务。
最近更新: 接近6年前中文实体关系抽取,pytorch,bilstm+attention
最近更新: 6年前实战多种网站、电商数据爬虫。包含:淘宝商品、微信公众号、大众点评、招聘网站、闲鱼、阿里任务、scrapy博客园、微博、百度贴吧、豆瓣电影、包图网、全景网、豆瓣音乐、某省药监局、搜狐新闻、机器学习文本采集、fofa资产采集、汽车之家、国家统计局、百度关键词收录数、蜘蛛泛目录、今日头条、豆瓣影评️...
最近更新: 6年前