使用spark实现elasticsearch部分功能
使用python的scrapy框架编写的对世界开放大学课程基本信息抓取的爬虫,实现了对MIT,OX等国外著名的二十多所优秀大学的开放课程的相关信息的抓取,同时也包括了EDX,VTC等著名的开放课程网站的课程信息的抓取
利用spark的机器学习库实现的简单的文本主题提取功能
开大竞争情报分析后台服务
spark连接mongdb数据库的基本封装,涉及spark对mongodb数据的读取,写入等操作,加载mongodb数据直接生成spark.dataFrame. 相关spark Mlib的算法的python实现
项目文档记录仓库
最近一年贡献:0 次
最长连续贡献:0 日
最近连续贡献:0 日
贡献度的统计数据包括代码提交、创建任务 / Pull Request、合并 Pull Request,其中代码提交的次数需本地配置的 git 邮箱是 Gitee 帐号已确认绑定的才会被统计。