@wuguicom
乌龟 暂无简介
spark源代码注释与翻译
定时任务管理工具,可提供spark、yarn大数据平台分析任务的运行与日志收集;集成阿里 datax 3.0 ETL工具,并提供图形界面的管理;集中式管理操作 shell 脚本的运行与日志收集。 提供以任务组的方式管理定时任务,可将前后连接比较紧密的任务放入一个组中,系统将按照顺序依次执行。
阅读《spark graphx in action》一书及系列博客时候所编写的测试代码及注释。
spark ml 算法原理剖析以及具体的源码实现分析
IT干货技术分享网整站开源项目
基于hadoop思维的分布式网络爬虫。
大数据学习文档