Apache DolphinScheduler(incubator,原EasyScheduler)是一个分布式工作流任务调度系统,主要解决数据研发ETL错综复杂的依赖关系,而不能直观监控任务健康状态等问题。DolphinScheduler以DAG流式的方式将Task组装起来,可实时监控任务的运行状态,同时支持重试、从指定节点恢复失败、暂停及Kill任务等操作。
Apache DolphinScheduler(incubator,原EasyScheduler)是一个分布式工作流任务调度系统,主要解决数据研发ETL错综复杂的依赖关系,而不能直观监控任务健康状态等问题。DolphinScheduler以DAG流式的方式将Task组装起来,可实时监控任务的运行状态,同时支持重试、从指定节点恢复失败、暂停及Kill任务等操作。
spark源代码注释与翻译
基于华为大数据平台FusionInsight的流数据处理服务。实时采集日志文件,经过数据清洗、解析、标准化等处理后,将数据落地到数据库,供后续其他服务程序使用。
大数据实时流的计算框架
学习SparkSQL
本公司与华为及Tamr算法治理三方合作项目,公司负责定制一款大数据平台前期大数据处理的辅助软件。web端采用React+flux+react-router+gulp构建;后台服务java.
最近一年贡献:0 次
最长连续贡献:0 日
最近连续贡献:0 日
贡献度的统计数据包括代码提交、创建任务 / Pull Request、合并 Pull Request,其中代码提交的次数需本地配置的 git 邮箱是 Gitee 帐号已确认绑定的才会被统计。