58
罗盘是一个大数据任务诊断平台,旨在提升用户排查问题效率,降低用户异常任务成本。 其主要功能特性如下: 非侵入式,即时诊断,无需修改已有的调度平台,即可体验诊断效果。 支持多种主流调度平台,例如DolphinScheduler、Airflow或自研等。 支持多版本Spark、Hadoop 2.x和3.x 任务日志诊断和解析。 支持工作流层异常诊断,识别各种失败和基线耗时异常问题。
5个月前
49
一门面向大数据和AI的语言 一个真正整合数据管理,商业分析,机器学习的统一平台
Java
28天前
12303739 baihai idp 1690958128
46
IDP 是一款面向数据科学家和大数据工程师的开源 AI IDE。
45
Apache® CarbonData™是由华为开源贡献的大数据高效存储格式解决方案。
Java
3年多前
6892317 apache 1605059459
43
Hive是一个基于Hadoop的数据仓库平台
Java
23小时前
319685 bboss 1578989326
42
hbase-elasticsearch数据同步工具 支持hbase到elasticsearch、hbase到数据库、hbase到kafka、hbase到excel文件、hbase到文本文件以及hbase到ftp/sftp文件数据采集、上报
Java
1小时前
6892317 apache 1605059459
40
Hudi 于 2016 年以“Hoodie”为代号开发,旨在解决 Uber 大数据生态系统中需要插入更新及增量消费原语的摄取管道和 ETL 管道的低效问题
Java
23小时前
6854763 mindspore 1604325217
36
MindSpore Pandas is a data analysis framework, which is compatible with Pandas interfaces and provides distributed processing capabilities.
Python
1年前
35
LakeSoul 端到端实时湖仓框架 Github 官方镜像 https://github.com/lakesoul-io/LakeSoul
Scala
1个月前
6892317 apache 1605059459
34
Apache Griffin是一个应用于分布式数据系统中的开源数据质量解决方案
Java
26天前
6892317 apache 1605059459
32
Druid 是一个高性能实时分析数据库。它是为大型数据集上实时探索查询的引擎,提供专为 OLAP 设计的开源分析数据存储系统
Java
3年多前
963383 idela hp 1578936904
29
该地址更新缓慢,可以移步https://gitee.com/mirrors/Sylph
Java
2年前
12 mirrors 1578989292
27
Kyuubi 是一个高性能的通用 JDBC 和 SQL 执行引擎,建立在 Apache Spark 之上
Shell
接近3年前
12 mirrors 1578989292
24
HAWQ 是一个Hadoop原生大规模并行SQL分析引擎,针对的是分析性应用。和其他关系型数据库类似,接受SQL,返回结果集。
Java
3年多前
12 mirrors 1578989292
23
Alluxio(之前名为Tachyon)是世界上第一个以内存为中心的虚拟的分布式存储系统
Java
9个月前

搜索帮助

344bd9b3 5694891 D2dac590 5694891