58
罗盘是一个大数据任务诊断平台,旨在提升用户排查问题效率,降低用户异常任务成本。 其主要功能特性如下: 非侵入式,即时诊断,无需修改已有的调度平台,即可体验诊断效果。 支持多种主流调度平台,例如DolphinScheduler、Airflow或自研等。 支持多版本Spark、Hadoop 2.x和3.x 任务日志诊断和解析。 支持工作流层异常诊断,识别各种失败和基线耗时异常问题。
6个月前
49
一门面向大数据和AI的语言 一个真正整合数据管理,商业分析,机器学习的统一平台
Java
1个月前
12303739 baihai idp 1690958128
46
IDP 是一款面向数据科学家和大数据工程师的开源 AI IDE。
45
Apache® CarbonData™是由华为开源贡献的大数据高效存储格式解决方案。
Java
3年多前
6892317 apache 1605059459
43
Hive是一个基于Hadoop的数据仓库平台
Java
15小时前
319685 bboss 1578989326
42
hbase-elasticsearch数据同步工具 支持hbase到elasticsearch、hbase到数据库、hbase到kafka、hbase到excel文件、hbase到文本文件以及hbase到ftp/sftp文件数据采集、上报
6892317 apache 1605059459
40
Hudi 于 2016 年以“Hoodie”为代号开发,旨在解决 Uber 大数据生态系统中需要插入更新及增量消费原语的摄取管道和 ETL 管道的低效问题
Java
15小时前
36
LakeSoul 端到端实时湖仓框架 Github 官方镜像 https://github.com/lakesoul-io/LakeSoul
Scala
2个月前
6854763 mindspore 1604325217
36
MindSpore Pandas is a data analysis framework, which is compatible with Pandas interfaces and provides distributed processing capabilities.
Python
1年前
6892317 apache 1605059459
34
Apache Griffin是一个应用于分布式数据系统中的开源数据质量解决方案
Java
6天前
6892317 apache 1605059459
32
Druid 是一个高性能实时分析数据库。它是为大型数据集上实时探索查询的引擎,提供专为 OLAP 设计的开源分析数据存储系统
Java
3年多前
963383 idela hp 1578936904
29
该地址更新缓慢,可以移步https://gitee.com/mirrors/Sylph
Java
2年前
12 mirrors 1578989292
27
Kyuubi 是一个高性能的通用 JDBC 和 SQL 执行引擎,建立在 Apache Spark 之上
Shell
3年前
12 mirrors 1578989292
24
HAWQ 是一个Hadoop原生大规模并行SQL分析引擎,针对的是分析性应用。和其他关系型数据库类似,接受SQL,返回结果集。
Java
3年多前
12 mirrors 1578989292
23
Alluxio(之前名为Tachyon)是世界上第一个以内存为中心的虚拟的分布式存储系统
Java
10个月前

搜索帮助

344bd9b3 5694891 D2dac590 5694891