# streamsets **Repository Path**: dewade_2003/streamsets ## Basic Information - **Project Name**: streamsets - **Description**: No description available - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 4 - **Created**: 2022-07-14 - **Last Updated**: 2022-07-14 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # streamsets #### 介绍 Streamsets是一款大数据实时采集和ETL工具,可以实现不写一行代码完成数据的采集和流转。通过拖拽式的可视化界面,实现数据管道(Pipelines)的设计和定时任务调度。最大的特点有: - 可视化界面操作,不写代码完成数据的采集和流转 - 内置监控,可是实时查看数据流传输的基本信息和数据的质量 - 强大的整合力,对现有常用组件全力支持,包括50种数据源、44种数据操作、46种目的地。 #### 安装依赖 OpenJDK 1.8.0 Hadoop 2.7.6 Mysql 5.7.27 Zookeeper 3.5.9 Kafka 2.11-2.2.2 Hive 2.3.5 Streamsets 3.3.0 #### 使用说明 1. 启动streamsets。 cd $INSTALL_PATH/streamsets/bin ./streamsets dc & 2. 访问web页面,在浏览器中输入:http://localhost:18630