# sqoop **Repository Path**: jizhiming/sqoop ## Basic Information - **Project Name**: sqoop - **Description**: No description available - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 2 - **Created**: 2022-03-30 - **Last Updated**: 2022-05-24 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # sqoop1.99.5 #### 介绍 sqoop是Apache旗下的一款开源工具,该项目开始于2009年,最早是作为Hadoop的一个第三方模块存在,后来为了让使用者能够快速部署,也为了让开发人员能够更快速的迭代开发,并在2013年,独立成为Apache的一个顶级开源项目。sqoop主要用于在Hadoop和关系数据库之间传输数据,可以使用Sqoop工具将数据从关系数据库管理系统导入到Hadoop分布式文件系统中,或者将Hadoop中的数据转换导出到关系数据库管理系统。 #### 安装依赖 jdk 1.8 hadoop 2.7.3 mysql 5.6或者5.7 mysql驱动 mysql-connector-java-5.1.38 #### 测试步骤 1. 在mysql中创建数据库、表,并插入数据: ```mysql create database sqoop; use sqoop; create table book(id int primary key auto_increment, title varchar(50) not null, author varchar(50) not null, stock int); insert into book(id,title,author,stock) values(1,'sanguo','lgz', 5); insert into book(id,title,author,stock) values(2,'java','ka', 6); ``` 2. 在sqoop客户端中创建mysql的link、hdfs的link以及两个job(mysql到hdfs的job 1和hdfs到mysql的job 2) 3. 启动job 1,查看hdfs里面的数据hadoop fs -cat /tmp/test/* 4. 删除数据表里的数据,启动job 2,重新查看数据表