首页 > 其他好文 > 详细

sqoop的使用

时间：2017-08-23 00:33:01 阅读：246 评论：0 收藏：0 [点我收藏+]

标签：目录 app 地址 topic 任务注意 www. rmi create

一：导入 mysql--》hdfs

1.准备

　　技术分享

2.导入数据

　　可以看到在跑yarn。

　　技术分享

3.在HDFS上看结果

　　默认的地址：hdfs的家目录。

　　技术分享

4.在HDFS上指定目录

　　技术分享

5.指定map的个数，相同目录时，先删除原来的目录

　　技术分享

6.查看结果

　　技术分享

7.指定分隔符

　　默认是‘，’，在HDFS上修改‘\t’

　　技术分享

8.重新查看结果

　　技术分享

9.更快的方式

　　技术分享

10.增量导入之前的准备

　　技术分享

11.增量导入

　　在增量导入的时候，不能加上--delete---target-dir，因为这是增量导入

　　技术分享

12.查看增量结果

　　技术分享

13.创建一个job任务之前的任务

　　技术分享

14.创建一个job任务

　　注意：命令为 --create

　　　　　--与import之间有一个空格。

　　技术分享

15.查看一个job

　　技术分享

16.查看job的详细信息

　　技术分享

17.执行job任务

　　技术分享

18.删除job任务

　　技术分享

二：导入 mysql-->hive

1.在HIVE中新建一个数据库和一个表

　　方便mysql里面的数据导入。

　　技术分享

2.展示源表tohdfs的数据

　　技术分享

3.导入一

　　技术分享

4.结果

　　技术分享

5.导入二

　　技术分享

6.结果

　　技术分享

三：导出：hdfs-》mysql

1.新建mysql数据表

　　技术分享

2.命令

　　bin/sqoop export --connect jdbc:mysql://linux-hadoop3.ibeifeng.com:3306/sqoop --username root --password 123456 --table tomysql --export-dir /user/hive/warehouse/student.db/stu_info --num-mappers 1 --input-fields-terminated-by ‘\t‘

　　技术分享

3.结果

　　技术分享

四：导出hive-》mysql

1.基本语法同上。

　　只需要把--export-dir改成HIVE的路径就可以了。

　　但是会发现，上面的HDFS上的路径就是HIVE的路径，所以HIVE的导出例子依旧可以使用上面的例子。

　　在HDFS的导出中，可以使用HDFS上的任何一个路径，而不是HIVE中需要时warehouse的路径。

五：执行sqoolwenjian

1.新建数据库

　　技术分享

2.新建sqoop.file，里面是将执行的文件

　　技术分享

3.执行

　　技术分享

4.结果

　　技术分享

六：使用帮助

1.用法

　　技术分享

标签：目录 app 地址 topic 任务注意 www. rmi create

原文地址：http://www.cnblogs.com/RHadoop-Hive/p/7414025.html

踩

(0)

赞

(0)

举报

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行

更多

友情链接

兰亭集智国之画百度统计站长统计阿里云 chrome插件新版天听网

关于我们 - 联系我们 - 留言反馈

© 2014 mamicode.com 版权所有联系我们:gaon5@hotmail.com

迷上了代码！