运行环境 centos 5.6 hadoop hivesqoop是让hadoop技术支持的clouder公司开发的一个在关系数据库和hdfs,hive之间数据导入导出的一个工具 在使用过程中可能遇到的问题:sqoop依赖zookeeper,所以必须配置ZOOKEEPER_HOME到环境变量中。sqo ...
分类:
数据库 时间:
2021-06-19 19:24:57
阅读次数:
0
进入myql 执行 show variables like 'character%'; 看到如下: 乱码原因,databases编码格式不一致导致的乱码,解决方法如下: 方法一: 执行如下两个命令即可: set character_set_database=utf8; set character_s ...
分类:
其他好文 时间:
2021-06-19 19:06:39
阅读次数:
0
转自:https://blog.csdn.net/qq_25062299/article/details/95592877 ...
分类:
其他好文 时间:
2021-06-19 19:00:51
阅读次数:
0
redis学习 五大数据类型,开发必会的技能 老师的博客 https://www.cnblogs.com/pyyu/p/9467279.html string,字符串类型 hash,哈希类型,如同python的dict Set,无序集合 Zset,有序集合 List,双向队列,向左插入数据,向右插入 ...
分类:
其他好文 时间:
2021-06-19 18:53:25
阅读次数:
0
1. 列举出所有的数据库 命令行查看帮助 sqoop help 列出hadoop02主机所有的数据库 sqoop list-databases --connect jdbc:mysql://hadoop02:3306/ --username root --password 123456 查看某一个数 ...
分类:
其他好文 时间:
2021-06-18 19:33:43
阅读次数:
0
将数据从HDFS把文件导出到RDBMS数据库 导出前,目标表必须存在于目标数据库中。 默认操作是从将文件中的数据使用INSERT语句插入到表中 更新模式下,是生成UPDATE语句更新表数据 数据是在HDFS当中的如下目录/sqoop/emp,数据内容如下 1201,gopal,manager,500 ...
分类:
其他好文 时间:
2021-06-18 19:31:03
阅读次数:
0
一、数据预处理 1.1、在hdfs上新建目录 java程序启动前先在hdfs上建立相应文件夹,用于上传本地数据和处理后的数据 [root@hadoop102 ~]# hdfs dfs -mkdir -p /USAdatas/geodatas/inputs [root@hadoop102 ~]# hd ...
分类:
数据库 时间:
2021-06-18 19:17:01
阅读次数:
0
标准化训练 (StandardScalerTrainBatchOp) Java 类名:com.alibaba.alink.operator.batch.dataproc.StandardScalerTrainBatchOp Python 类名:StandardScalerTrainBatchOp 功 ...
分类:
其他好文 时间:
2021-06-18 19:15:48
阅读次数:
0
在大数据智慧时代背景下,爬虫技术的需求愈发增多。而在最近,淘宝网的大量用户数据就遭到了泄露。6月3日,商丘市睢阳区人民法院在裁判文书网,公开了一份刑事判决书,显示两名犯罪分子在淘宝爬取并盗走大量数据。 经过检方核实,被盗取的淘宝用户数据近 12 亿条。淘宝去年 8 月 14 日报警,有黑产人员通过接 ...
分类:
其他好文 时间:
2021-06-17 17:19:00
阅读次数:
0
1、保留相对集中的图斑,删除零星图斑 利用聚合面,再按面积排序删除面积小于某一阈值的图斑 2、按点删除线上的节点 将线转点,再用点擦除点,将擦除后的点转线。 3、计算要素几何属性-坐标、面积等 “添加几何属性” 4、ArcGIS多环缓冲区制作色带 “多环缓冲区” 5、ArcGIS简单栅栏制作 在ar ...
分类:
其他好文 时间:
2021-06-17 17:16:14
阅读次数:
0