1、等值比较: = 语法:A=B 操作类型:所有基本类型 描述: 如果表达式A与表达式B相等,则为TRUE;否则为FALSE hive> select 1 from tableName where 1=1; 2、不等值比较: <> 语法: A <> B 操作类型: 所有基本类型 描述: 如果表达式A ...
分类:
其他好文 时间:
2020-07-05 17:05:09
阅读次数:
66
HOG特征描述算子 前言 概念介绍 HOG特征:方向梯度直方图(Histogram of Oriented Gradient,HOG)特征是一种进行物体检测时的特征描述子,它是一种用于表征图像局部梯度方向和梯度强度分布特性的描述符。 特征描述子:计算机不能直接识别图像,所以特征描述子实际上就是图像的 ...
分类:
其他好文 时间:
2020-07-05 15:47:35
阅读次数:
47
VirtualBox虚拟机文件默认存放位置在C盘,hadoop搭建完全分布需要多建立几个虚拟机,C盘就直接炸了,所以先改个默认路径吧。 1.选择全局设定 2.选择你想把虚拟机vdi存放的路径 重点:虚拟机文件迁移方法 1.先把你的某个虚拟机的整个文件夹拷贝到你的目录下去,比如这是我拷过来的文件夹。 ...
分类:
其他好文 时间:
2020-07-05 15:40:50
阅读次数:
90
==背景== 阿里云ECS服务器提示“ZooKeeper未授权访问高危风险” ==相关组件及版本== Linux:Centos 8.0 Zookeeper:3.5.6 Hadoop:2.8.3 Flink:1.10.0 ==Zookeeper ACL介绍== 网上随便找一个网站看看就应该可以了解了, ...
分类:
其他好文 时间:
2020-07-05 15:23:42
阅读次数:
207
RDD概述 RDD:弹性分布式数据集,初学时,可以把RDD看做是一种集合类型(和Array,List类比) RDD的特点: ①有容错性,即数据丢失是可以恢复的 ②有分区机制,可以并行的处理RDD数据 创建RDD的2种方式: ①将一个普通的集合类型(Array或List) ②通过Spark读取外部存储 ...
分类:
其他好文 时间:
2020-07-05 15:15:06
阅读次数:
66
##1. 引入jar包时排除掉jar包冲突 <dependency> <groupId>org.apache.hadoop</groupId> <artifactId>hadoop-hdfs</artifactId> <version>${hadoop-version}</version> <exc ...
分类:
其他好文 时间:
2020-07-05 13:24:51
阅读次数:
48
承接上一篇HDFS实验,学习入门课后的实验真的是以简单为主,后续估计得每个组件一一击破。 Hbase介绍 Hbase是一个分布式的、面向列的开源数据库,源于Google的一篇论文《BigTable:一个结构化的数据的分布式存储系统》。HBase中确定一个元素,需要提供表名,行,列族名,列。因为是以列 ...
分类:
其他好文 时间:
2020-07-05 10:24:53
阅读次数:
74
1、mysql的安装,目的是存放hive的元数据 2、下载hive包,并进行解压 3、配置文件hive-site.xml <configuration> <property> <name>javax.jdo.option.ConnectionURL</name> <value>jdbc:mysql: ...
分类:
其他好文 时间:
2020-07-05 01:05:03
阅读次数:
83
1、脚本化运行 大量的hive查询任务,如果用交互式shell来进行输入的话,显然效率及其低下,因此,生产中更多的是使用脚本化运行机制: 该机制的核心点是:hive可以用一次性命令的方式来执行给定的hql语句 hive -e "insert into table t_dest select * fr ...
分类:
其他好文 时间:
2020-07-05 00:34:10
阅读次数:
60
一、简介JStorm是一个分布式实时计算引擎。JStorm是一个类似于Hadoop MapReduce的系统,用户按照指定的接口实现一个任务,然后将这个任务交给JStorm系统,JStorm将这个任务跑起来,并按7*24小时运行。如果中间一个worker发生了意外故障,调度器立即分配一个新的work ...
分类:
Web程序 时间:
2020-07-04 20:35:29
阅读次数:
54