因为想要通过hive作为数据库来保存爬取后和处理完成的数据,需要添加spark的hive支持,这方面还没编译完,所以今天暂时没有这方面的进度,所以写写SparkSteaming。 数据的价值随着时间的流逝而减少 这也正是MapReduce的使用范围所产生的的极大弊端,没法应对大流量的实时数据,MR这 ...
分类:
其他好文 时间:
2020-02-02 21:59:34
阅读次数:
95
多语句表值函数顾名思义是返回了一张表,可以传入多个参数 1.定义 1 Use AdventureWorks2014; 2 go 3 if exists(select * from sys.objects where name='udf_SEL_SalesQuota') 4 drop function ...
分类:
数据库 时间:
2020-02-02 19:37:49
阅读次数:
267
标量函数用于传入多个参数返回一个结果 1.定义 1 use AdventureWorks2014; 2 go 3 if exists(select * from sys.objects where name='udf_GET_AssignedEquipment') 4 drop function d ...
分类:
数据库 时间:
2020-02-02 15:55:54
阅读次数:
94
1、《CentOS6.5下安装Hadoop-2.7.3(图解教程)》 https://www.toutiao.com/i6627365258090512909/ 2、《CentOS6.5-Hadoop2.7.3安装hive-2.1.1》 https://www.toutiao.com/i662772 ...
分类:
其他好文 时间:
2020-02-02 14:10:28
阅读次数:
109
Java连接hive简单操作 首先在使用java连接前我们需要在虚拟机上开启hiveserver2(hiveserver2需要安装),hiveserve2的作用是实现hive可以进行并发操作,否则没有办法实现java对hive的操作。 使用命令:hiveserver2即可打开hiveserver2服 ...
分类:
其他好文 时间:
2020-02-02 14:03:22
阅读次数:
84
开始尝试sparkSQL的尝试编程。 SparkSQL总体来说就是spark中的hive,但麻烦的一点是spark官网下载的并不自带对hive的支持,所以不能使用外部的hive。之后解决。 首先创建了一个json文件用来创建DataFrame,内容为: { "id":1 , "name":" Ell ...
分类:
其他好文 时间:
2020-02-01 23:18:31
阅读次数:
97
使用Sqoop将mysql数据传到hive 系统环境:hadoop2.65,mysql5.7.28,sqoop1.47,hive1.2.2,虚拟机centos7,物理机windows10 注意点:安装sqoop不要将目录设在hadoop下面,否则在运行下面命令时会发生找不到jar包的问题,我估计是系 ...
分类:
其他好文 时间:
2020-02-01 21:20:23
阅读次数:
297
正确返回system的地址的情况下,无法拿shell "通过Ex师傅的博客找解决方法" 简单来说就是返回地址处加个ret,使rsp能栈对齐 ...
分类:
系统相关 时间:
2020-01-31 12:37:59
阅读次数:
73
<?xml version="1.0" encoding="UTF-8"?><!DOCTYPE mapper PUBLIC "-//mybatis.org//DTD Mapper 3.0//EN" "http://mybatis.org/dtd/mybatis-3-mapper.dtd" ><map ...
分类:
移动开发 时间:
2020-01-30 20:51:17
阅读次数:
87