前言 一直以来我都是从书上、博客上、别人口中听说数据倾斜,自己也从而指导一些解决数据倾斜的方式或者一些容易出现数据倾斜的场景。但是从来没有认真的去发现过,寻求过,研究过。 正文 我打开了hive官网 点开了 document文档 然后呢,一个一个的去找倾斜的地方,找了一会儿发现了一个地方,看到了一个 ...
分类:
其他好文 时间:
2020-06-24 13:49:25
阅读次数:
45
Substring with Concatenation of All Words (H) 题目 You are given a string, s, and a list of words, words, that are all of the same length. Find all star ...
分类:
其他好文 时间:
2020-06-24 12:04:23
阅读次数:
38
函数 1.hive函数分类 标准函数 自定义标准函数称之为 UDF 传递一行数据,返回一个结果 聚合函数 自定义聚合函数称之为 UDAF 传递多行数据,返回一个结果 group by sum count 表生成函数 自定义表生成函数称之为 UDTF 传递一行数据,返回多行数据 explode 2.函 ...
分类:
其他好文 时间:
2020-06-23 20:54:23
阅读次数:
64
1、下载源码:http://www.boost.org/ 2、tar zxvf boost_1_70_0.tar.gz 3、cd boost_1_70_0 4、 ./bootstrap.sh --with-libraries=all --with-toolset=gcc--with-librarie ...
分类:
系统相关 时间:
2020-06-23 19:26:01
阅读次数:
92
需求:将 table 中的 radio 改为 checkbox 并保持同样的效果 HTML部分: <el-table :data="tableData" tooltip-effect="dark" style="width: 100%" ref="multipleTable" @select-all ...
分类:
其他好文 时间:
2020-06-23 19:19:01
阅读次数:
244
一、选题与意义 1.Hadoop平台应用 选题:Hadoop平台应用。 简要说明理由与意义。 可以让我们熟悉Linux系统、MySQL、Hadoop、HBase、Hive、Sqoop、R、Eclipse等系统和软件的安装和使用; 了解大数据处理的基本流程; 熟悉数据预处理方法; 熟悉在不同类型数据库 ...
分类:
其他好文 时间:
2020-06-23 19:18:44
阅读次数:
72
前言 当Cabloy-企业微信模块完成时,加上之前已完成的Cabloy-微信模块,关于在CabloyJS中与微信/企业微信对接的任务已经完成了。这些模块的目标就是,只需填入各类服务的参数,就可以直接进入具体的业务开发,从而达到开箱即用的效果 背景分析 1. 账户体系 微信/企业微信的开发,有诸多的坑 ...
分类:
微信 时间:
2020-06-23 19:05:48
阅读次数:
96
深度剖析了各个基础技术的源码(ZooKeeper、Hive、Spark、Flink、Hadoop等),对这些基础技术知识动态的排列组合,形成大数据全局架构观,并深入讲述大数据全局架构设计的方方面面,打造真正满足企业万亿级海量数据规模的数据中台,真正赋能前台业务。同时,在企业万亿级真实项目落地环节,采用高性能、高可用、高扩展的架构设计原则,技术上更是融合了企业级主流的离线架构和实时架构,带领大家构建
分类:
其他好文 时间:
2020-06-23 18:39:30
阅读次数:
58
一、选题与意义 1.Hadoop平台应用 2.Kaggle分析数据项目 选择1.Hadoop平台应用, 淘宝双11数据分析与预测 理由:比较有兴趣 二、实践方案 步骤零:实验环境准备 查看实验指南 步骤一:本地数据集上传到数据仓库Hive 查看实验指南 步骤二:Hive数据分析 查看实验指南 步骤三 ...
分类:
其他好文 时间:
2020-06-23 17:11:36
阅读次数:
53
感谢分享:http://blog.sina.com.cn/s/blog_7e04e0d00102w140.html 采集程序是使用hive -f xx.hql> xx.out,在使用sqoop将数据导入关系型数据库。 最近赶上大数据平台升级,忽然之间跑的好好的任务忽然报错说类型转换错误。 结果经查询 ...
分类:
其他好文 时间:
2020-06-23 15:54:30
阅读次数:
73