码迷,mamicode.com
首页 >  
搜索关键字:mapreduce 打成jar包    ( 4257个结果
1. 开启 Map 输出阶段压缩(中间压缩)
1 开启 Map 输出阶段压缩(中间压缩) 开启 map 输出阶段压缩可以减少 job 中 map 和 Reduce task 间数据传输量。具体配置如下: 步骤1: 开启 Hive 中间传输数据压缩功能 map 任务和 reduce 任务之间的数据的压缩. hive.exec.compress.i ...
分类:其他好文   时间:2020-09-17 17:04:51    阅读次数:30
hadoop 伪分布式执行 mapreduce 任务时报 running beyond physical memory或者beyond vitual memory limits
当运行中出现Container is running beyond physical memory这个问题出现主要是因为物理内存不足导致的,在执行mapreduce的时候,每个map和reduce都有自己分配到内存的最大值,当map函数需要的内存大于这个值就会报这个错误,解决方法: 在mapredu ...
分类:其他好文   时间:2020-09-17 13:31:24    阅读次数:39
MongoDB教程17-MongoDB聚合
聚合操作主要用于处理数据并返回计算结果。聚合操作将来自多个文档的值组合在一起,按条件分组后,再进行一系列操作(如求和、平均值、最大值、最小值)以返回单个结果。 MongoDB 提供了三种执行聚合的方法:聚合管道、map-reduce 和单一目标聚合方法,这里只介绍前两种方法。 聚合管道方法 Mong ...
分类:数据库   时间:2020-09-17 12:01:48    阅读次数:32
大数据计算的基石——MapReduce
#MapReduce Google File System提供了大数据存储的方案,这也为后来HDFS提供了理论依据,但是在大数据存储之上的大数据计算则不得不提到MapReduce。 虽然现在通过框架的不断发展,MapReduce已经渐渐的淡出人们的视野,越来越多的框架提供了简单的SQL语法来进行大数 ...
分类:其他好文   时间:2020-09-12 21:52:03    阅读次数:61
Sqoop快速入门
1 Sqoop概述 传统的应用程序管理系统,即应用程序与使用RDBMS的关系数据库的交互,是产生大数据的来源之一。由RDBMS生成的这种大数据存储在关系数据库结构中的关系数据库服务器中。 当大数据存储和Hadoop生态系统的MapReduce,Hive,HBase,Cassandra,Pig等分析器 ...
分类:其他好文   时间:2020-09-03 16:44:55    阅读次数:40
java gbk转utf8
我的情况: 没有部署前的spring boot项目:前台请求的参数编码格式是utf8在打成jar包后:前台请求的参数编码格式是gbk 代码: String str = new String(reqUrl.getBytes(), "gbk");byte[] bytes = str.getBytes(S ...
分类:编程语言   时间:2020-08-20 19:22:14    阅读次数:81
mongodb的聚合操作
1.什么是聚合聚合是MongoDB的高级查询语言,它允许我们通过转化合并由多个文档的数据来生成新的在单个文档里不存在的文档信息。MongoDB中聚合(aggregate)主要用于处理数据(诸如统计平均值,求和等),并返回计算后的数据结果,有点类似sql语句中的count(*)。在MongoDB中,有两种方式计算聚合:Pipeline和MapReduce。Pipeline查询速度快于MapReduc
分类:数据库   时间:2020-08-19 20:09:42    阅读次数:128
知识汇总之大数据(1)
1.mapReduce 的shuffle 过程 : https://www.iteye.com/blog/langyu-992916 2.spark streaming : https://www.jianshu.com/p/0691204282ab CAS的理解? https://www.jian ...
分类:其他好文   时间:2020-08-13 12:10:50    阅读次数:53
网站流量日志分析(模块开发——数据预处理)
数据预处理 在正式处理数据之前对收集的数据进行预先处理的操作。 原因:不管通过何种手段收集的数据 往往是不利于直接分析的 数据中存在的格式规整的差异。 目的:把不干净的数据 格式不规则的数据 通过预处理清洗变成格式统一规整的结构化数据 技术:MapReduce 预处理的编程思路问题 在使用mr编程的 ...
分类:Web程序   时间:2020-08-10 17:26:02    阅读次数:80
spark sql/hive小文件问题
针对hive on mapreduce 1:我们可以通过一些配置项来使Hive在执行结束后对结果文件进行合并: 参数详细内容可参考官网:https://cwiki.apache.org/confluence/display/Hive/Configuration+Properties 1 2 3 4 ...
分类:数据库   时间:2020-08-03 19:56:21    阅读次数:103
4257条   上一页 1 ... 6 7 8 9 10 ... 426 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!