码迷,mamicode.com
首页 >  
搜索关键字:大数据开发 Hadoop Spark    ( 19831个结果
Spark2.x写Hbase1-2.x
import org.apache.hadoop.hbase.io.ImmutableBytesWritable import org.apache.hadoop.hbase.mapreduce.TableOutputFormat import org.apache.hadoop.hbase.cli ...
分类:其他好文   时间:2020-04-22 09:54:55    阅读次数:108
Spark2.x读Hbase1-2.x
import org.apache.hadoop.hbase.HBaseConfiguration import org.apache.hadoop.hbase.mapreduce.TableInputFormat import org.apache.hadoop.hbase.util.Bytes ...
分类:其他好文   时间:2020-04-22 09:16:07    阅读次数:55
spark streaming 读取kafka两种方式的区别
1】Receiver是使用高层次的consumer Api来实现的。 receiver 接收的消息都是存储在spark Executor中的,然后spark启动jobq去处理那些消息 然而,默认情况下,这种方式会因为底层的失败丢失数据。 如果要启用高可靠机制,让数据零丢失,就必须启用spark st ...
分类:其他好文   时间:2020-04-20 11:59:44    阅读次数:64
入门大数据---Spark学习
一. Spark简介 1.1 前言 Apache Spark是一个计算系统,它的处理速度很快,很通用,并且能集群部署。可以通过Scala,Java,Python和R来操作API。它还提供了了一些高级工具,比如Spark SQL(通过SQL操作),MLlib(机器学习用的),Graphx(图形化操作用 ...
分类:其他好文   时间:2020-04-20 11:44:10    阅读次数:80
Hadoop 系列(四)自定义数据类
一:自定义数据类 为什么需要自定义数据类 上一篇文章里面我们自己写了一个mapreduce 里面的Top N的https://www.cnblogs.com/wuxiaolong4/p/12733518.html,我们可以从代码里面看出来,里面用|作分隔符,这种方法不好,会由于你自己的失误导致读取字 ...
分类:其他好文   时间:2020-04-19 23:46:13    阅读次数:104
scala版本的wordcount
package com.atguigu.bigdata.spark import org.apache.spark.rdd.RDD import org.apache.spark.{SparkConf, SparkContext} object WordCount { def main(args: ...
分类:其他好文   时间:2020-04-19 18:04:25    阅读次数:66
Step by step install and run Hadoop 2.9.1 on Windows 10 64 bit (最全步骤整理)
1. Java Download the Java 1.8 64 bit version from https://java.com/en/download/ If not 64 bit java there will be error when start resource node manage ...
分类:Windows程序   时间:2020-04-19 16:21:45    阅读次数:98
Ubuntu16.04 搭建伪分布式Hadoop环境
0x00 java环境配置 Hadoop需要java环境,首先检测是否存在java环境: java –version 如果没有,则需要去Oracle官网下载jdk: https://www.oracle.com/cn/java/technologies/javase-jdk8-downloads.h ...
分类:系统相关   时间:2020-04-19 13:00:02    阅读次数:84
小记--------sparkSQL - spark基础知识
1.RDD 是spark的核心数据结构,全称是弹性分布式数据集。 本质上是一种分布式的内存抽象,表示一个只读的数据分区集合。一个RDD通常只能通过其他的RDD转换而创建,RDD定义了各种丰富的转换操作,通过转换操作,新的RDD包含了如何从其他RDD衍生所必须的信息。这些信息构成了RDD之间的依赖关系 ...
分类:数据库   时间:2020-04-19 01:15:39    阅读次数:108
HBase的基本使用(安装配置、启动关闭、hbash shell的基本操作)
HBase的前提条件: JDK SSH Hadoop JDK:Hadoop和JDK运行的环境,他们的守护进程运行在JVM下。HBase支持JDK 1.6以上的版本。比如: jdk-8u161-linux-x64.rpm。 SSH:实现简单的服务器与主机的通信。在集群中,只有启动sshd后,才可以通过 ...
分类:系统相关   时间:2020-04-19 00:46:23    阅读次数:101
19831条   上一页 1 ... 90 91 92 93 94 ... 1984 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!