搜索关键字：spark hadoop，搜索到19685个结果！码迷,mamicode.com！

just a demo

<！-- demodemo.xml --><dependency> <groupId>org.apache.hadoop</groupId> <artifactId>hadoop-mapreduce-client-core</artifactId> <version>2.7.0</version> ...

分类：其他好文时间：2021-01-26 12:23:58 阅读次数：0

Spark实战(三)本地连接远程Spark(Python环境)

一、Python环境准备远程服务器上Python版本要与本地想匹配，这里本地使用Anaconda来进行安装，远程服务器之间安装。 wget --no-check-certificate https://www.python.org/ftp/python/3.6.7/Python-3.6.7.tgz ...

分类：编程语言时间：2021-01-25 11:30:39 阅读次数：0

Spark面试常见问题(一)--RDD基础

1 RDD基础知识 1.1 Spark的RDD五大特性 1.1.1 A list of partitions RDD是一个由多个partition（某个节点里的某一片连续的数据）组成的的List；将数据加载为RDD时，一般一个hdfs里的block会加载为一个partition。对于RDD来说，每 ...

分类：其他好文时间：2021-01-25 11:30:09 阅读次数：0

三、zookeeper常用shell命令

一、新增节点语法 #其中-s 为有序节点，-e 临时节点 create [-s] [-e] path data 创建持久化节点并写入数据： # 创建hadoop节点并写入数据123456： create /hadoop "123456" 创建持久化有序节点，此时创建的节点名为指定节点名 + 自增序 ...

分类：系统相关时间：2021-01-22 12:13:51 阅读次数：0

Trino总结

文章目录 1.Trino与Spark SQL的区别分析 2.Trino与Spark SQL解析过程对比 3.Trino基本概念 4.Trino架构 5.Trino SQL执行流程 6.Trino Task执行流程相关参考： 1.Trino与Spark SQL的区别分析 2.Trino与Spark ...

分类：其他好文时间：2021-01-22 12:05:01 阅读次数：0

spark2.2 + jdk1.8 + centos7集群安装教程（单个Master，不依赖hadoop安装）

1.准备环境安装centos7，在此我准备了五个虚拟机，分别命名为L1，L2,L3,L4,L5.计划在L1上面运行Master节点，在L3,L4,L5上面运行Worker节点。网络配置以及ssh免密登陆配置不再详细讲解，请参考我的另外一篇博客：虚拟机网络配置以及准备工作：https://blog. ...

分类：其他好文时间：2021-01-22 11:44:51 阅读次数：0

Hive整合Hbase

HBase 虽然可以存储数亿或数十亿行数据，但是对于数据分析来说，不太友好，只提供了简单的基于 Key 值的快速查询能力，没法进行大量的条件查询。现有hbase的查询工具有很多如：Hive，Tez，Impala，Shark/Spark，Phoenix等。今天主要说Hive，Hive方便地提供了Hiv ...

分类：其他好文时间：2021-01-21 10:54:30 阅读次数：0

1，认识java

Java诞生于1995年 JVM = java虚拟机 Java virtual machine 图形界面的程勋Applet，现在逐渐被淘汰 1998年java分为三个部分 - java2标准版（J2SE）占领桌面端 - java2移动版（J2ME）占领手机端 - java2企业版（J2EE）占 ...

分类：编程语言时间：2021-01-20 11:56:51 阅读次数：0

Hadoop HA 模式搭建

一、 Hadoop 集群架构设计二、搭建集群修改IP地址与hostname以及部署zookeeper、hadoop见上一篇博文《Hadoop 完全分布式搭建》。三、修改配置文件修改nna上的core-site.xml <configuration> <!-- 指定hdfs的names ...

分类：其他好文时间：2021-01-19 12:16:24 阅读次数：0

zookeeper：安装和测试

前言：端口号：21881 ZooKeeper是一个分布式的，开放源码的分布式应用程序协调服务，是Google的Chubby一个开源的实现，是Hadoop和Hbase的重要组件。它是一个为分布式应用提供一致性服务的软件，提供的功能包括：配置维护、域名服务、分布式同步、组服务等。本质：主要作用是注册 ...

分类：其他好文时间：2021-01-19 12:08:39 阅读次数：0

共19685条上一页 1 ... 19 20 21 22 23 ... 1969 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)