搜索关键字：hadoop、spark，搜索到198个结果！码迷,mamicode.com！

hadoop+Spark+hbase集群动态增加节点

分布式系统的一个优势就是动态可伸缩性，如果增删节点需要重启那肯定是不行的。后来研究了一下，发现的确是不需要重启的。以spark和hadoop为例：不用重启集群，直接在新增的节点上分别启动以下进程即可：一、hadoop增加datanode节点因为1.x版本和2.x版本有比较大的差异，我这里是以2.7为例。在namenode节点上,将hadoop-2.7复制到新节点上,并在新节点上删除data和log

分类：其他好文时间：2018-07-02 12:34:16 阅读次数：180

想学大数据？先看完这几本书再说

真正的数据爱好者有很多需要阅读的内容：大数据，机器学习，数据科学，数据挖掘等。除了这些技术领域，还有一些特定的技术和语言需要你继续研究：Hadoop，Spark，Python，和R等等，还有无数实现自动化的工具等等，这些工具几乎每天都会用到，这就需要你不断的学习。幸运的是，以上提到的这些都不缺关于它 ...

分类：其他好文时间：2018-06-21 23:50:31 阅读次数：325

cdh5.14.2中集成安装kylin与使用测试

cdh5.14.2中集成安装kylin与使用测试标签（空格分隔）：大数据平台构建一：kylin简介二：安装配置kylin三：kylin运行实例一：kylin简介ApacheKylin?是一个开源的分布式分析引擎，提供Hadoop/Spark之上的SQL查询接口及多维分析（OLAP）能力以支持超大规模数据，最初由eBayInc.开发并贡献至开源社区。它能在亚秒内查询巨大的Hive表。kylin软件下

分类：其他好文时间：2018-06-11 23:41:21 阅读次数：994

Hadoop、Spark 集群环境搭建问题汇总

Hadoop 问题1： Hadoop Slave节点 NodeManager 无法启动解决方法： yarn-site.xml reducer取数据的方式是mapreduce_shuffle 问题2：启动hadoop，报错Error JAVA_HOME is not set and could n ...

分类：其他好文时间：2018-06-07 14:27:52 阅读次数：183

（赵强老师原创）搭建CDH实验环境，三个节点的安装配置

本文以三个节点为例（一个Cloudera Manager节点，两个Agent节点），全面细致的介绍了CDH 5.12的安装与部署。

分类：其他好文时间：2018-05-13 22:05:08 阅读次数：242

Spark 的Core深入（二）

Spark 的Core深入

分类：其他好文时间：2018-05-08 12:09:17 阅读次数：235

MapReduce的思想

项目实战案例：搜狗日志查询分析数据：一、电商大数据平台整体架构1、大数据（Hadoop、Spark、Hive）都是一种数据仓库的实现方式核心问题：数据存储、数据计算什么是数据仓库？传统的解决大数据的方式，就是一个数据库一般只做查询2、大数据平台整体的架构部署：Apache、Ambari（HDP）、CDH二、在项目中使用使用瀑布模型（软件工程：方法论）1、瀑布模型几个阶段?2、每个阶段完成的任务三、

分类：其他好文时间：2018-05-06 16:22:50 阅读次数：160

hadoop spark ubuntu16

创建一个新的用户： $sudo useradd m hadoop s /bin/bash 设置用户的密码： $sudo passwd hadoop 添加管理员权限： $sudo adduser hadoop sudo 安装SSH，配置SSH无密码登陆：安装SSH Server： $ sudo ap ...

分类：系统相关时间：2018-04-25 22:11:54 阅读次数：259

大数据常见的9种数据分析手段

数据分析是从数据中提取有价值信息的过程，过程中需要对数据进行各种处理和归类，只有掌握了正确的数据分类方法和数据处理模式，才能起到事半功倍的效果，以下是数据分析员必备的9种数据分析思维模式：1. 分类分类是一种基本的数据分析方式，数据根据其特点，可将数据对象划分为不同的部分和类型，再进一步分析，能够进一步挖掘事物的本质。2. 回归回归是一种运用广泛的统计分析方法，可以通过规定因变量和自变量来确定变量

分类：其他好文时间：2018-04-11 21:40:38 阅读次数：178

从2018年4月开始，看书计划、看书方法和已经看完书的目录

看书的六大分支：大数据（Hadoop、Spark、Hive），概率统计理论，机器学习理论，机器学习应用（编代码），一些框架和库的学习，闲书自己目前在尝试的看书方法：针对每一章节，有代码的能够敲就敲，重在理解，不需要每个细节都记住。等一遍看完一个章节后，再进行总结，这时候最好不翻书，而是在脑子里过一 ...

分类：其他好文时间：2018-04-09 00:08:50 阅读次数：160

共198条上一页 1 ... 4 5 6 7 8 ... 20 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)