搜索关键字：hadoop hdfs mapreduce yarn，搜索到18270个结果！码迷,mamicode.com！

Kafka基础教程（一）：认识Kafka

Kafka是Apache下的一个子项目，是一个高性能跨语言分布式发布/订阅消息队列系统，吞吐速率非常快，可以作为Hadoop的日志收集。Kafka是一个完全的分布式系统，这一点依赖于Zookeeper的分布式实现。本文为新手准备，从Kafka的一些术语概念方面去认识Kafka。 Broker Ka ...

分类：其他好文时间：2020-09-18 17:19:41 阅读次数：37

四、Hadoop HA 集群搭建

Hadoop HA 集群搭建 Hadoop HA 集群搭建Hadoop 完全分布式环境搭建集群规划集群部署前提Hadoop伪分布式环境搭建配置IP映射安装 Java 与 Hadoop配置 Hadoop配置 MapReduce 与 YARN集群配置配置基本参数配置 SSH 免密登录格式化 HDFS启动 ...

分类：其他好文时间：2020-09-18 03:33:30 阅读次数：38

Flink(二)【架构原理，组件，提交流程】

一.运行架构 1.架构基于yarn模式 0) Flink任务提交后，Client向HDFS上传Flink的Jar包和配置 1) 向Yarn ResourceManager提交任务， 2) ResourceManager分配Container资源，Yarn通知NodeManager启动Applica ...

分类：其他好文时间：2020-09-18 03:25:46 阅读次数：38

HDFS个人数据存储的核心--分布式+共享存储

HDFS个人数据存储的核心--分布式+共享存储5G时代得到来，大数据存储迅速暴涨，个人存储市场的存量不断扩大，同时增量也在快速增长，预计每年个人产生的数据会有20%的复合增长率，每年的会释放数十亿美元产值的数据存储市场增量。关于接下来的个人数据存储市场发展的方向，不仅仅是一个经济问题而且更加是互联网世界“个人主权”的问题，是隐私、安全、便捷等各种因素的集合，往大了说如果个人数据的问题得不到突破性的

分类：其他好文时间：2020-09-18 02:37:28 阅读次数：36

安装Hadoop

一、大数据大数据的特性（一）大体量，可从数百TB，PB，EB （二）多样性，大数据包括各种格式和形态的数据（三）时效性，很多大数据需要在一定的时间限度下得到及时处理（四）准确性，处理的结果一定要准备性（五）大价值，大数据包含很多的深度的价值，大数据分析挖掘和利用将带来巨大的商业价值二、H ...

分类：其他好文时间：2020-09-18 02:20:12 阅读次数：35

Eclipse 配置hadoop

#1.安装Eclipse EE版本 #2.配置Eclipse 配置Eclipse 将插件hadoop-eclipse-plugin-2.6.0jar拷贝到Eclipse安装目录下的dropins目录启动Eclipse,增加Map/Reduce功能区增加Hadoop集群的连接导入MapReduc ...

分类：系统相关时间：2020-09-18 01:39:40 阅读次数：46

【赵强老师】在MongoDB中使用MapReduce方式计算聚合

MapReduce能够计算非常复杂的聚合逻辑，非常灵活，但是，MapReduce非常慢，不应该用于实时的数据分析中。MapReduce能够在多台Server上并行执行，每台Server只负责完成一部分wordload，最后将wordload发送到MasterServer上合并，计算出最终的结果集，返回客户端。MapReduce的基本思想，如下图所示：在这个例子中，我们以一个求和为例。首先执行Map

分类：数据库时间：2020-09-18 00:43:16 阅读次数：38

Hadoop和Yarn的配置文件

Hadoop配置文件

分类：其他好文时间：2020-09-18 00:36:12 阅读次数：32

5G时代面临数据暴增，HDFS将解决数据存储的燃眉之急

5G时代面临数据暴增，HDFS将解决数据存储的燃眉之急随着互联网5G的到来，快速化推动AI人工智能、智能家居、人类生活的智能化、无人驾驶、AR、高清直播等新兴领域的高速发展，5G时代面临数据暴增，如何解决存储难题及如何降低数据的存储成本成为世界关注的焦点，分布式存储无疑是时代最大的风口。在大趋势的驱动之下，从前两年开始分布式存储项目便不断涌现，但真正能够做到落地应用，并规模发展越来越大的项目却寥寥

分类：其他好文时间：2020-09-18 00:28:27 阅读次数：46

Hive SQL使用过程中的奇怪现象

hive是基于Hadoop的一个数据仓库工具，用来进行数据的ETL，这是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制。hive能将结构化的数据文件映射为一张数据库表，并提供SQL查询功能。HiveSQL是一种类SQL语言，与关系型数据库所支持的SQL语法存在微小的差异。本文对比MySQL和Hive所支持的SQL语法，发现相同的SQL语句在Hive和MySQL中输出结果的会有所不同

分类：数据库时间：2020-09-17 23:41:17 阅读次数：49

共18270条上一页 1 ... 30 31 32 33 34 ... 1827 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)