码迷,mamicode.com
首页 >  
搜索关键字:hadoop hdfs mapreduce yarn    ( 18270个结果
Kafka基础教程(一):认识Kafka
Kafka是Apache下的一个子项目,是一个高性能跨语言分布式发布/订阅消息队列系统,吞吐速率非常快,可以作为Hadoop的日志收集。Kafka是一个完全的分布式系统,这一点依赖于Zookeeper的分布式实现。 本文为新手准备,从Kafka的一些术语概念方面去认识Kafka。 Broker Ka ...
分类:其他好文   时间:2020-09-18 17:19:41    阅读次数:37
四、Hadoop HA 集群搭建
Hadoop HA 集群搭建 Hadoop HA 集群搭建Hadoop 完全分布式环境搭建集群规划集群部署前提Hadoop伪分布式环境搭建配置IP映射安装 Java 与 Hadoop配置 Hadoop配置 MapReduce 与 YARN集群配置配置基本参数配置 SSH 免密登录格式化 HDFS启动 ...
分类:其他好文   时间:2020-09-18 03:33:30    阅读次数:38
Flink(二)【架构原理,组件,提交流程】
一.运行架构 1.架构 基于yarn模式 0) Flink任务提交后,Client向HDFS上传Flink的Jar包和配置 1) 向Yarn ResourceManager提交任务, 2) ResourceManager分配Container资源,Yarn通知NodeManager启动Applica ...
分类:其他好文   时间:2020-09-18 03:25:46    阅读次数:38
HDFS个人数据存储的核心--分布式+共享存储
HDFS个人数据存储的核心--分布式+共享存储5G时代得到来,大数据存储迅速暴涨,个人存储市场的存量不断扩大,同时增量也在快速增长,预计每年个人产生的数据会有20%的复合增长率,每年的会释放数十亿美元产值的数据存储市场增量。关于接下来的个人数据存储市场发展的方向,不仅仅是一个经济问题而且更加是互联网世界“个人主权”的问题,是隐私、安全、便捷等各种因素的集合,往大了说如果个人数据的问题得不到突破性的
分类:其他好文   时间:2020-09-18 02:37:28    阅读次数:36
安装Hadoop
一、大数据 大数据的特性 (一)大体量,可从数百TB,PB,EB (二)多样性,大数据包括各种格式和形态的数据 (三)时效性,很多大数据需要在一定的时间限度下得到及时处理 (四)准确性,处理的结果一定要准备性 (五)大价值,大数据包含很多的深度的价值,大数据分析挖掘和利用将带来巨大的商业价值 二、H ...
分类:其他好文   时间:2020-09-18 02:20:12    阅读次数:35
Eclipse 配置hadoop
#1.安装Eclipse EE版本 #2.配置Eclipse 配置Eclipse 将插件hadoop-eclipse-plugin-2.6.0jar拷贝到Eclipse安装目录下的dropins目录 启动Eclipse,增加Map/Reduce功能区 增加Hadoop集群的连接 导入MapReduc ...
分类:系统相关   时间:2020-09-18 01:39:40    阅读次数:46
【赵强老师】在MongoDB中使用MapReduce方式计算聚合
MapReduce能够计算非常复杂的聚合逻辑,非常灵活,但是,MapReduce非常慢,不应该用于实时的数据分析中。MapReduce能够在多台Server上并行执行,每台Server只负责完成一部分wordload,最后将wordload发送到MasterServer上合并,计算出最终的结果集,返回客户端。MapReduce的基本思想,如下图所示:在这个例子中,我们以一个求和为例。首先执行Map
分类:数据库   时间:2020-09-18 00:43:16    阅读次数:38
Hadoop和Yarn的配置文件
Hadoop配置文件
分类:其他好文   时间:2020-09-18 00:36:12    阅读次数:32
5G时代面临数据暴增,HDFS将解决数据存储的燃眉之急
5G时代面临数据暴增,HDFS将解决数据存储的燃眉之急随着互联网5G的到来,快速化推动AI人工智能、智能家居、人类生活的智能化、无人驾驶、AR、高清直播等新兴领域的高速发展,5G时代面临数据暴增,如何解决存储难题及如何降低数据的存储成本成为世界关注的焦点,分布式存储无疑是时代最大的风口。在大趋势的驱动之下,从前两年开始分布式存储项目便不断涌现,但真正能够做到落地应用,并规模发展越来越大的项目却寥寥
分类:其他好文   时间:2020-09-18 00:28:27    阅读次数:46
Hive SQL使用过程中的奇怪现象
hive是基于Hadoop的一个数据仓库工具,用来进行数据的ETL,这是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制。hive能将结构化的数据文件映射为一张数据库表,并提供SQL查询功能。HiveSQL是一种类SQL语言,与关系型数据库所支持的SQL语法存在微小的差异。本文对比MySQL和Hive所支持的SQL语法,发现相同的SQL语句在Hive和MySQL中输出结果的会有所不同
分类:数据库   时间:2020-09-17 23:41:17    阅读次数:49
18270条   上一页 1 ... 30 31 32 33 34 ... 1827 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!