码迷,mamicode.com
首页 >  
搜索关键字:hadoop eclipse    ( 38228个结果
Hive的基本介绍
什么是Hive? Hive:由Facebook开源用于解决海量结构化日志的数据统计工具。 Hive 是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张表,并提供类SQL查询功能。 本质是:将SQL转化成MapReduce程序。 1、Hive 处理的数据存储在HDFS; 2、Hiv ...
分类:其他好文   时间:2020-12-03 11:43:46    阅读次数:3
4. Eclipse集成Git
4.1 Git插件 Eclipse中已经内置了Git插件 4.2 把工程初始化为本地库 初始化 设置本地库范围的签名 4.3 Git图标 4.4 Eclipse特定文件 Eclispe特定文件介绍 为何要忽略特定文件 不同IDE相关工程特定文件就有可能不同。如果这些文件加入版本控制,那么开发时很有可 ...
分类:系统相关   时间:2020-12-02 12:31:47    阅读次数:7
zookeeper技术介绍[python书籍福利]
zookeeper技术介绍[python书籍福利]Zookeeper技术介绍ZooKeeper是一个分布式的,开放源码的分布式应用程序协调服务,是Google的Chubby一个开源的实现,是Hadoop和Hbase的重要组件。它是一个为分布式应用提供一致性服务的软件,提供的功能包括:配置维护、域名服务、分布式同步、组服务等。ZooKeeper的目标就是封装好复杂易出错的关键服务,将简单易用的接口和
分类:编程语言   时间:2020-12-02 11:57:17    阅读次数:3
Cloudera Manager的基本使用
>.ClouderaManager功能 1.1>.管理监控集群主机(主要监控硬件和软件的信息); 1.2>.同一管理配置(主要是针对服务,比如hdfs,hbase等等); 1.3>.管理维护Hadoop平台系统; 2>.ClouderaManager的一些常见名词 2.1>.主机-host 2.2> ...
分类:其他好文   时间:2020-12-01 11:54:36    阅读次数:3
Java 性能分析工具-MAT
简介 MAT 是Memory Analyzer的简称,他是一宽功能强大的Java堆内存分析器。多用于查找内存泄露以及查看内存消耗情况。 基于Eclipse开发,是一款免费的Java性能分析功能 下载安装 https://www.eclipse.org/mat/downloads.php 分析dump ...
分类:编程语言   时间:2020-11-30 16:10:09    阅读次数:11
如何使用eclipse使用Maven
如何使用eclipse使用Maven Maven Eclipse Eclipse 提供了一个很好的插件 m2eclipse ,该插件能将 Maven 和 Eclipse 集成在一起。 在最新的 Eclipse 中自带了 Maven,我们打开,Windows->Preferences,如果会出现下面的 ...
分类:系统相关   时间:2020-11-26 15:03:00    阅读次数:7
Hadoop框架:MapReduce基本原理和入门案例
MapReduce既是一个编程模型,也是一个计算组件,处理的过程分为两个阶段,Map阶段:负责把任务分解为多个小任务,Reduce负责把多个小任务的处理结果进行汇总。其中Map阶段主要输入是一对Key-Value,经过map计算后输出一对Key-Value值;然后将相同Key合并,形成Key-Value集合;再将这个Key-Value集合转入Reduce阶段,经过计算输出最终Key-Value结果集。
分类:其他好文   时间:2020-11-26 14:53:23    阅读次数:6
计数器
package com.atguigu.etl; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.Path; import org.apache.hadoop.io.NullWritable; impo ...
分类:其他好文   时间:2020-11-25 13:04:03    阅读次数:26
eclipse使用单元测试JUnit时,提示导包失败“The type org.junit.jupiter.api.Assertions is not accessible”?
解决方案:删除工程下面的module-info.java文件即可。 https://stackoverflow.com/questions/60431564/eclipse-java-ide-junit5-junit-jupiter-api-assertions-is-not-accessible ...
分类:数据库   时间:2020-11-25 12:52:40    阅读次数:10
大数据组件
1.大数据架构图谱 文件系统 HDFS Hadoop Distributed File System,简称HDFS,是一个分布式文件系统。HDFS是一个高度容错性的系统,适合部署在廉价的机器上。HDFS能提供高吞吐量的数据访问,非常适合大规模数据集上的应用。 GlusterFS 是一个集群的文件系统 ...
分类:其他好文   时间:2020-11-25 12:06:50    阅读次数:8
38228条   上一页 1 ... 23 24 25 26 27 ... 3823 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!