码迷,mamicode.com
首页 >  
搜索关键字:hdfs    ( 4980个结果
Hadoop HDFS (3) JAVA访问HDFS之二 文件分布式读写策略
先把上节未完成的部分补全,再剖析一下HDFS读写文件的内部原理 列举文件 FileSystem(org.apache.hadoop.fs.FileSystem)的listStatus()方法可以列出一个目录下的内容。 public FileStatus[] listStatus(Path f) throws FileNotFoundException, IOException; pu...
分类:编程语言   时间:2014-09-30 16:47:19    阅读次数:271
Hadoop Shell命令字典(可收藏)
可以带着下面问题来阅读:1.chmod与chown的区别是什麽?2.cat将路径指定文件的内容输出到哪里?3.cp能否是不同之间复制?4.hdfs如何查看文件大小?5.hdfs如何合并文件?6.如何显示当前路径下的所有文件夹和文件7.rm删除文件失败的原因什么?8.如何查看文件的创建时间9.查看文件...
分类:其他好文   时间:2014-09-29 11:08:57    阅读次数:334
Hadoop HDFS (3) JAVA访问HDFS
现在我们来深入了解一下Hadoop的FileSystem类。这个类是用来跟Hadoop的文件系统进行交互的。虽然我们这里主要是针对HDFS,但是我们还是应该让我们的代码只使用抽象类FileSystem,这样我们的代码就可以跟任何一个Hadoop的文件系统交互了。在写测试代码时,我们可以用本地文件系统测试,部署时使用HDFS,只需配置一下,不需要修改代码了。 在Hadoop 1.x以后的版本中引入...
分类:编程语言   时间:2014-09-29 01:24:17    阅读次数:273
hadoop 学习
不同版本间Hadoop拷贝通过NFS,将hdfs挂在到本地
分类:其他好文   时间:2014-09-28 22:44:25    阅读次数:149
Hadoop集群_Hadoop安装配置
1、集群部署介绍1.1 Hadoop简介 Hadoop是Apache软件基金会旗下的一个开源分布式计算平台。以Hadoop分布式文件系统(HDFS,Hadoop Distributed Filesystem)和MapReduce(Google MapReduce的开源实现)为核心的Hadoop为用....
分类:其他好文   时间:2014-09-28 14:04:02    阅读次数:309
MapReduce 编程 系列五 MapReduce 主要过程梳理
前面4篇文章介绍了如何编写一个简单的日志提取程序,读取HDFS share/logs目录下的所有csv日志文件,然后提取数据后,最终输出到share/output目录下。本篇停留一下,梳理一下主要过程,然后提出新的改进目标。首先声明一下,所有的代码都是maven工程的,没有使用任何IDE。  这是我一贯的编程风格,用Emacs + JDEE开发。需要使用IDE的只需要学习如何在IDE中使用mave...
分类:其他好文   时间:2014-09-27 22:45:50    阅读次数:256
MapReduce 编程 系列四 MapReduce例子程序运行
MapReduce程序编译是可以在普通的Java环境下进行,现在来到真实的环境上运行。首先,将日志文件放到HDFS目录下$ hdfs dfs -put *.csv /user/chenshu/share/logs/ 14/09/27 17:03:22 WARN util.NativeCodeLoader: Unable to load native-hadoop library for your...
分类:其他好文   时间:2014-09-27 21:04:00    阅读次数:233
HDFS概述
HDFS特点概述 Hadoop整合抽象了众多的文件系统类,HDFS只是其中一种的具体实现。它是基于流数据模式和处理超大文件的需求开发的,主要特点如下: 处理超大文件 这里的超大文件通常是指MB到TB级别的数据文件,在实际应用中已经可达到PB级。 流式地访问数据 HDFS提供一次写入,多次读取的服务。...
分类:其他好文   时间:2014-09-27 20:51:00    阅读次数:665
利用CURL命令调用WebHDFS REST API与Kerberos机制
1. CURL安装 cURL是一个利用URL语法在命令行下工作的文件传输工具,1997年首次发行。它支持文件上传和下载,所以是综合传输工具,但按传统,习惯称cURL为下载工具。cURL还包含了用于程序开发的libcurl。CURL官方网站:http://curl.haxx.se/ 1.1 Linux安装 这个网上资料比较多,只要搜索“curl 安装 linux”就应该有不少介绍。 1....
分类:Windows程序   时间:2014-09-26 21:15:28    阅读次数:947
Hadoop 2.2在linux上伪分布安装
1、确认java已经安装[root@carefree~]#java-version javaversion"1.7.0_51" Java(TM)SERuntimeEnvironment(build1.7.0_51-b13) JavaHotSpot(TM)64-BitServerVM(build24.51-b03,mixedmode)Hadoop2.2官方建议使用jdk1.6(sun)以上,我们这里使用1.7。Jdk安装比较简单,不做演示..
分类:系统相关   时间:2014-09-24 19:07:18    阅读次数:318
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!