码迷,mamicode.com
首页 >  
搜索关键字:hdfs dfsadmin    ( 4996个结果
hbase shell基础和常用命令详解
HBase是Google Bigtable的开源实现,它利用Hadoop HDFS作为其文件存储系统,利用Hadoop MapReduce来处理HBase中的海量数据,利用Zookeeper作为协同服务。1. 简介HBase是一个分布式的、面向列的开源数据库,源于google的一篇论文《bigtab...
分类:系统相关   时间:2014-11-27 22:00:10    阅读次数:291
分布式内存文件系统Tachyon
UCBerkeley研发的Tachyon(超光子['tæki???n],名字要不要这么太嚣张啊:)是一款为各种集群并发计算框架提供内存数据管理的平台,也可以说是一种内存式的文件系统吧。如下图,它就处于这样一个层次:在现有存储系统如HDFS之上,在Spark,MapReduce,Impala等各种计算框架之下。为什么要有这么一个框架呢?MapReduce就不说了,但像Spark这种内存计算框架,为什...
分类:其他好文   时间:2014-11-27 20:29:10    阅读次数:287
史上最牛hadoop2.2伪分布式hdfs数据迁移
hadoop2.2伪分布式hdfs数据迁移...
分类:其他好文   时间:2014-11-27 18:26:42    阅读次数:179
论文学习 - 《Hadoop平台下的海量数据存储技术研究》
摘要 研究背景: 1. 互联网的图片数据急剧膨胀 2. Hadoop平台下的Hdfs分布式文件系统能够很好的处理海量数据 研究内容: 1. Hadoop平台工作原理 2. Hadoop平台下图片存储系统的设计与实现 3. Hadoop平台与Web的整合 创新点: ...
分类:其他好文   时间:2014-11-26 20:41:31    阅读次数:286
HDFS读写数据块--${dfs.data.dir}选择策略
最近工作需要,看了HDFS读写数据块这部分。不过可能跟网上大部分帖子不一样,主要写了${dfs.data.dir}的选择策略,也就是block的放置策略。我主要是从我们工作需要的角度来读这部分代码的。 创建文件总共有两步: 1、在写block之前,需要与NameNode通信来生成文件(INo...
分类:其他好文   时间:2014-11-26 20:33:43    阅读次数:367
hive的数据导入与数据导出(本地,云hdfs),load加载
1数据导入-------------- CREATE EXTERNAL TABLE wizad_mdm_dev_lmj_edition_20141120 ( cookie_id STRING, guid STRING  ) ROW FORMAT DELIMITED  FIELDS TERMINATED BY ','  LINES TERMINATED BY '\n' stored a...
分类:其他好文   时间:2014-11-26 18:54:52    阅读次数:272
hadoop(一)——认识hadoop
Hadoop典型应用有:搜索、日志处理、推荐系统、数据分析、视频图像分析、数据保存等Hadoop的核心是HDFS和mapreduce,两者只是理论基础,不是具体可使用的高级应用,Hadoop旗下有很多经典子项目,比如HBase、Hive等,这些都是基于HDFS和MapReduce发展出来的。mapr...
分类:其他好文   时间:2014-11-26 13:48:30    阅读次数:195
Configuring Other CDH Components to Use HDFS HA with Cloudera Manager 5.2
ConfiguringHBasetoUseHDFSHAnothingtodoUpgradingtheHiveMetastoretoUseHDFSHAConfiguringHuetoWorkwithHDFSHAaddHttpFSroleinstanceunderHDFSRestarttheHueserviceConfiguringImpalatoWorkwithHDFSHAimpala-shell-iimpala-daemon-host[impala-daemon-host:21000]>INVALIDA..
分类:其他好文   时间:2014-11-26 11:39:39    阅读次数:161
Hadoop的HDFS-javaapi
环境配置首先需要在hadoop-env.sh中配置HADOOP_CLASSPATH变量..exportHADOOP_CLASSPATH=/home/hadoop/hadoop-1.2.1/myclass在.bash_profile中配置JAVA_HOME,并且生效测试程序URLCat.java importorg.apache.hadoop.fs.FsUrlStreamHandlerFactory; importorg.apache.hadoop.io.IO..
分类:编程语言   时间:2014-11-26 06:50:59    阅读次数:176
Hadoop的HDFS总结
HDFS提供分布式存储机制,提供可线性增长的海量存储能力自动数据冗余,无须使用Raid,无须另行备份为进一步分析计算提供数据基础HDFS设计基础与目标硬件错误是常态,因此需要冗余流式数据访问.即数据批量读取而非随机读写,hadoop擅长做的是数据分析而不是事务处理大规模数据集简单..
分类:其他好文   时间:2014-11-26 06:49:42    阅读次数:223
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!