Architectur所有优秀的互联网技术都有“architecture”——一种将各种实体联系在一起进行沟通合交流的方式。比如说万维网(the World Wide Web)是由无数的运行着apache的服务器,与不计其数的运行类似Firefox的客户端,通过使用标准的协议和数据格式如HTTP和H...
分类:
其他好文 时间:
2014-10-28 00:33:54
阅读次数:
180
1、Eclipse 读取hdfs文件错误: java.io.IOException: Could not obtain block: blk_194219614024901469_1100 file=/user/hive/warehouse/src_20090724_log/src_20090724...
分类:
其他好文 时间:
2014-10-26 16:53:15
阅读次数:
178
阅读导读:
1.简述用Mahout实现协同过滤ItemCF的步骤?
2.如何用API实现Hadoop的各种HDFS命令?
3.Kmeans.java类报错,暂时可以怎么处理?
1.
Mahout开发环境介绍
在用Maven构建Mahout项目文章中,我们已经配置好了基于Maven的Mahout的开发环境,我们将继续完成Mahout的分步式的程序开发。
本文的...
分类:
其他好文 时间:
2014-10-26 14:23:16
阅读次数:
297
user --> ha( 双机热备 436) --> lb( 调度器 ) --> 应用( www ftp ) --> sql( mysql pgsql oracle redis )--> 文件系统( mfs hdfs )--> i/o( ssd )RHCA 442 413 318虚拟:RHEV op...
分类:
其他好文 时间:
2014-10-25 15:48:54
阅读次数:
602
在Xcode 6 beta里编译Cocos2d-x iOS项目时可能会失败,提示如下错误:Undefined symbols for architecture i386:"_fwrite$UNIX2003", referenced from: _unixErrorHandler in libcoco...
分类:
移动开发 时间:
2014-10-25 14:23:11
阅读次数:
214
副本机制1、副本摆放策略第一副本:放置在上传文件的DataNode上;如果是集群外提交,则随机挑选一台磁盘不太慢、CPU不太忙的节点上;第二副本:放置在于第一个副本不同的机架的节点上;第三副本:与第二个副本相同机架的不同节点上;如果还有更多的副本:随机放在节点中;2、副本系数1)对于上传文件到HDF...
分类:
其他好文 时间:
2014-10-24 23:29:26
阅读次数:
412
Apache HBase是Hadoop的分布式开源的存储管理工具,非常适合随机实时的io操作。
我们知道,Hadoop的Sequence File是一个顺序读写,批量处理的系统。但是为什么HBase能做到随机的,实时的io操作呢?
Hadoop底层使用Sequence File文件格式存储,Sequence File允许以追加的方式增加k-v(Key-Value)数据,根据hdfs的appen...
分类:
其他好文 时间:
2014-10-24 20:54:39
阅读次数:
269
文件系统中metadata是一个关键元素,每一个分布式文件系统的核心所在就是mds的设计。类似HDFS,Clustre,FastDFS等等分布式文件系统采用的是独立的mds架构,Ceph采用的是讲mds也分布开的设计架构,Gluster的设计是将metadata跟数据文件结合方式来存储,基本上只存跟本地文件有..
分类:
其他好文 时间:
2014-10-24 16:48:38
阅读次数:
1220
环境 : 64位 ubuntu 14.04步骤:1.dpkg --add-architecture i386apt-get update2.sudo apt-get install lib32z1-dev3.sudo apt-get install libgtk2.0-0:i386 libpango...
分类:
系统相关 时间:
2014-10-24 14:32:23
阅读次数:
168