hadoop是有apache基金会所开发的分布式系统基础架构,其主要提供了两方面的功能:分布式存储和分布式计算。其中分布式存储是分布式计算的基础,在hadoop的实现里面,提供了分布式存储的接口,并自己实现了一个分布式存储的实现即HDFS,但并不代表hadoop只支持HDFS这一中实现,其同时支持别的存储系统,并在别的存储系统上运行分布式计算程序(mapreduce)。 从开发角度来说,h...
分类:
其他好文 时间:
2014-11-11 09:22:37
阅读次数:
239
要说jQuery 最成功的地方,我认为是它的可扩展性吸引了众多开发者为其开发插件,从而建立起了一个生态系统。这好比大公司们争相做平台一样,得平台者得天下。苹果,微软,谷歌等巨头,都有各自的平台及生态圈。学会使用jQuery并不难,因为它简单易学,并且相信你接触jQuery后肯定也使用或熟悉了不少其插...
分类:
Web程序 时间:
2014-11-07 16:21:14
阅读次数:
165
目录1.hadoop分布式安装2.zookeeper分布式安装3.hbase分布式安装4.pig分布式安装5.hive客户端安装
分类:
其他好文 时间:
2014-10-31 08:45:43
阅读次数:
244
1.什么是MLBaseMLBase是Spark生态圈的一部分,专注于机器学习,包含三个组件:MLlib、MLI、ML Optimizer。ML Optimizer: This layer aims to automating the task of ML pipeline construction....
分类:
编程语言 时间:
2014-10-19 18:30:41
阅读次数:
336
要说jQuery 最成功的地方,我认为是它的可扩展性吸引了众多开发者为其开发插件,从而建立起了一个生态系统。这好比大公司们争相做平台一样,得平台者得天下。苹果,微软,谷歌等巨头,都有各自的平台及生态圈。学会使用jQuery并不难,因为它简单易学,并且相信你接触jQuery后肯定也使用或熟悉了不少其插...
分类:
Web程序 时间:
2014-09-30 18:54:19
阅读次数:
264
注:9 月 19 日,阿里上市之夜,虎嗅微信电台请来三位嘉宾畅聊。第一位天芳集的创始人徐颖女士,是淘宝资深大卖家,拥有近十年的淘宝创业经验,对淘宝、天猫生态圈有切身的体会和了解;第二位是 NOP 的创始人刘爽先生,做过刘强东的助理,对电商有深刻的认识;第三位是起源资本合伙人雷中辉先生,资本运营有很深厚的功底,早年做财经记者时跟过电商。
以下是昨晚的电台访谈实录精华。
1、主持人...
分类:
其他好文 时间:
2014-09-22 13:58:12
阅读次数:
223
Hadoop大数据零基础高端实战培训系列配文本挖掘项目大数据Hadoop实战视频教程就从最基础的Java语法、数据库、Linux讲起到深入Hadoop大数据技术所必须的所有知识,设计Hadoop生态圈所有常用组件,包括但不限于:Greenplum数据库、HBase、Hive、Pig、ZooKeepe...
分类:
其他好文 时间:
2014-09-18 14:33:03
阅读次数:
267
下面这个 ppt 放在 slideshare 上面,需要梯子才看得到哦!
分类:
其他好文 时间:
2014-09-15 08:46:48
阅读次数:
146
Spark生态圈,也就是BDAS(伯克利数据分析栈),是伯克利APMLab实验室精心打造的,力图在算法(Algorithms)、机器(Machines)、人(People)之间通过大规模集成,来展现大数据应用的一个平台,其核心引擎就是Spark,其计算基础是弹性分布式数据集,也就是RDD。通...
分类:
其他好文 时间:
2014-09-12 11:27:23
阅读次数:
293
名篇《过秦论》中有“斩木为兵,揭竿为旗,天下云合响应,赢粮而景从”之名句,而阿里云着力打造的“云合计划”意图十分明显:快速聚集合作伙伴,构建新的云生态体系,在DT时代,加快传统行业向云的转变。围绕着淘宝这个平台,十年间诞生了数十种新职业、数十万家电商服务企业..
分类:
其他好文 时间:
2014-09-09 18:31:29
阅读次数:
245