1,准备编译环境# apt-get install
build-essential下载所需安装包,openssl-1.0.1g.tar.gzpcre-8.35.tar.gzzlib-1.2.8.tar.gznginx_mod_h264_streaming-2.2.7.tar.gznginx-1.6....
分类:
其他好文 时间:
2014-05-31 21:19:58
阅读次数:
372
写在前面前文:用python + hadoop streaming 编写分布式程序(一) --
原理介绍,样例程序与本地调试为了方便,这篇文章里的例子均为伪分布式运行,一般来说只要集群配置得当,在伪分布式下能够运行的程序,在真实集群上也不会有什么问题。为了更好地模拟集群环境,我们可以在mapred-...
分类:
编程语言 时间:
2014-05-30 14:56:56
阅读次数:
309
Hive是基于Hadoop的开源数据仓库工具,提供了类似于SQL的HiveQL语言,使得上层的数据分析人员不用知道太多MapReduce的知识就能对存储于Hdfs中的海量数据进行分析。由于这一特性而收到广泛的欢迎。Hive的整体框架中有一个重要的模块是执行模块,这一部分是用Hadoop中MapRed...
分类:
其他好文 时间:
2014-05-30 14:23:07
阅读次数:
409
自从建了Spark交流的QQ群之后,热情加入的同学不少,大家不仅对Spark很热衷对于Storm也是充满好奇。大家都提到一个问题就是有关storm内部实现机理的资料比较少,理解起来非常费劲。尽管自己也陆续对storm的源码走读发表了一些博文,当时写的时候比较匆忙,有时候衔接的不是太好,此番做了一些整...
分类:
其他好文 时间:
2014-05-30 07:25:09
阅读次数:
286
分布式数据集创建之textFile
文本文件的RDDs能够通过SparkContext的textFile方法创建,该方法接受文件的URI地址(或者机器上的文件本地路径,或者一个hdfs://,
sdn://,kfs://,其他URI).这里是一个调用样例:scala> val distFile...
分类:
其他好文 时间:
2014-05-29 18:58:27
阅读次数:
429
GPU 的硬件基本概念Nvidia的版本: 实际上在 nVidia 的 GPU
里,最基本的处理单元是所谓的 SP(Streaming Processor),而一颗 nVidia 的 GPU 里,会有非常多的 SP 可以同时做计算;而数个
SP 会在附加一些其他单元,一起组成一个 SM(Strea....
分类:
其他好文 时间:
2014-05-28 18:59:32
阅读次数:
292
zookeeper+kafka集群安装之zookeeper集群...
分类:
其他好文 时间:
2014-05-26 04:42:01
阅读次数:
190
这个虚类是kafka.network.Acceptor和kafka.network.Processor的父类,提供了一个抽象的Sever线程。它的有趣之处在于为子类的启动和停止提供了线程间的协作机制。当子类的shutdown方法被调用时,子类可以得知自己被停止,在子类做了适当的处理和清理后,调用自己...
分类:
编程语言 时间:
2014-05-25 19:19:18
阅读次数:
328
apache kafka源代码分析工程搭建(IDEA)...
分类:
其他好文 时间:
2014-05-25 09:04:38
阅读次数:
416
zookeeper+kafka集群安装之二此为上一篇文章的续篇, kafka安装需要依赖zookeeper, 本文与上一篇文章都是真正分布式安装配置, 可以直接用于生产环境.zookeeper安装参考:http://blog.csdn.net/ubuntu64fan/article/details/26678877首先了解几个kafka中的概念:kafka是一个消息队列服务器,服务称为broker...
分类:
其他好文 时间:
2014-05-24 20:48:48
阅读次数:
269