搜索关键字：spark 大数据 hadoop yarn，搜索到30860个结果！码迷,mamicode.com！

secondary namenode和namenode分离

namenode 和 secondaryNamenode 运行在同一机器上，分离配置到新节点上。环境：OS：Centos 6.5 x64 & Soft：Hadoop 1.2.1master中的配置不是决定谁是namenode，而是决定谁是secondarynamenode。决定谁是namenode的...

分类：其他好文时间：2014-05-06 01:08:13 阅读次数：388

Apache Spark源码走读之5 -- DStream处理的容错性分析

在流数据的处理过程中，为了保证处理结果的可信度(不能多算，也不能漏算)，需要做到对所有的输入数据有且仅有一次处理。在Spark Streaming的处理机制中，不能多算，比较容易理解。那么它又是如何作到即使数据处理结点被重启，在重启之后这些数据也会被再次处理呢？

分类：其他好文时间：2014-05-06 00:58:21 阅读次数：465

Hadoop集群实施成功后，再次格式化名称节点

Hadoop集群实施成功后，再次格式化名称节点。环境：OS：Centos 6.5 x64 & Soft：Hadoop 1.2.11、格式化之前hadoop集群正常。[huser@master hadoop-1.2.1]$ jps7927 SecondaryNameNode7773 NameNode8...

分类：其他好文时间：2014-05-06 00:52:59 阅读次数：491

怎样控制namenode检查点发生的频率

控制namenode检查点发生的频率。环境：OS：Centos 6.5 x64 & Soft：Hadoop 1.2.11、修改core-site.xml，设置参数。 fs.checkpoint.period 1802、重启集群，查看namenode下文件更新频率，每隔180秒更新一次。[huser@...

分类：其他好文时间：2014-05-06 00:26:48 阅读次数：429

spark 启动job的流程分析

从WordCount开始分析编写一个例子程序编写一个从HDFS中读取并计算wordcount的例子程序: packageorg.apache.spark.examples importorg.apache.spark.SparkContext importorg.apache.spark.SparkContext._ objectWordCount{ defm...

分类：其他好文时间：2014-05-05 13:10:34 阅读次数：463

cygwin

在windows下通过安装cygwin模拟linux环境，然后再安装hadoop，是一种简单方便的方式。为hadoop准备的windows下cygwin环境安装过程如下： - 下载安装文件最新的cygwin安装文件setup.exe下载地址在这里：http://cygwin.com/install.html。用最新版本的cygwin就可以，我用的是2.774版本的安装程序。 - 安装cyg...

分类：Windows程序时间：2014-05-05 13:10:02 阅读次数：536

C2B的未来：大数据定制

昨天看到微信SuperSofter写了一篇文章，有感而发，以便备注。这是一种典型的C2B模式。阿里不只是在与腾讯拼移动，它的电商本土业务也在稳步推进。最近一个里程碑事件是，阿里包下了美的、九阳、苏泊尔等十个品牌的12条生产线，专为天猫特供小家电。阿里通过所掌握的数据以及分析成果，去指导这些生产线的研发、设计、生产、定价。 C2B与规模化之间的矛盾 C2B反向定制模式...

分类：其他好文时间：2014-05-04 00:15:15 阅读次数：289