码迷,mamicode.com
首页 >  
搜索关键字:streaming 本质解析    ( 1222个结果
一次因为数据问题引起的reduce被卡住streaming作业问题排查
广告产品技术部有一个作业总是卡在某个reduce上,运行了好几个小时也运行不完,经过他们初步排查找不着问题原因,发邮件让我帮看看,我看了一下这个streaming作业是用python实现的,而且听他们描述,3月17之前该作业是没问题的,以下是可能存在问题的地方:...
分类:其他好文   时间:2015-03-21 12:42:36    阅读次数:150
Spark Streaming原理简析
执行流程数据的接收StreamingContext实例化的时候,需要传入一个SparkContext,然后指定要连接的spark matser url,即连接一个spark engine,用于获得executor。实例化之后,首先,要指定一个接收数据的方式,如val lines = ssc.socketTextStream("localhost", 9999)这样从socket接收文本数据。这个步骤...
分类:其他好文   时间:2015-03-19 16:25:47    阅读次数:155
通过脚本使用Streaming遇到的问题及解决办法
《Hadoop 实战》中的“通过脚本使用Streaming”其中的一个示例:使用脚本来均匀采样一个按行组织的数据文件,在Ubuntu终端输入如下命令:结果如下:修改命令:输出文件如下:
分类:其他好文   时间:2015-03-17 17:35:35    阅读次数:132
sparkstreaming源码分析
做个笔记,记录streaming任务执行的整个流程,下文使用的源码是master分支的代码,1.2.1版本已经发布,应该和1.2.1差别不大1、streaming程序是从StreamingContext.start()开始的,做一个必要的参数检查然后启动jobschedulerStreamingContext.scaladefstart():Unit=synchronized..
分类:其他好文   时间:2015-03-06 19:18:24    阅读次数:322
整合Kafka到Spark Streaming——代码示例和挑战
作者Michael G. Noll是瑞士的一位工程师和研究员,效力于Verisign,是Verisign实验室的大规模数据分析基础设施(基础Hadoop)的技术主管。本文,Michael详细的演示了如何将Kafka整合到Spark Streaming中。 期间,...
分类:其他好文   时间:2015-03-03 16:51:30    阅读次数:209
整合Kafka到Spark Streaming——代码示例和挑战
作者Michael G. Noll是瑞士的一位工程师和研究员,效力于Verisign,是Verisign实验室的大规模数据分析基础设施(基础Hadoop)的技术主管。本文,Michael详细的演示了如何将Kafka整合到Spark Streaming中。 期间, Michael还提到了将Kafka整合到 Spark Streaming中的一些现状,非常值得阅读,虽然有一些信息在Spark 1.2版...
分类:其他好文   时间:2015-03-03 15:11:59    阅读次数:269
nginx支持flv MP4 扩展nginx_mod_h264_streaming,nginx-rtmp-module-master,yamdi
./configure \--prefix=/usr/local/nginx \--sbin-path=/usr/local/nginx/sbin/nginx \--conf-path=/usr/local/nginx/conf/nginx.conf \--error-log-path=/usr/l...
分类:其他好文   时间:2015-03-03 14:57:29    阅读次数:1048
使用OSMF实现实时多播流处理
原文地址:http://www.adobe.com/cn/devnet/flashmediaserver/articles/multicast_streaming_osmf.html使用OSMF实现实时多播流处理在本文中,将借助Adobe Flash Media Live Encoder、Adobe...
分类:其他好文   时间:2015-02-22 23:01:30    阅读次数:309
【转】输入/输出流 - 深入理解Java中的流 (Stream)
基于流的数据读写,太抽象了,什么叫基于流,什么是流?Hadoop是Java语言写的,所以想理解好Hadoop的Streaming Data Access,还得从Java流机制入手。流机制也是JAVA及C++中的一个重要的机制,通过流使我们能够自由地操作包括文件,内存,IO设备等等中的数据。首先,流是...
分类:编程语言   时间:2015-02-22 19:35:17    阅读次数:247
Spark streaming-1
1、NetworkWordCount 1.1、开启发送数据的服务器 cd /home/jianxin/spark java -jar LoggerSimulation.jar 9999 10 java -jar NetworkWordCount.jar localhost 9999 netstat -nalp | grep 9999 lsof -i:99991.2、...
分类:其他好文   时间:2015-02-16 14:20:21    阅读次数:183
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!