码迷,mamicode.com
首页 >  
搜索关键字:streaming    ( 1219个结果
Streaming执行Python版WordCount
一:先写map类importsys forlineinsys.stdin: line=line.strip() words=line.split() forwordinwords: print(‘%s\t%s‘%(word,1))二:写reduce类importsys current_word=None current_count=0 word=None forlineinsys.stdin: line=line.strip() word,count=line.split(‘\t‘,1) t..
分类:编程语言   时间:2017-10-09 21:00:13    阅读次数:163
Spark Streaming与Storm的对比及使用场景
Spark Streaming与Storm都可以做实时计算,那么在做技术选型的时候到底应该选择哪个呢?通过下图可以从计算模型、计算延迟、吞吐量、事物、容错性、动态并行度等方方面进行对比。 对于Storm来说: 1、建议在那种需要纯实时,不能忍受1秒以上延迟的场景下使用,比如实时金融系统,要求纯实时进 ...
分类:其他好文   时间:2017-10-07 15:00:20    阅读次数:126
FFMPEG 流媒体协议
HLS-M3U8 HLS(HTTP Live Streaming)是苹果公司针对iPhone、iPod、iTouch和iPad等移动设备而开发的基于HTTP协议的流媒体解决方案。在 HLS 技术中 Web 服务器向客户端提供接近实时的音视频流。但在使用的过程中是使用的标准的 HTTP 协议,所以这时 ...
分类:其他好文   时间:2017-10-05 16:10:25    阅读次数:276
Spark 学习笔记之 Streaming和Kafka Direct
Streaming和Kafka Direct: Spark version: 2.2.0 Scala version: 2.11 Kafka version: 0.11.0.0 Note: 最新版本感觉接口变化很大,参数都调整了,今天就先写个Streaming word count的例子吧,以后再慢 ...
分类:其他好文   时间:2017-10-04 14:14:56    阅读次数:259
Spark-Streaming之window滑动窗口应用
Spark-Streaming之window滑动窗口应用,Spark Streaming提供了滑动窗口操作的支持,从而让我们可以对一个滑动窗口内的数据执行计算操作。每次掉落在窗口内的RDD的数据,会被聚合起来执行计算操作,然后生成的RDD,会作为window DStream的一个RDD。 网官图中所 ...
分类:Windows程序   时间:2017-10-02 16:16:55    阅读次数:217
Yarn上常驻Spark-Streaming程序调优
对于长时间运行的Spark Streaming作业,一旦提交到YARN群集便需要永久运行,直到有意停止。任何中断都会引起严重的处理延迟,并可能导致数据丢失或重复。YARN和Apache Spark都不是为了执行长时间运行的服务而设计的。但是,它们已经成功地满足了近实时数据处理作业的常驻需求。成功并不 ...
分类:其他好文   时间:2017-10-02 10:35:03    阅读次数:277
【译】Yarn上常驻Spark-Streaming程序调优
作者从容错、性能等方面优化了长时间运行在yarn上的spark-Streaming作业 对于长时间运行的Spark Streaming作业,一旦提交到YARN群集便需要永久运行,直到有意停止。任何中断都会引起严重的处理延迟,并可能导致数据丢失或重复。YARN和Apache Spark都不是为了执行长 ...
分类:其他好文   时间:2017-09-30 16:22:29    阅读次数:1944
Apache Spark 2.2.0 中文文档 - Structured Streaming 编程指南 | ApacheCN
Structured Streaming (结构化流)是一种基于 Spark SQL 引擎构建的可扩展且容错的 stream processing engine (流处理引擎)。您可以以静态数据表示批量计算的方式来表达 streaming computation (流式计算)。 Spark SQL ... ...
分类:Web程序   时间:2017-09-26 21:17:57    阅读次数:254
Apache Spark 2.2.0 中文文档 - Spark Streaming 编程指南 | ApacheCN
Spark Streaming 是 Spark Core API 的扩展, 它支持弹性的, 高吞吐的, 容错的实时数据流的处理. 数据可以通过多种数据源获取, 例如 Kafka, Flume, Kinesis 以及 TCP sockets, 也可以通过例如 map, reduce, join, wi... ...
分类:Web程序   时间:2017-09-26 21:03:35    阅读次数:248
big data science(course notes)
1 大数据:batch,interactive query,streaming 2 集群环境有三大挑战:分别是并行化、单点失败处理、资源共享。采用以并行化的方式重写应用程序、对单点失败的处理方式、动态地进行计算资源的分配等解决方案 3 address of any protocol control ...
分类:其他好文   时间:2017-09-24 00:31:13    阅读次数:151
1219条   上一页 1 ... 46 47 48 49 50 ... 122 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!