搜索关键字：spark rdd，搜索到7287个结果！码迷,mamicode.com！

[转帖]SSD和内存数据库技术

SSD和内存数据库技术自己的理解还是不是很对 SSD 提升的是随机读并没有对顺序写有多大的提升, 因为数据库采用的是redo的模式. 理论上写入时是顺序写所以写并发的提升不会很大但是会很大的提升读取的速度. 2016-04-26 10:57:47 dingdingfish 阅读数 76 ...

分类：数据库时间：2019-11-30 09:47:37 阅读次数：97

SparkStreaming运行原理

Spark Streaming应用也是Spark应用，Spark Streaming生成的DStream最终也是会转化成RDD，然后进行RDD的计算，所以Spark Streaming最终的计算是RDD的计算，那么Spark Streaming的原理当然也包含了Spark应用通用的原理。Spark ...

分类：其他好文时间：2019-11-29 18:27:58 阅读次数：85

SparkStreaming 性能、稳定、容错与语义

怎样提高Spark Streaming的性能 1、创建多个接收器待定：： 2、调节每一个batch interval的数据块的数量，其实就是调整上面第二个问题中提到的配置spark.streaming.blockInterva 待定：： 3、调整Recevier每秒接收数据的速率待定：： 4、通 ...

分类：其他好文时间：2019-11-29 18:14:33 阅读次数：86

不要把分层当做解耦！

公司的老员工很喜欢一种他们称之为“解耦”的做法：先这么进行系统分析：把系统运行拆解为若干个环节，先执行A，再执行B，形成一个一个的步骤。然后进行“解耦”：把每个环节变成一个服务，环节之间用 MQ 连接。环节衔接的输入输出数据形成协议规范。 “解耦”之后得到的好处是：环节用MQ串联，当服务死掉后 ...

分类：其他好文时间：2019-11-28 13:33:23 阅读次数：81

大数据从入门到项目实战，精品学习材料，值得大家一看

01-大数据快速入门基础02-Scala学习进击大数据Spark生态圏03-Spark从入门到项目实战大师课04-大数据系统学习全套视频教程(视频.源码.课件)05-大数据系统学习项目实战就业班课程06-大数据之Spark零基础到实战07-大数据项目实战视频hadoop spark实时计算项目实战教 ...

分类：其他好文时间：2019-11-27 23:18:45 阅读次数：126

Spark闭包与序列化

Spark的官方文档再三强调那些将要作用到RDD上的操作，不管它们是一个函数还是一段代码片段，它们都是“闭包”，Spark会把这个闭包分发到各个worker节点上去执行，这里涉及到了一个容易被忽视的问题：闭包的“序列化”。显然，闭包是有状态的，这主要是指它牵涉到的那些自由变量以及自由变量依赖到的其 ...

分类：其他好文时间：2019-11-27 23:17:08 阅读次数：105

Spark相关知识

基本概念： Spark作为新一代大数据计算引擎，因为内存计算的特性，具有比hadoop更快的计算速度。是一个分布式计算框架，旨在简化运行于计算机集群上的并行程序的编写。RDD：是spark核心数据处理模型，弹性分布式数据集(Resilient Distributed Dataset)是分布式内存的一 ...

分类：其他好文时间：2019-11-26 16:12:00 阅读次数：95

ue/um-editor实现word图片复制

图片的复制无非有两种方法，一种是图片直接上传到服务器，另外一种转换成二进制流的base64码目前限chrome浏览器使用，但是项目要求需要支持所有的浏览器，包括Windows和macOS系统。没有办法在网上搜了很多资料终于找到一个产品：WordPaster。浏览器方面能够支持ie6,ie7,ie ...

分类：其他好文时间：2019-11-26 13:10:32 阅读次数：112

windows下大数据开发环境搭建（4）——Spark环境搭建

本文从实践出发，介绍如何在windows环境下搭建scala环境，让你可以使用Spark语言继续自己的大数据之旅，增添一点乐趣。同时指出大部分朋友在初次运行spark-shell会遇到的报错：ERROR Shell： Failed to locate the winutils binary in t... ...

分类：Windows程序时间：2019-11-25 23:20:43 阅读次数：99

09-大数据入门一

Hadoop [翻译大象] 广义: 以apache hadoop软件为主的生态圈(hive sqoop spark flink....)狭义: apache hadoop软件以后这些网站经常用到hadoop.apache.orghive.apache.orgspark.apache.org had ...

分类：其他好文时间：2019-11-25 15:21:18 阅读次数：134

共7287条上一页 1 ... 89 90 91 92 93 ... 729 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)