码迷,mamicode.com
首页 >  
搜索关键字:spark executor worker    ( 10463个结果
Js 之pdf文件转图片上传
<!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8"> <title>pdf转图片与上传</title> </head> <body> <input id='pdf' type='file' accept="application ...
分类:Web程序   时间:2020-11-19 12:26:43    阅读次数:19
【问题】Spark Streaming批次处理耗时问题排查
Spark Streaming处理流程中,遇到某些批次耗时长的问题,排查思路
分类:其他好文   时间:2020-11-18 13:12:54    阅读次数:8
Spark Stuctured Streaming 读取文件夹数据
package com.atguigu.structure.streaming import org.apache.spark.sql.streaming.Trigger import org.apache.spark.sql.{DataFrame, SparkSession} import org ...
分类:其他好文   时间:2020-11-16 13:25:07    阅读次数:3
12个行业月均阅读超100亿,看Spark如何助力微博Feed算法提升活跃度
12个行业月均阅读超100亿,看Spark如何助力微博Feed算法提升活跃度#编者按:本文由高可用架构向黄波约稿,介绍黄波在SparkSummitChina2016中的演讲精华,并侧重对微博系统和Feed系统进行了更多的介绍。黄波,2010年加入新浪微博,微博研发中心Feed技术专家,负责微博Feed流排序和推荐相关项目。目前专注于基于Spark、Storm等计算平台的大数据处理,致力于将分布式计
分类:编程语言   时间:2020-11-16 13:06:48    阅读次数:9
【并发技术16】线程同步工具Exchanger的使用
如果两个线程在运行过程中需要交换彼此的信息,比如一个数据或者使用的空间,就需要用到Exchanger这个类,Exchanger为线程交换信息提供了非常方便的途径,它可以作为两个线程交换对象的同步点,只有当每个线程都在进入exchange()方法并给出对象时,才能接受其他线程返回时给出的对象。每次只能两个线程交换数据,如果有多个线程,也只有两个能交换数据。下面看个通俗的例子:一手交钱一首交货!pub
分类:编程语言   时间:2020-11-10 11:36:19    阅读次数:21
18、Celery
Celery 1.什么是Clelery Celery是一个简单、灵活且可靠的,处理大量消息的分布式系统 专注于实时处理的异步任务队列 同时也支持任务调度 Celery架构 Celery的架构由三部分组成,消息中间件(message broker),任务执行单元(worker)和任务执行结果存储(ta ...
分类:其他好文   时间:2020-11-10 11:18:05    阅读次数:9
spark学习(一) --spark基本概念和任务调度
(一)RDD、DataFream、DataSet 理解 1. RDD理解 (1) RDD定义为弹性分布式数据集合。 MR运算之间数据共享差: MR的计算之间的数据共享只能通过将数据写入外部存储系统。后一步计算需要从外部存储系统中加载进来的方式进行。 Spark 思路相反,设计了一种抽象-RDD(弹性 ...
分类:其他好文   时间:2020-11-10 10:31:29    阅读次数:3
vscode 支持c++17特性
settings → Extensions → run code configure → Executor Map → Edit in settings.json 在 gcc 中添加 -std=c++17,如下图所示 ...
分类:编程语言   时间:2020-11-08 17:00:14    阅读次数:25
经典教程 | 基于Spark GraphX实现微博二度关系推荐
经典教程|基于SparkGraphX实现微博二度关系推荐导读:图计算是近几年大数据领域非常受关注的热点,社交网络中的好友关系推荐是一种典型图计算场景,本文是微博关系项目团队在二度关系计算中的一些实践,供高可用架构读者参考,作者为王舜、蒋生武、田瑞林。关系计算问题描述二度关系是指用户与用户通过关注者为桥梁发现到的关注者之间的关系。目前微博通过二度关系实现了潜在用户的推荐。用户的一度关系包含了关注、好
分类:其他好文   时间:2020-11-07 17:07:30    阅读次数:27
机器学习平台痛点与模型提升方法:基于Spark的机器学习平台在点融网风控应用介绍
机器学习平台痛点与模型提升方法:基于Spark的机器学习平台在点融网风控应用介绍编者按:大数据和机器学习是近年来快速增长的热门领域,各个领域的数据量和数据规模都以惊人的速度增长。本文是近期举行的架构实践日点融网刘利就“机器学习平台在点融网业务的应用介绍”这一话题的精彩分享。作者简介:刘利,点融网DataScientistTeam负责人,从事互联网数据分析和数据挖掘近十年。现任点融网DataScie
分类:其他好文   时间:2020-11-07 15:58:21    阅读次数:20
10463条   上一页 1 ... 22 23 24 25 26 ... 1047 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!