码迷,mamicode.com
首页 >  
搜索关键字:计算框架    ( 492个结果
基于MindSpore的MASS网络实现
自然语言处理(Natural Language Processing, NLP)是指计算机通过分析文本,建立计算框架实现语言表示及应用的模型,从而使其获得对语言的理解及应用的能力。从1950年Turing提出著名的“图灵测试”以来,让机器学会“听”和“说”,实现与人类间的无障碍交流成为人机交互领域的 ...
分类:其他好文   时间:2020-07-23 16:46:37    阅读次数:81
azkaban工作流调度器
1、用途 一个完整的数据分析系统通常都是由大量任务单元组成: shell脚本程序,java程序,mapreduce程序、hive脚本等 各任务单元之间存在时间先后及前后依赖关系 为了很好地组织起这样的复杂执行计划,需要一个工作流调度系统来调度执行; 例如,我们可能有这样一个需求,某个业务系统每天产生 ...
分类:其他好文   时间:2020-07-20 13:26:58    阅读次数:71
MapReduce之Shuffle详解
Hadoop原生的计算框架MapReduce,简单概括一下:进程量级很重,启动很慢,但能承载的数据量很大,效率相较于Spark微批处理和Flink实时来讲很慢,Shuffle任何一个写MR同学都必须掌握的东西,说难不难,说简单也不简单 MapReduce程序的五个阶段: input map shuf ...
分类:其他好文   时间:2020-07-15 15:53:30    阅读次数:58
MR计算框架
map数量 计算向数据移动,map计算框架移动到Block map和Block不是一一对应,map与逻辑片(split)一一对应。原因:单个块可能过大,map处理时间长。所以block逻辑分块,多来几个map reduce数量 按理说reduce应该和key数量一样,但是可能存在不同key对应的数据 ...
分类:其他好文   时间:2020-07-07 17:43:22    阅读次数:85
Hadoop框架
Hadoop的广义与狭义之分 狭义的Hadoop:指的是一个框架,Hadoop是由三部分组成:HDFS:分布式文件系统--》存储;MapReduce:分布式离线计算框架--》计算;Yarn:资源调度框架 广义的Hadoop:广义的Hadoop不仅仅包含Hadoop框架,除了Hadoop框架之外的一些 ...
分类:其他好文   时间:2020-06-30 22:14:42    阅读次数:67
spark上的深度学习——按照雅虎的做法,本质上就是rdd.pipe,推理部分直接代理给tensorflow
from:https://juejin.im/post/5ad4b620f265da23a04a0ad0 看原文代码即可知道本质 Deep Learning On Spark 经过刚才的介绍,我们知道spark是一个分布式的通用计算框架,而以tensorflow为代表的deep learning是一 ...
分类:其他好文   时间:2020-06-28 13:38:28    阅读次数:60
云计算课程实验之安装Hadoop及配置伪分布式模式的Hadoop
Hadoop是一个能够对海量数据进行分布式处理的系统架构,主要包含3大块:分布式存储系统HDFS(Hadoop Distributed File System)分布式存储层、分布式计算框架MapReduce分布式计算层、资源管理系统YARN(Yet Another Resource Negotiat... ...
分类:其他好文   时间:2020-06-27 11:40:19    阅读次数:93
入门大数据---Spark_Streaming整合Flume
一、简介 Apache Flume 是一个分布式,高可用的数据收集系统,可以从不同的数据源收集数据,经过聚合后发送到分布式计算框架或者存储系统中。Spark Straming 提供了以下两种方式用于 Flume 的整合。 二、推送式方法 在推送式方法 (Flume-style Push-based ...
分类:Web程序   时间:2020-06-27 00:19:37    阅读次数:77
Hadoop MapReduce
一、概述 1.是Hadoop中的一套分布式的计算框架 2.将整个计算过程拆分为2个阶段:Map阶段、Reduce阶段 3.Map阶段一般负责数据的整理,Reduce阶段负责数据的汇总 4.如果输入路径是一个文件,则MapReduce只处理这个文件;如果输入的是一个目录,则处理这个目录下的所有文件 - ...
分类:其他好文   时间:2020-06-23 15:36:59    阅读次数:38
分布式文件系统HDFS
1、HDFS(Hadoop Distributed File System)是一个分布式文件系统,具有良好的扩展性、容错性以及易用的API。它的核心思想是将文件切分成等大的数据块,以多副本的形式存储到多个节点上。HDFS采用了经典的主从软件架构,其中主服务被称为NameNode,管理文件系统的元信息 ...
分类:其他好文   时间:2020-06-18 14:33:17    阅读次数:67
492条   上一页 1 2 3 4 5 ... 50 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!