搜索关键字：spark 安装、介绍，搜索到7164个结果！码迷,mamicode.com！

Spark之Streaming

1. socket消息发送 import java.net.ServerSocket import java.io.PrintWriter import scala.collection.mutable.ListBuffer import java.util.Random /** * Created...

分类：其他好文时间：2015-08-28 23:12:14 阅读次数：237

我对大数据相关技术的学习心得及理解

本篇为这一段时间以来我对大数据相关技术的学习心得及理解，主要涉及以下几个方面： noSql，集群，数据挖掘，机器学习，云计算，大数据，以及Hadoop和Spark。主要都是一些初级的概念澄清之类的东西，并且比较凌乱，慎入。* 1. NoSQL我的理解是，NoSQL主要用于存储一些非结构化数据,...

分类：其他好文时间：2015-08-28 15:02:08 阅读次数：211

hadoop1 & hadoop2 fair-schduler 配置和使用

hadoop1 配置 mapred-site.xml,增加如下内容 mapred.jobtracker.taskScheduler org.apache.hadoop.mapred.FairScheduler <...

分类：其他好文时间：2015-08-28 13:23:03 阅读次数：139

Scala中View Bounds代码实战及其在Spark中的应用源码解析之Scala学习笔记-35

package com.leegh.parameterization/** * @author Guohui Li */class Pair_NotPerfect[T 0) first else second}//class Pair_NotPerfect[T 0) first else sec.....

分类：其他好文时间：2015-08-28 12:24:45 阅读次数：116

Spak之开发代码 _pom 配置

1.spark on yarn import org.apache.spark.SparkContext import org.apache.spark.SparkContext._ /** * Created by zzy on 8/27/15. */ object SaprkOnYarn { d...

分类：其他好文时间：2015-08-28 00:46:31 阅读次数：151

spark core源码分析7 Executor的运行

实际任务的运行，都是通过Executor类来执行的。这一节，我们只介绍Standalone模式。源码位置：org.apache.spark.executor.CoarseGrainedExecutorBackend private def run( driverUrl: String, executorId: String, hostname: String,...

分类：其他好文时间：2015-08-27 21:16:37 阅读次数：195

spark core源码分析8 从简单例子看transformation

前面提到过spark自带的一个最简单的例子，也介绍了SparkContext的部分，这节介绍剩余的内容中的transformation。 object SparkPi { def main(args: Array[String]) { val conf = new SparkConf().setAppName("Spark Pi") val spark = new Spa...

分类：其他好文时间：2015-08-27 21:16:35 阅读次数：187

Scala中类型变量Bounds代码实战及其在Spark中的应用源码解析之Scala学习笔记-34

package com.leegh.parameterization/** * @author Guohui Li */class Pair[T 0) first else second}class Pair_Lower_Bound[T](val first: T, val second: T) ....

分类：其他好文时间：2015-08-27 20:48:28 阅读次数：150

Spark入门实战系列--6.SparkSQL（中）--深入了解运行计划及调优

前面介绍了SparkSQL的运行过程，罗列了很多概念很抽象，比如Unresolved LogicPlan、LogicPlan、PhysicalPlan，下面介绍一个工具hive/console，来加深对SparkSQL的运行计划的理解。另外Spark是一个快速的内存计算框架，同时是一个并行运算的框架，在计算性能调优的时候，除了要考虑广为人知的木桶原理外，还要考虑平行运算的Amdahl定理。...

分类：数据库时间：2015-08-27 11:06:02 阅读次数：287

上海第五次Spark meetup会议资料分享

大会地址　上海Spark Meetup第四次聚会将于2015年7月18日在太库科技创业发展有限公司举办，详细地址上海市浦东新区金科路2889弄3号长泰广场 C座12层，太库。本次聚会由七牛和Intel联合举办。大会主题　　1. hadoop/spark生态的落地实践　　王团结(七牛)七牛云数据平台工程师。主要负责数据平台的设计研发工作。关注大数据处理，高性能系统服务，关注hadoop/flume/k...

分类：其他好文时间：2015-08-27 11:04:36 阅读次数：189

共7164条上一页 1 ... 567 568 569 570 571 ... 717 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)