Spark程序本地运行

时间：2017-05-28 23:48:01 阅读：423 评论：0 收藏：0 [点我收藏+]

标签：apach 本地 hadoop imp div 3.2 pre 变量 tar.gz

本次安装是在JDK安装完成的基础上进行的！ SPARK版本和hadoop版本必须对应！！！

spark是基于hadoop运算的，两者有依赖关系，见下图：

前言：

1.环境变量配置：

1.1 打开“控制面板”选项

技术分享

1.2.找到“系统”选项卡

技术分享

1.3.点击“高级系统设置”

技术分享

1.4.点击“环境变量”

技术分享

2.新建和编辑环境变量

技术分享

1.下载hadoop-2.6.0.tar.gz文件，并解压在本地

1.1 新建环境变量上配置

HADOOP_HOME
D:\JAVA\hadoop

技术分享

1.2 修改PATH路径

$HADOOP_HOME/bin;

技术分享

2.下载scala-2.10.6.zip文件，并解压在本地

2.1 新建环境变量上配置

SCALA_HOME
D:\JAVA\scala

技术分享

2.2 修改PATH路径

%SCALA_HOME%\bin;%SCALA_HOME%\jre\bin;

技术分享

3.下载spark-1.6.2-bin-hadoop2.6.tgz文件，并解压在本地

3.1 新建环境变量上配置

SPARK_HOME

D:\JAVA\spark_home\bin

技术分享

3.2 修改PATH路径

PATH

$SPARK_HOME/bin;

技术分享

4.下载scala-IDE.zip文件，并解压在本地

新建一个工程，修改library：

技术分享

Scala library一定要是：2.10.X

新建一个自己的library：添加一个Jar文件（${spark_home}/lib）

技术分享

下跟Word Count代码

package com

import org.apache.spark.SparkConf
import org.apache.spark.api.java.JavaSparkContext
import org.apache.spark.SparkContext

/**
 * 统计字符出现次数
 */
object WordCount {
  def main(args: Array[String]): Unit = {
         
         System.setProperty("hadoop.home.dir", "D:\\JAVA\\hadoop");
         val sc = new SparkContext("local", "My App")  
         val line = sc.textFile("/srv/1.txt")
     
         line.map((_, 1)).reduceByKey(_+_).collect().foreach(println)
     
         sc.stop()
    println(111111)
  }
}

Word Count

hadoop下载点击这里

spark下载点击这里

scala安装包，scala IDE下载点击这里

Spark程序本地运行

标签：apach 本地 hadoop imp div 3.2 pre 变量 tar.gz

原文地址：http://www.cnblogs.com/wuxiaolong4/p/6916962.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行