搜索关键字：scala spark，搜索到10387个结果！码迷,mamicode.com！

spark 执行诡异问题

今天在centos6.3上搭建了hadoop+hive＋spark系统，在运行/usr/local/spark-1.0.0/bin/spark-shell出现找不到hive相关的类，于是修改了spark-env.sh在spark_classpath里添加了hive的库路径exportSPARK_CLASSPATH=/usr/local/spark-1.0.0/lib_managed/jars/spark-assembly-1.0.0-..

分类：其他好文时间：2014-08-28 15:00:30 阅读次数：339

scala如何解决类型强转问题

scala属于强类型语言，在指定变量类型时必须确定数据类型，即便scala拥有引以为傲的隐式推到，这某些场合也有些有心无力。例如：java同属强类型语言，但java可以进行类型强转。因此在进行面向接口编程时，借助类型强转，只要编码没有问题，就可以使用准备使用的class类。但在scala中，这条路就...

分类：其他好文时间：2014-08-28 14:45:29 阅读次数：192

spark cdh5编译安装[spark-1.0.2 hadoop2.3.0 cdh5.1.0]

前提你得安装有Hadoop 我的版本hadoop2.3-cdh5.1.01、下载maven包2、配置M2_HOME环境变量，配置maven 的bin目录到path路径3、export MAVEN_OPTS="-Xmx2g -XX:MaxPermSize=512M -XX:ReservedCodeCa...

分类：其他好文时间：2014-08-27 18:37:18 阅读次数：252

Tachyon Cluster: 基于Zookeeper的Master High Availability（HA）高可用配置实现

1.Tachyon简介Tachyon是一个高容错的分布式文件系统，允许文件以内存的速度在集群框架中进行可靠的共享，就像Spark和 MapReduce那样。通过利用信息继承，内存侵入，Tachyon获得了高性能。Tachyon工作集文件缓存在内存中，并且让不同的 Jobs/Queries以及框架都能...

分类：其他好文时间：2014-08-27 18:32:08 阅读次数：454

Spark教程-构建Spark集群-配置Hadoop伪分布模式并运行Wordcount（2）

执行文件拷贝操作拷贝后的“input”文件夹的内容如下所示：和我们的hadoop安装目录下的“conf”文件的内容是一样的。现在，在我们刚刚构建的伪分布式模式下运行wordcount程序：运行完成后我们查看一下输出的结...

分类：其他好文时间：2014-08-27 13:13:48 阅读次数：314

Spark教程-构建Spark集群-配置Hadoop伪分布模式并运行Wordcount（2）

执行文件拷贝操作拷贝后的“input”文件夹的内容如下所示：和我们的hadoop安装目录下的“conf”文件的内容是一样的。现在，在我们刚刚构建的伪分布式模式下运行wordcount程序：运行完成后我们查看一下输出的结果：部分统计结果如下：此时我们到达Hadoop的web控制台会发现我们提交并成功的...

分类：其他好文时间：2014-08-27 12:49:47 阅读次数：236

Spark:Master High Availability（HA）高可用配置的2种实现

Spark Standalone集群是Master-Slaves架构的集群模式，和大部分的Master-Slaves结构集群一样，存在着Master单点故障的问题。如何解决这个单点故障的问题，Spark提供了两种方案：基于文件系统的单点恢复(Single-Node Recovery with Loc...

分类：其他好文时间：2014-08-26 19:00:56 阅读次数：567

Spark任务调度executors分配问题 in yarn

红色留着继续思考。问题背景： CCSWYB ，在云平台上模拟shell流程，在各个节点上分配fvcom计算任务。Spark程序流程：从HDFS中读取tasklist.txt(每一行对应一个任务) 经过一些操作过后生成一个JavaPairRDD ，记作data，对data执行foreac...

分类：其他好文时间：2014-08-26 01:47:25 阅读次数：5885

Apache Spark源码走读之22 -- Spark MLLib中拟牛顿法L-BFGS的源码实现

本文就拟牛顿法L-BFGS的由来做一个简要的回顾，然后就其在spark mllib中的实现进行源码走读。

分类：其他好文时间：2014-08-25 20:55:34 阅读次数：2698

Spark教程-构建Spark集群-配置Hadoop伪分布模式并运行Wordcount示例（1）

第四步：配置Hadoop伪分布模式并运行Wordcount示例伪分布模式主要涉及一下的配置信息：修改Hadoop的核心配置文件core-site.xml，主要是配置HDFS的地址和端口号；修改Hadoop中HDFS的配置文件hdfs-site.xml，主要是配置replication;修改Hadoo...

分类：其他好文时间：2014-08-25 16:51:54 阅读次数：267

共10387条上一页 1 ... 1002 1003 1004 1005 1006 ... 1039 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)