码迷,mamicode.com
首页 >  
搜索关键字:spark 安装、介绍    ( 7164个结果
Ubuntu 14.04下FTP服务器的安装
介绍ubuntu14.04下ftp服务器的搭建方法,让新手不必纠结于开发环境而阻碍学习ftp。...
分类:系统相关   时间:2015-05-25 18:54:42    阅读次数:144
Apache MRQL——Apache又一开源孵化利器
MRQL is a query processing and optimization system for large-scale, distributed data analysis, built on top of Apache Hadoop, Hama, Spark, and Flink....
分类:Web程序   时间:2015-05-25 16:47:38    阅读次数:176
Hadoop开发环境搭建(不定时更新)
参考链接hadoop家族、strom、spark、Linux、flume等jar包、安装包汇总下载(持续更新)http://www.aboutyun.com/thread-8178-1-1.htmlWin7中使用Eclipse连接虚拟机中的Ubuntu中的Hadoop2.4经验总结http://ww...
分类:其他好文   时间:2015-05-25 12:56:34    阅读次数:139
Spark(八) -- 使用Intellij Idea搭建Spark开发环境
Intellij Idea下载地址: 官方下载 选择右下角的Community Edition版本下载安装即可本文中使用的是windows系统 环境为: jdk1.6.0_45 scala2.10.5在网上下载jdk和scala的安装包双击运行安装即可注意:如果之后要将scala文件打包成jar包并在spark集群上运行的话,请确保spark集群和打包操作所在机器 环境保持一致!不然运行j...
分类:其他好文   时间:2015-05-25 10:11:16    阅读次数:392
Spark(九) -- SparkSQL API编程
Text文本文件测试一个简单的person.txt文件内容为:JChubby,13 Looky,14 LL,15 分别是Name和Age在Idea中新建Object,原始代码如下:object TextFile{ def main(args:Array[String]){ } }SparkSQL编程模型:第一步: 需要一个SQLContext对象,该对象是SparkSQL操作的入口...
分类:数据库   时间:2015-05-25 10:03:28    阅读次数:216
openfire spark 二次 开发 服务插件
==================== 废话 begin ============================最近老大让我为研发平台增加即时通讯功能。告诉我用comet 在web端实现即时通讯。最初狂搜集资料。不能让自己方向错了。这是很重要的。不过还是难免的周折了一番。测试了一个comet4....
分类:其他好文   时间:2015-05-23 19:56:59    阅读次数:171
Ubuntu 12.04下搜狗输入法安装
介绍ubuntu 12.04下搜狗输入法的安装,让新手有更好的编辑环境。...
分类:系统相关   时间:2015-05-23 18:27:45    阅读次数:181
Apache Zeppelin安装及介绍
背景Apache Zeppelin提供了web版的类似ipython的notebook,用于做数据分析和可视化。背后可以接入不同的数据处理引擎,包括spark, hive, tajo等,原生支持scala, java, shell, markdown等。它的整体展现和使用形式和Databricks Cloud是一样的,就是来自于当时的demo。Mac OS上安装目前github上,zeppelin版...
分类:Web程序   时间:2015-05-23 16:57:28    阅读次数:703
Spark Task未序列化(Task not serializable)问题分析
在编写Spark程序中,在map等算子内部由于使用了外部定义的变量和函数,从而导致出现Task未序列化问题,而由于Spark算子内部往往需要根据外部指定的配置进行计算,因此使用外部变量有时在所难免。为了解决Task序列化问题,这里对其进行了研究和总结。 出现“org.apache.spark.SparkException: Task not serializable”这个错误,一般...
分类:其他好文   时间:2015-05-23 16:55:37    阅读次数:181
Druid和Spark对比
Druid和Spark对比不是Spark专家, 如果描绘有错误, 请通过邮件列表或者其他方式告知我们Spark实现弹性的分布式数据集概念的计算集群系统, 可以看做商业分析平台。 RDDs能复用持久化到内村中的数据, 从而为迭代算法提供更快的计算速度。 这对一些工作流例如机器学习格外有用, 有些操作需...
分类:其他好文   时间:2015-05-22 16:57:46    阅读次数:230
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!