码迷,mamicode.com
首页 >  
搜索关键字:scala spark    ( 10387个结果
Scala课堂
Scala课堂(1):概述Scala课堂(2):基础(一)Scala课堂(3):基础(二)Scala课堂(4):基础(三)Scala课堂(5):基础(四)Scala课堂(6):基础(五)Scala课堂(7):基础(六)Scala课堂(8):集合(一)Scala课堂(9):集合(二)Scala课堂(10):模式匹配和函数组合Scala课堂(11):类型和多态类型(一)Scala课堂(12):类型和多...
分类:其他好文   时间:2014-07-31 09:54:46    阅读次数:182
pyspark原理简介
这是前段时间在看spark的python支持的时候,简单过了一下pyspark里的python代码,整理了一个大致流程。虽然几乎不会python,但基本上能看懂pyspark是怎么让不同虚拟机之间传输数据的、如何在python环境调用java类的、pyspark SDK的丰富程度取决于什么、需要做些什么流程和封装等。 我看了下,应该只有Pyspark Internals这篇wiki里介绍了pyspark的实现机制,大体是下面这张图就可以表示...
分类:其他好文   时间:2014-07-31 00:01:36    阅读次数:515
Spark SQL Catalyst源码分析之Physical Plan 到 RDD的具体实现
Spark SQL 物理计划到 RDD 的计算过程实现。...
分类:数据库   时间:2014-07-29 22:08:02    阅读次数:656
Spark SQL Catalyst源码分析之Physical Plan
Spark SQL之Catalyst的物理计划,讲解了物理计划的产生过程,以及涉及到的策略。...
分类:数据库   时间:2014-07-29 14:46:18    阅读次数:514
3 分钟快速体验 Apache Spark SQL
“War of the Hadoop SQL engines. And the winner is …?” 这是个很好的问题。不过,无论答案如何,我们都值得花一点时间了解一下 Spark SQL 这个 Spark 家族里面的成员。...
分类:数据库   时间:2014-07-29 14:35:08    阅读次数:308
Spark SQL 源码分析系列文章
Spark SQL 源码分析系列文章,从整个SQL执行流程到各个环节的关键组件,以及Catalyst框架的讲解。...
分类:数据库   时间:2014-07-29 13:10:36    阅读次数:328
Scala 机器学习库
自然语言处理 ScalaNLP—机器学习和数值计算库的套装 Breeze —Scala用的数值处理库 Chalk—自然语言处理库。 FACTORIE—可部署的概率建模工具包,用Scala实现的软件库。为用户提供简洁的语言来创建关系因素图,评估参数并进行推断。 数据分析/数据可视化 MLlib in Apache Spark—Spark下的分布式机器学...
分类:其他好文   时间:2014-07-29 13:01:37    阅读次数:372
scala操作hbase案例
案例取自streaming-app项目package com.asiainfo.ocdc.streaming.toolsimport org.apache.hadoop.hbase.HBaseConfigurationimport org.apache.hadoop.conf.Configurati...
分类:其他好文   时间:2014-07-29 11:02:26    阅读次数:1081
【互动问答分享】第5期决胜云计算大数据时代Spark亚太研究院公益大讲堂
spark互动问答
分类:其他好文   时间:2014-07-28 23:35:14    阅读次数:336
Spark Web界面
1.7 Spark Web 界面 每一个SparkContext发布一个web界面,默认端口是4040,它显示了应用程序的有用信息。这包括: Ø  一系列的调度阶段和任务 Ø  对于RDD大小和内存使用的总结 Ø  环境信息 Ø  运行的执行器(executor)的信息 你可以通过浏览器访问http://:4040,当然,你必去先启动SparkContext。比如命令:./bin/sp...
分类:Web程序   时间:2014-07-28 16:35:43    阅读次数:1584
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!