Hadoop、Yarn、Spark是企业构建生产环境下大数据中心的关键技术,也是大数据处理的核心技术,是每个云计算大数据工程师必修课。课程简介大数据时代的精髓技术在于Hadoop、Yarn、Spark,是大数据时代公司和个人必须掌握和使用的核心内容。Hadoop、Yarn、Spark是Yahoo!、...
分类:
其他好文 时间:
2014-12-24 22:44:20
阅读次数:
277
Hadoop是云计算的事实标准软件框架,是云计算理念、机制和商业化的具体实现,是整个云计算技术学习中公认的核心和最具有价值内容。Yarn是目前公认的最佳的分布式集群资源管理框架; Mahout是目前数据挖掘领域的王者; 工业和信息化部电信研究院于2014年5月发布的“大数据白皮书”中指出:“2012...
分类:
其他好文 时间:
2014-12-24 22:41:30
阅读次数:
305
Scala是一门以JVM为目标运行环境并将面向对象和函数式编程语言的最佳特性结合在一起的编程语言,此课程是大数据框架Spark的前置课程:1, Spark框架是采用Scala语言编写的,精致而优雅。要想成为Spark高手,你就必须阅读Spark的源代码,就必须掌握Scala;2, 虽然说现在的Spa...
分类:
编程语言 时间:
2014-12-24 22:41:22
阅读次数:
188
浏览器页面后退事件 <a?href="javascript:history.back(-1)"?class="btn?btn-default"?>返回</a>
history.back(-1):直接返回当前页的上一页,数据全部消息,是个新页面
history.go(-1):也是返回当前页的上一...
分类:
Web程序 时间:
2014-12-24 18:44:14
阅读次数:
166
第十三章SET运算符1.SET操作符:UNION/UNIONALL INTERSECT MINUS2.UNION操作符返回两个查询的结果集的并集SELECTemployee_id,job_idFROMemployeesUNIONSELECTemployee_id,job_idFROMjob_history;2.1UNIONALL操作符:返回两个查询的结果集的并集。对于两个结果集的重复部分,..
分类:
数据库 时间:
2014-12-24 18:24:28
阅读次数:
198
jsp页面中要返回到上一页可以使用的方法有: 一不刷新: window.history.back(); //返回上一页,这里是利用的浏览器的缓存,返回后数据不会刷新;下一页就用:window.history.forward() window.history.go(-1); ...
分类:
编程语言 时间:
2014-12-24 16:06:54
阅读次数:
208
Shell 历史记录异地留痕审计与监控 http://netkiller.github.io/journal/shell.history.html Mr.?Neo Chen?(陈景峰),?netkiller, BG7NYT 中国广东省深圳市龙华新区民治街道溪山美地 518131 +86?13113668890 +...
分类:
系统相关 时间:
2014-12-24 13:33:55
阅读次数:
314
下载源码&编译:git clone https://github.com/databricks/spark-avro.gitsbt/sbt packageMaven GAV:groupId: com.databricks.sparkartifactId: spark-avro_2.10version...
分类:
数据库 时间:
2014-12-24 11:31:53
阅读次数:
305
下载源码&编译:git clone https://github.com/databricks/spark-csv.gitsbt/sbt packageMaven GAV:groupId: com.databricks.sparkartifactId: spark-csv_2.10version: ...
分类:
数据库 时间:
2014-12-24 11:27:55
阅读次数:
514
我们知道spark可以将运行过的RDD存储到内存上, 并在需要的时候重复利用. 那么spark是怎么完成这些工作的, 本文将通过分析源码来解释RDD的重复利用过程. 在上一篇文章解释了spark的执行机制, DAGScheduler负责分解action, 在DAGScheduler.getMi...
分类:
其他好文 时间:
2014-12-23 22:30:39
阅读次数:
915