码迷,mamicode.com
首页 >  
搜索关键字:spark 大数据 hadoop spark-sql    ( 29965个结果
转:openTSDB 2.0 安装
OpenTSDB-2.0.0安装布署2014-02-27 11:07:49|分类:大数据|标签:hadoop|举报|字号订阅1、介绍OpenTSDB是一个架构在Hbase系统之上的实时监控信息收集和展示平台。它支持秒级数据采集所有metrics,支持永久存储,可以做容量规划,并很容易的接入到现有的报...
分类:数据库   时间:2014-07-07 08:00:49    阅读次数:780
HBase client
通过HBase client访问HBase时,配置如下:Configuration conf = HBaseConfiguration.create();// Zookeeper地址 conf.set(HConstants.ZOOKEEPER_QUORUM, "master.hadoop");//....
分类:其他好文   时间:2014-07-07 00:38:13    阅读次数:250
Learn ZYNQ (9)
创建zybo cluster的spark集群(计算层面): 1.每个节点都是同样的filesystem,mac地址冲突,故: vi ./etc/profile export PATH=/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/b...
分类:其他好文   时间:2014-07-05 17:29:31    阅读次数:549
在ubuntu 12.04 x64下编译hadoop2.4
自己编译hadoop:x64 1.安装依赖包 sudo apt-get install g++ autoconf automake libtool cmake zlib1g-dev pkg-config libssl-dev openssh-server maven openssh-client 2...
分类:其他好文   时间:2014-07-05 17:11:43    阅读次数:229
_00017 Kafka的体系结构介绍以及Kafka入门案例(初级案例+Java API的使用)
# Kfaka的体系结构 # 学习前言 Kafka的整个学习过程就是自己看官网的文档,出错了找各种错,各种百度Google什么的,还好最后都解决了,不然就坑爹了,伤不起啊!英语真心也是硬伤,还是好好学英语,多记记单词吧!看官方文档还是有点压力的,不过压力就是动力,人生就该如此,这几天有点小忙,今天终于把这个整理完了,以此来帮助那些想学这些新技术的朋友们,虽然整理的时候有点累,但是还是值得的。对云计算有兴趣的朋友可以加上面说的214293307的群哦,一起学习,共同进步 ... # Kafka介绍 # 介...
分类:编程语言   时间:2014-07-03 18:41:34    阅读次数:392
Spark on Yarn部署
Spark on Yarn 集群部署...
分类:其他好文   时间:2014-07-03 18:26:02    阅读次数:264
java.sql.SQLException: [Microsoft][ODBC 驱动程序管理器] 未发现数据源名称并且未指定默认驱动程序解决方法
开发程序需要登录功能 ,就不想用大数据库,直接用java连接access。     在自己机器上一切正常,  url直连 和配置数据源都没有问题。  发布到windows server2008 上 ,获取不到数据连接。      系统都是64位, office是2010  32位。     问题找了半天,最终得以解决:            32为的Access driver 需要用32为的jd...
分类:数据库   时间:2014-07-03 17:57:43    阅读次数:294
Spark SQL 初探
早在Spark Submit 2013里就有介绍到Spark SQL,不过更多的是介绍Catalyst查询优化框架。经过一年的开发,在今年Spark Submit 2014上,Databricks宣布放弃Shark 的开发,而转投Spark SQL,理由是Shark继承了Hive太多,优化出现了瓶颈,如图:          今天把Spark最新的代码签了下来,测试了一下: 1、编译Spar...
分类:数据库   时间:2014-07-03 16:06:04    阅读次数:534
Hadoop初学指南(10)--ZooKeeper的集群安装和操作
本文简单介绍了ZooKeeper的基本知识。(1)概述①什么是ZooKeeper?Zookeeper是Google的Chubby一个开源的实现,是Hadoop的分布式协调服务它包含一个简单的原语集,分布式应用程序可以基于它实现同步服务,配置维护和命名服务等②Zookeeper的角色③为什么使用Zookeeper?大部分分..
分类:其他好文   时间:2014-07-03 14:02:30    阅读次数:269
Spark源码系列(五)RDD是如何被分布式缓存?
这一章想讲一下Spark的缓存是如何实现的。这个persist方法是在RDD里面的,所以我们直接打开RDD这个类。 def persist(newLevel: StorageLevel): this.type = { // StorageLevel不能随意更改 if (storageL...
分类:其他好文   时间:2014-07-03 12:53:15    阅读次数:314
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!