码迷,mamicode.com
首页 >  
搜索关键字:spark 大数据 hadoop spark-sql    ( 29965个结果
分布式Hadoop安装(二)
集群环境安装Zookeeper
分类:其他好文   时间:2014-06-15 23:49:42    阅读次数:393
Kettle Excel导入数据到数据库
最近学习大数据的处理,由于项目开发的需要,使用一种简单的方式来将Excel中的数据导入到数据库中,开发使用的kettle工具。 kettle工具安装很简单,从官网上下载下来之后,直接解压到制定的盘符下即可(前提是你配置了JAVA的环境变量,path,classpath)。 在WINDOWS环境下双击...
分类:数据库   时间:2014-06-15 22:10:06    阅读次数:412
大数据与JS实现2014巴西世界杯冠军预测图
大数据与JS实现2014巴西世界杯冠军预测图 http://www.zuidaima.com/share/1855841547176960.htm...
分类:Web程序   时间:2014-06-15 08:13:32    阅读次数:205
leetcode Sudoku java
package com.sogou.hadoop.test;public class Sudoku {/**验证该值是否合法*/ public boolean isValidSudoku(char[][] board,int x,int y){ int row,col; ...
分类:编程语言   时间:2014-06-15 00:51:03    阅读次数:292
Windows安装和使用zookeeper
本文介绍的 Zookeeper 是以 3.4.5 这个稳定版本为基础,最新的版本可以通过官网http://hadoop.apache.org/zookeeper/来获取,Zookeeper 的安装非常简单,下面将从单机模式和集群模式两个方面介绍 Zookeeper 的Windows安装和配置.CSD...
分类:Windows程序   时间:2014-06-14 23:10:28    阅读次数:418
Node.js结合使用MongDb的Map.reduce功能进行大量数据简化处理办法
一年前,准备使用mongDb自带的map,reduce功能模拟hadoop,换个思路做一个简易的大数据分拆再结合存储的办法;这个功能可以用于数据日志或者游戏数据之类,进行周期性归纳和按照自己需求重组数据;以下代码实现了将每日数据collecttion:gameLog日期的数据统计出不同的collec...
分类:数据库   时间:2014-06-14 22:38:35    阅读次数:432
十分钟了解分布式计算:Spark
Spark是一个通用的分布式内存计算框架,本文主要研讨Spark的核心数据结构RDD,及其在内存上的容错,内容基于论文Zaharia, Matei, et al. "Resilient Distributed Datasets: A Fault-Tolerant Abstraction for In...
分类:其他好文   时间:2014-06-14 20:42:37    阅读次数:326
pig学习系列1——安装
1、pig安装 1)解压,重命名、设置环境变量,同hadoop 2)编辑文件$PIG_HOME/conf/pig.properties,增加两行如下内容 fs.default.name=hdfs://hadoop:9000 mapred.job.tracker=hadoop:9001...
分类:其他好文   时间:2014-06-14 11:40:40    阅读次数:205
hbase学习系列1——伪分布模式安装
1 在hadoop上解压缩、重命名、设置环境变量HBASE_HOME,参考hadoop学习系列22 修改文件$HBASE_HOME/conf/hbase-env.sh,修改内容如下export JAVA_HOME=/usr/local/jdkexport HBASE_MANAGES_ZK=true#...
分类:其他好文   时间:2014-06-14 11:27:14    阅读次数:211
reduce个数到底和哪些因素有关
reduce的个数到底和什么相关,本问题详细阐述了这个问题...
分类:其他好文   时间:2014-06-14 00:05:03    阅读次数:362
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!