码迷,mamicode.com
首页 >  
搜索关键字:spark 大数据 hadoop spark-sql    ( 29965个结果
SQL SERVER大数据分页
select*from(selectrownumr,a.*from(select*fromtable_nameorderbyndatetimedesc)awhererownum(currentPage-1)*pageSize
分类:数据库   时间:2014-06-09 22:55:20    阅读次数:247
hadoop备记
Hadoop 的优势Hadoop 是 一 个 能 够 让 用 户 轻 松 架 构 和 使 用 的 分 布 式 计 算 平 台。 用 户 可 以 轻 松 地 在Hadoop 上开发执行处理海量数据的应用程序。它主要有下面几个长处:1.高可靠性。Hadoop 按位存储和处理数据的能力值得人们信赖。2.高...
分类:其他好文   时间:2014-06-09 15:48:27    阅读次数:201
Hbase入门
Hbase简介 Hbase 全称是Hadoop DataBase ,是一种开源的,可伸缩的,高可靠,高性能,面向列的分布式存储系统。 类似于Google的BigTable,其分布式计算采用MapReduce,通过MapReduce完成大块数据加载和全表扫描操作。文件存储系统是HDFS,通过Zookeeper来完成状态管理协同服务。不过BigTable只支持一级索引,而Hbase支持一级和二级索...
分类:其他好文   时间:2014-06-08 18:24:32    阅读次数:563
list集合、txt文件对比的工具类和文件读写工具类
工作上经常会遇到处理大数据的问题,下面两个工具类,是在处理大数据时编写的;推荐的是使用map的方式处理两个list数据,如果遇到list相当大数据这个方法就起到了作用,当时处理了两个十万级的list,使用改方法的变种搞定。 1.txt文件、list集合比较工具 package com.hudong.util.other; import java.util.Collection; import...
分类:其他好文   时间:2014-06-08 18:14:05    阅读次数:326
newLISP list操作
构建一个list注意要标记不要求值,比如用‘ 或者list> (list "a" "b" "c") ("a" "b" "c")或者> '("a" "b" "c") ("a" "b" "c") 查找在一个全是string的list中用正则表达式查找查找第一个匹配到的元素:> (set 'l '("WARNING: org.apache.hadoop.metrics.jvm.EventCounter...
分类:其他好文   时间:2014-06-08 16:23:41    阅读次数:243
64位CentOS上编译 Hadoop 2.2.0
下载了Hadoop预编译好的二进制包,hadoop-2.2.0.tar.gz,启动起来后,总是出现这种警告: WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicable 原因是apache官...
分类:其他好文   时间:2014-06-08 09:47:47    阅读次数:292
使用sqoop将MySQL数据库中的数据导入Hbase
使用sqoop将MySQL数据库中的数据导入Hbase 前提:安装好 sqoop、hbase。 下载jbdc驱动:mysql-connector-java-5.1.10.jar 将 mysql-connector-java-5.1.10.jar 复制到 /usr/lib/sqoop/lib/ 下 MySQL导入HBase命令: sqoop import --connect j...
分类:数据库   时间:2014-06-08 08:23:30    阅读次数:408
Ubuntu14.04下Hadoop2.2.0集群搭建
系统版本:master:Ubuntu 14.04 salve1:Ubuntu 14.04hadoop: hadoop 2.2.01、系统配置以及安装SSH无密码登陆环境(master&slaves):修改本机(master)和子节点(slaveN)机器名:打开/etc/hostname文件sudo ...
分类:其他好文   时间:2014-06-08 07:32:54    阅读次数:310
Greenplum query Oracle via DLINK
在系统日常生产过程中,如何从Oracle数据库同步一些配置表到GP库个问题。 先来说说之前使用的方式: 0. 使用第3方工具从Oracle导出纯文本格式,存放在本地; 1. 使用GP外部表加载入库 这种方式优点是对于需要同步大数据量的表的时候性能非常高;缺点是稍显麻烦,最主要的是非实时的,存在着任务调度周期和导出导入时间周期。 对此我的解决办法是简化整个过程并实时查询: 0. ...
分类:数据库   时间:2014-06-08 05:46:35    阅读次数:251
org.apache.hadoop.hbase.MasterNotRunningException解决策略
运行HBase时常会遇到个错误,我就有这样的经历。  ERROR: org.apache.hadoop.hbase.MasterNotRunningException: Retried 7 times 检查日志:org.apache.hadoop.ipc.RPC$VersionMismatch: Protocol org.apache.hadoop.hdfs.protocol.ClientPr...
分类:其他好文   时间:2014-06-08 03:02:50    阅读次数:395
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!