Hive是一种构建在Hadoop上的数据仓库,Hive把SQL查询转换为一系列在Hadoop集群中运行的MapReduce作业,是MapReduce更高层次的抽象,不用编写具体的MapReduce方法。Hive将数据组织为表,这就使得HDFS上的数据有了结构,元数据即表的模式,都存储在名为meta....
分类:
其他好文 时间:
2014-05-23 05:54:55
阅读次数:
1771
1、先说说硬件配置,我最开始是在Win7(I7 4770,8G RAM,2T硬盘)里装ubuntu10.10 64位系统(4G RAM,200G 硬盘)进行源码编译,大概花了3个多小时。而且还多次出现outofmemoryerror 错误。最后将硬件升级为I7 4770、16G内存、2T硬盘,不装虚拟机,直接跑Ubuntu 10.10系统,Swap分区为16G,编译一次大概花了40分钟,没有报任何...
分类:
移动开发 时间:
2014-05-22 23:54:21
阅读次数:
775
前段时间新装的Ubuntuserver14.04AMD64位操作系统出问题,没办法只能重装安装完成后重启然后初始化服务器阵列控制器和防火墙后,弹出UNKNOWNFILESYSTEMGRUBRESOURCE>进入不到系统引导界面当时以为是磁盘分区的问题,重装了Ubuntu7次,问题依旧没解决最后按照如下指引操作发..
分类:
其他好文 时间:
2014-05-22 18:23:25
阅读次数:
508
今天用U盘安装WIN764位系统出现“C:\$Extend\$Reparse已损坏且无法读龋请运行Chkdsk工具”报错故障。后经度娘找到了答案,使用了PE系统自带“diskgenius”硬盘分区工具进行分区并格式化造成的。具体原因尚不清楚,估计是老牌DOS工具对新机器的分区支持不好造成的吧。最后再进..
分类:
Windows程序 时间:
2014-05-22 17:52:34
阅读次数:
1009
好久不写,一方面是工作原因,有些东西没发直接发,另外的也是习惯给丢了,内因所致。今天是个好日子,走起!btw,实际上这种格式化输出应该不只限于某一种需求,差不多是通用的。需求:--基本的:当前Hive查询结果存在数据与表头无法对其的情况,不便于监控人员直接查看,或者导出到excel中,需要提供一个脚...
分类:
其他好文 时间:
2014-05-21 23:00:39
阅读次数:
527
代志远早年就职网易研究院从事MapReduce与DFS系统的自主研发,后加入支付宝数据平台负责Hadoop与HBase体系的架构设计与二次研发,支付宝流计算与分布式搜索系统的设计和研发,后成为支付宝海量计算体系架构师兼支付宝三代架构成员。现就转战于阿里巴巴集团-CDO-海量数据部门,负责创新性项目的研究和跟进,目前专注于Google第二代数据库产品MegaStore的研究和在阿里的落地。
在...
分类:
数据库 时间:
2014-05-21 17:04:40
阅读次数:
393
基于Greenplum Hadoop分布式平台的大数据解决方案及商业应用案例剖析
课程讲师:迪伦
课程分类:Java
适合人群:高级
课时数量:96课时
用到技术:MapReduce、HDFS、Map-Reduce、Hive、Sqoop
涉及项目:Greenplum Hadoop大数据分析平台
更新程度:完毕
对这个课程有兴趣的朋友可以加我的QQ2059055336和...
分类:
其他好文 时间:
2014-05-21 13:23:22
阅读次数:
363
BSSID的值是路由器无线MAC地址,具体相信IEEE 802.11规范。
MAC地址在路由器上存储位置一半为Factory/factory分区的第四个字节(从0开始),小端字节序。
The BSSID included in the MAC Header transmitter
address field of a Beacon frame when the multiple BSSID...
分类:
其他好文 时间:
2014-05-21 09:59:36
阅读次数:
326
主要介绍Hadoop家族产品,常用的项目包括Hadoop, Hive, Pig, HBase,
Sqoop, Mahout, Zookeeper, Avro, Ambari, Chukwa,新增加的项目包括,YARN, Hcatalog, Oozie,
Cassandra, Hama, Whirr,...
分类:
其他好文 时间:
2014-05-21 05:55:45
阅读次数:
280
1.With T AS () 中语句会单独生成执行计划2.MS
SQL数据库中已“页”的方式按顺序存储数据,如插入数据,会增加新的页,并将两页中数据平均分配,每一张未填满数据的页称为数据库碎片。3.避免使用GUID等无序列作为索引4.页压缩5.表分区,利用CPU多核特性并行操作数据库6.数据表数据量...
分类:
数据库 时间:
2014-05-21 03:30:33
阅读次数:
400