从《Hadoop权威指南》选取了一个小案例,在Hadoop集群环境中运行。1、新建JAVA类,保存书中源代码。[huser@master bin]$ vi
URLCat.javaimport java.io.InputStream;import java.net.URL;import org.apa...
分类:
其他好文 时间:
2014-05-14 03:52:36
阅读次数:
457
一个Hadoop集群拥有多个并行的计算机,用以存储和
Hadoop强调代码向数据迁移...
分类:
其他好文 时间:
2014-05-13 06:54:15
阅读次数:
366
对于ms sqlserver数据库中可以直接使用top(n)提取前N
个结果,而oracle中并不能直接使用的。oracle中提供了对于提取前N 条的结果的方法 那就是用行编号例如:select
[column_list],ROWNUM from ( select [colum...
分类:
数据库 时间:
2014-05-12 22:14:41
阅读次数:
429
本文记录Ant编译MapReduce程序的过程。程序使用《Hadoop MapReduce
Cookbook》中的示例代码。1、安装AntAnt项目主页:http://ant.apache.org/下载二进制安装包,例如apache-ant-1.9.4-bin.tar.gz,上传到Hadoop集群环...
分类:
其他好文 时间:
2014-05-12 20:44:36
阅读次数:
398
Thrift 是什么?
Thrift源于大名鼎鼎的facebook之手,在2007年facebook提交Apache基金会将Thrift作为一个开源项目,对于当时的facebook来说创造thrift是为了解决facebook系统中各系统间大数据量的传
输通信以及系统之间语言环境不同需要跨平台的特性...
分类:
其他好文 时间:
2014-05-12 20:35:23
阅读次数:
296
warning MSB3162: 所选的“Microsoft Report Viewer 2012
Runtime”项需要“Microsoft.SqlServer.SQLSysClrTypes.11.0”。在“系统必备”对话框中选择缺少的系统必备组件,或者为缺少的系统必备组件创建引导程序包。发布Re...
分类:
数据库 时间:
2014-05-12 20:21:06
阅读次数:
713
import java.io.IOException;import
org.apache.hadoop.conf.Configuration;import org.apache.hadoop.fs.Path;import
org.apache.hadoop.io.IntWritable;import...
分类:
其他好文 时间:
2014-05-12 19:55:27
阅读次数:
326
物化视图:以前用的普通的视图,普通视图就是一段逻辑语句,对性能没有任何的提升,也不能创建索引,而物化视图会把视图里查询出来的数据在数据库上建立快照,它和物理表一样,可以创建索引,主键约束等等,性能会有质的提升,但是其有缺点,会占用,可以设置它定时自动更新一次,也可以手动更新,当然也是可以设置及时更新...
分类:
数据库 时间:
2014-05-12 00:12:34
阅读次数:
400
Web应用代理是YARN的一部分. 默认地,它会作为 Resource Manager(RM)的一部分来运行, 但是也可以配置成独立运行的模式。使用代理的原因就是降低通过YARN的web攻击的可能性。
在YARN中,Application Master(AM) 有责任提供web界面并把链接发给RM。这给一些可能的问题打开了大门。 RM 作为一个可信的用户在运行,访问那个web地址的用户会认...
分类:
Web程序 时间:
2014-05-11 20:27:52
阅读次数:
323
Hadoop集群(第9期)_MapReduce初级案例1、数据去重
"数据去重"主要是为了掌握和利用并行化思想来对数据进行有意义的筛选。统计大数据集上的数据种类个数、从网站日志中计算访问地等这些看似庞杂的任务都会涉及数据去重。下面就进入这个实例的MapReduce程序设计。1.1
实例描述 对数.....
分类:
其他好文 时间:
2014-05-11 16:02:24
阅读次数:
538