Hadoop技术内幕中指出Top
K算法有两步,一是统计词频,二是找出词频最高的前K个词。在网上找了很多MapReduce的Top
K案例,这些案例都只有排序功能,所以自己写了个案例。这个案例分两个步骤,第一个是就是wordCount案例,二就是排序功能。一,统计词频 1 package
TopK;...
分类:
其他好文 时间:
2014-05-21 22:29:14
阅读次数:
599
代志远早年就职网易研究院从事MapReduce与DFS系统的自主研发,后加入支付宝数据平台负责Hadoop与HBase体系的架构设计与二次研发,支付宝流计算与分布式搜索系统的设计和研发,后成为支付宝海量计算体系架构师兼支付宝三代架构成员。现就转战于阿里巴巴集团-CDO-海量数据部门,负责创新性项目的研究和跟进,目前专注于Google第二代数据库产品MegaStore的研究和在阿里的落地。
在...
分类:
数据库 时间:
2014-05-21 17:04:40
阅读次数:
393
如果要在Linux上做j2ee开发,首先得搭建好j2ee的开发环境,包括了jdk、tomcat、eclipse的安装(这个在之前的一篇随笔中已经有详细讲解了Linux学习之CentOS(七)--CentOS下j2ee环境搭建),如果要开发web项目,我们当然可以安装一个myeclipse到Linux系统上去,这个安装方法和安装eclipse完全相同,就没有记录下来了,有了jdk、tomcat、ec...
分类:
数据库 时间:
2014-05-21 16:44:32
阅读次数:
492
使用Hadoop已经有一段时间了,从开始的迷茫,到各种的尝试,到现在组合应用….慢慢地涉及到数据处理的事情,已经离不开hadoop了。Hadoop在大数据领域的成功,更引发了它本身的加速发展。现在Hadoop家族产品,已经达到20个了之多。
有必要对自己的知识做一个整理了,把产品和技术都串起来。不仅能加深印象,更可以对以后的技术方向,技术选型做好基础准备。
一句话产品介绍:...
分类:
其他好文 时间:
2014-05-21 16:37:02
阅读次数:
363
AlienTech for better life!~...
目的
此文档描述了如何为Hadoop配置和管理 Service Level Authorization 。
预备条件
确保已经安装Hadoop,配置和设置都正确了。更多细节,请看:* 首次使用者的单节点设置 * 大的、分布式集群的集群设置。
概览
Service Level Authorization 是一个必要的初始认证机制,其确保客户端连接到一个有必要的、预配置的、权...
分类:
其他好文 时间:
2014-05-21 08:13:32
阅读次数:
227
A机器ssh登录B机器无需输入密码;当应用有服务器很多的时候输入密码很浪费时间
在Hadoop安装时要求免密码登录;一、创建在用户的home目录下创建 .ssh文件夹mkdir .ssh可以隐藏文件夹或文件内容ls -a二、
生成证书证书分为:dsa和rsassh-keygen -t rsa -P ...
分类:
系统相关 时间:
2014-05-21 06:01:09
阅读次数:
505
主要介绍Hadoop家族产品,常用的项目包括Hadoop, Hive, Pig, HBase,
Sqoop, Mahout, Zookeeper, Avro, Ambari, Chukwa,新增加的项目包括,YARN, Hcatalog, Oozie,
Cassandra, Hama, Whirr,...
分类:
其他好文 时间:
2014-05-21 05:55:45
阅读次数:
280
.Net 转战 Android 4.4 日常笔记(1)--工具及环境搭建.Net 转战 Android
4.4 日常笔记(2)--HelloWorld入门程序.Net 转战 Android 4.4 日常笔记(3)--目录结构分析.Net 转战 Android
4.4 日常笔记(4)--按钮事件和国际...
分类:
移动开发 时间:
2014-05-21 05:44:56
阅读次数:
307
环境搭建1.
下载JDK,安装,并将JDK的安装目录加入到环境变量JAVA_HOME,将JDK的bin目录加入到环境变量PATH。2. 下载Android
SDK,解压,并将SDK的安装目录加入到环境变量ANDROID_HOME,将SDK的tools和platform-tools目录加入到环境变量P...
分类:
移动开发 时间:
2014-05-21 03:25:07
阅读次数:
322