码迷,mamicode.com
首页 >  
搜索关键字:mapreduce 编程模型    ( 4944个结果
Hadoop专业解决方案-第3章:MapReduce处理数据
Hadoop的核心处理模块是MapReduce,也是当前最流行的大数据处理架构之一。它能够将Hadoop数据存储无缝的融入到数据处理当中,使得它在操作上足够简单,功能上足够强大。MapReduce已经解决很多实际问题(从日志分析,到数据排序,到文本操作,到基于模式的搜索,到图像处理,到机器学习等等)...
分类:其他好文   时间:2014-05-27 00:14:28    阅读次数:449
MapReduce job在JobTracker初始化源码级分析
mapreduce job提交流程源码级分析(三)中已经说明用户最终调用JobTracker.submitJob方法来向JobTracker提交作业。而这个方法的核心提交方法是JobTracker.addJob(JobID jobId, JobInProgress job)方法,这个addJob.....
分类:其他好文   时间:2014-05-26 23:20:49    阅读次数:354
MongoDB 聚合之 MapReduce
理解 MapReduce。
分类:数据库   时间:2014-05-26 12:23:25    阅读次数:296
MapReduce Kmeans聚类算法
最近在网上查看用MapReduce实现的Kmeans算法,例子是不错,http://blog.csdn.net/jshayzf/article/details/22739063但注释太少了,而且参数太多,如果新手学习的话不太好理解。所以自己按照个人的理解写了一个简单的例子并添加了详细的注释。大致的步...
分类:其他好文   时间:2014-05-24 10:41:01    阅读次数:315
Hive 自定义函数(转)
Hive是一种构建在Hadoop上的数据仓库,Hive把SQL查询转换为一系列在Hadoop集群中运行的MapReduce作业,是MapReduce更高层次的抽象,不用编写具体的MapReduce方法。Hive将数据组织为表,这就使得HDFS上的数据有了结构,元数据即表的模式,都存储在名为meta....
分类:其他好文   时间:2014-05-23 05:54:55    阅读次数:1771
2.1 Hadoop Eclipse Plugin 配置及安装
Hadoop Eclipse 开发工具 主要分为1、根据Hadoop版本生成插件2、安装Hadoop Eclipse插件3、配置Hadoop目录4、配置Hadoop连接5、新一个MapReduce工程WordCount.javaMapReduce——WordCount问题总结参考:http://bl...
分类:系统相关   时间:2014-05-23 02:44:30    阅读次数:354
MapReduce 气象数据集
通过MapReduce程序分析气象数据集,更好的了解计算过程。环境:Hadoop 1.2.1 & Centos 6.5 x641、气象数据集准备下载链接:ftp://ftp3.ncdc.noaa.gov/pub/data完整数据集非常大,可以下载部分数据集作为日常实验数据。2、气象数据上传到HDFS...
分类:其他好文   时间:2014-05-22 15:39:14    阅读次数:361
MapReduce之InputFormat和OutFormat
InputFormat中的Splits集合的获取;InputFormat是一个接口,该接口有2个成员函数;InputSplit[] getSplits(JobConf job, int numSplits) throws IOException;RecordReader getRecordReade...
分类:其他好文   时间:2014-05-21 19:21:45    阅读次数:234
hbase是否能取代mysql
代志远早年就职网易研究院从事MapReduce与DFS系统的自主研发,后加入支付宝数据平台负责Hadoop与HBase体系的架构设计与二次研发,支付宝流计算与分布式搜索系统的设计和研发,后成为支付宝海量计算体系架构师兼支付宝三代架构成员。现就转战于阿里巴巴集团-CDO-海量数据部门,负责创新性项目的研究和跟进,目前专注于Google第二代数据库产品MegaStore的研究和在阿里的落地。 在...
分类:数据库   时间:2014-05-21 17:04:40    阅读次数:393
【教程分享】基于Greenplum Hadoop分布式平台的大数据解决方案及商业应用案例剖析
基于Greenplum Hadoop分布式平台的大数据解决方案及商业应用案例剖析  课程讲师:迪伦  课程分类:Java  适合人群:高级  课时数量:96课时  用到技术:MapReduce、HDFS、Map-Reduce、Hive、Sqoop  涉及项目:Greenplum Hadoop大数据分析平台  更新程度:完毕 对这个课程有兴趣的朋友可以加我的QQ2059055336和...
分类:其他好文   时间:2014-05-21 13:23:22    阅读次数:363
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!