码迷,mamicode.com
首页 >  
搜索关键字:spark 大数据 hadoop spark-sql    ( 29965个结果
简单记录下spark环境搭建时的几个小问题
折腾了好几天,终于可以在CenOS下用eclipse写spark程序了当前环境是CentOS6.5,jdk7,scala2.10.4,spark0.9.1前期因为对linux不熟悉的原因花了不少时间查阅命令。折腾了不少时间,终于把jdk8,scala2.11.0环境变量配置好了。在此环境下可以正常编...
分类:其他好文   时间:2014-05-23 06:01:28    阅读次数:312
Hive 自定义函数(转)
Hive是一种构建在Hadoop上的数据仓库,Hive把SQL查询转换为一系列在Hadoop集群中运行的MapReduce作业,是MapReduce更高层次的抽象,不用编写具体的MapReduce方法。Hive将数据组织为表,这就使得HDFS上的数据有了结构,元数据即表的模式,都存储在名为meta....
分类:其他好文   时间:2014-05-23 05:54:55    阅读次数:1771
hadoop 中对Vlong 和 Vint的压缩方法
hadoop 中对java的基本类型进行了writeable的封装,并且所有这些writeable都是继承自WritableComparable的,都是可比较的;并且,它们都有对应的get() 和 set()方法,其中对整型(int 和 long)进行编码的时候,有固定长度格式(intWritabl...
分类:其他好文   时间:2014-05-23 03:10:15    阅读次数:207
2.1 Hadoop Eclipse Plugin 配置及安装
Hadoop Eclipse 开发工具 主要分为1、根据Hadoop版本生成插件2、安装Hadoop Eclipse插件3、配置Hadoop目录4、配置Hadoop连接5、新一个MapReduce工程WordCount.javaMapReduce——WordCount问题总结参考:http://bl...
分类:系统相关   时间:2014-05-23 02:44:30    阅读次数:354
Hadoop学习笔记目录
Hadoop 运行环境准备运行环境部署结构介绍Linux CentOS6.5安装(Hadoop环境配置)Linux 常用远程管理工具介绍SSH免密码登录配置Hadoop安装及配置Hadoop验证-WordCount执行Hadoop开发工具准备Hadoop Eclipse Plugin配置安装及验证H...
分类:其他好文   时间:2014-05-23 02:41:15    阅读次数:211
MapReduce 气象数据集
通过MapReduce程序分析气象数据集,更好的了解计算过程。环境:Hadoop 1.2.1 & Centos 6.5 x641、气象数据集准备下载链接:ftp://ftp3.ncdc.noaa.gov/pub/data完整数据集非常大,可以下载部分数据集作为日常实验数据。2、气象数据上传到HDFS...
分类:其他好文   时间:2014-05-22 15:39:14    阅读次数:361
2.2 Hadoop Studio 使用 [Hadoop学习笔记]
Hadoop Studio 是一个 map-reduce 结构的集成开发环境,基于NetBeans。你可以利用它来方便快速的创建基于Hadoop的 map-reduce 应用。该工具提供了一个实时的map-reduce任务的工作流视图,可以显示任务之间独立的输入输出和交互,而且该视图在代码修改时会实...
分类:其他好文   时间:2014-05-22 15:06:10    阅读次数:302
5月20日---疯狂猜成语-----四周第二次站立会议 参会人员:杨霏,袁雪,胡潇丹,郭林林,尹亚男,赵静娜
疯狂猜成语-----四周第二次站立会议参会人员:杨霏,袁雪,胡潇丹,郭林林,尹亚男,赵静娜会议内容:在寻找用户过程中,在自己的内部测试体验过程中出现了一小部分bug,所以用户体验推迟。出现的问题:1、用户登录后,用户资料不够完善2、游戏的数据量比较少,需要再一次加大数据量3、高级游戏出现多个结果,与...
分类:其他好文   时间:2014-05-21 17:43:14    阅读次数:257
【教程分享】基于Greenplum Hadoop分布式平台的大数据解决方案及商业应用案例剖析
基于Greenplum Hadoop分布式平台的大数据解决方案及商业应用案例剖析  课程讲师:迪伦  课程分类:Java  适合人群:高级  课时数量:96课时  用到技术:MapReduce、HDFS、Map-Reduce、Hive、Sqoop  涉及项目:Greenplum Hadoop大数据分析平台  更新程度:完毕 对这个课程有兴趣的朋友可以加我的QQ2059055336和...
分类:其他好文   时间:2014-05-21 13:23:22    阅读次数:363
Baidu如何赢得未来?
近日百度迎来了一位首席科学家,人工智能领域最权威的学者之一吴恩达(Andrew Ng)。 这位曾于 2013 年入选《时代》杂志“全球最具影响力 100 人”的美国人将全面负责百度研究院。 百度研究院目前包括三大实验室:硅谷人工智能实验室、北京深度学习实验室(原深度学习研究院)和北京大数据实验室。就在同日,百度宣布启用位于加州桑尼维尔的百度美国研发中心。 吴恩达作为斯坦福大学计算...
分类:其他好文   时间:2014-05-21 13:21:56    阅读次数:305
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!