码迷,mamicode.com
首页 >  
搜索关键字:大数据 云计算 vmware hadoop    ( 36549个结果
几种常见的虚拟镜像类型
.vdi :virtualbox默认的虚拟硬盘文件格式 .vdmk:vmware默认的虚拟硬盘文件格式 .vhd:微软virtualPC默认的虚拟硬盘文件格式 .hdd:parallel desktop默认的虚拟硬盘文件格式...
分类:其他好文   时间:2014-05-10 19:33:56    阅读次数:324
hadoop测试
lk@lk-virtual-machine:~$ cd hadoop-1.0.1 lk@lk-virtual-machine:~/hadoop-1.0.1$ cd bin lk@lk-virtual-machine:~/hadoop-1.0.1/bin$ ./stop_all.sh bash: ./stop_all.sh: 没有那个文件或目录 lk@lk-virtual-machine:~...
分类:其他好文   时间:2014-05-10 09:58:55    阅读次数:462
Pig系统分析(6)-从Physical Plan到MR Plan再到Hadoop Job
从Physical plan到Map-Reduce Plan 注:因为我们重点关注的是Pig On Spark针对RDD的执行计划,所以Pig物理执行计划之后的后端参考意义不大,这些部分主要分析流程,忽略实现细节。 入口类MRCompiler,MRCompilier按照拓扑顺序遍历物理执行计划中的节点,将其转换为MROperator,每个MROperator都代表一个map-reduce j...
分类:其他好文   时间:2014-05-10 08:46:07    阅读次数:366
.net DataExcel通信组件使用 搭建简单文件服务器
使用.net dataexcel通信搭建一个简单的文件服务器。 通信简单介绍 1,通信使用TCP协议。 2,采用session机制,控制简单通信安全与连接限制防攻击。 3,采用开放协议包格。(32字节数据包) 4,采用网络断开,自动连接机制保证连接。 5,采用压缩机械压缩大数据(比如.net 里面datatable,dataset的传输)。 6,采用事件机制,更容易,更符合.net开发习惯。 7,采用异步传输,较大的连接与并发。 8,采用数据包头,解决粘包。 9,采用命令方式,更容易扩展。 10,采用允许...
分类:Web程序   时间:2014-05-07 08:11:20    阅读次数:494
Linux学习笔记——vmware plarer中安装ubuntu
1.前言     学习了很长时间ubuntu,在旧笔记中安装过lubuntu,也使用过他人安装好的ubuntu虚拟机(contiki2.6和contiki2.7)。熟悉了ubuntu之后,决定自己尝试通过vmware player安装ubuntu。     【1】vmware plaryer是免费软件,不存在破解问题。如果用来学习ubuntu完全足够了。     【2】建议在虚拟机种学习ub...
分类:系统相关   时间:2014-05-07 08:06:00    阅读次数:616
hadoop优质链接
http://wiki.apache.org/hadoop/FAQ...
分类:其他好文   时间:2014-05-07 07:51:10    阅读次数:229
Pig系统分析(8)-Pig可扩展性
本文是Pig系统分析系列中的最后一篇了,主要讨论如何扩展Pig功能,不仅介绍Pig本身提供的UDFs扩展机制,还从架构上探讨Pig扩展可能性。 补充说明:前两天同事发现twitter推动的Pig On Spark项目:Spork,准备研究下。 UDFs 通过UDFs(用户自定义函数),可以自定义数据处理方法,扩展Pig功能。实际上,UDFS除了使用之前需要register/define外,和...
分类:其他好文   时间:2014-05-07 05:10:44    阅读次数:567
VMWare 网络连接模式(bridged、NAT、host-only)详解
host-only    在某些特殊的网络调试环境中,如何要求将真实环境和虚拟环境隔离开,这时你就可采用host-only模式。在host-only模式中,所有的虚拟系统是可以相互通信的,但虚拟系统和真实的网络是被隔离开的,VMWare虚拟机不能访问互联网。  提示:在host-only模式下,虚拟系统和宿主机器系统是可以相互通信的,相当于这两台机器通过双绞线互连。        在host...
分类:其他好文   时间:2014-05-07 04:57:28    阅读次数:344
Hadoop MapReduce2.0(Yarn)
MapReduce2.0(Yarn) MapReduce2.0是在Hadoop0.23开始采用的,叫做MapReduce2.0或者MRv2或者Yarn。 MRv2的主要思想是把jobtracker的任务分为两个基本的功能,一个是资源管理,一个是任务监控,这两个任务分别用不同的进程来运行。这个想法使拥有一个全局的资源管理器(ResourceManager)和每个应用程序的应用...
分类:其他好文   时间:2014-05-07 04:05:06    阅读次数:272
Hive中join, outer join, semi join区别
Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。 最常用的就是多表关联查询,主要讲解下join、outer join和semi join的具体使用。 join是最简单的关联操作,两边关联只取交集。 outer join分为left outer join、rig...
分类:其他好文   时间:2014-05-06 15:01:38    阅读次数:269
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!