Unbuntu系统是我们开发Hadoop时最常用的操作系统,下面带领大家一步步完成Vmware虚拟机下Unbuntu系统的安装创建Vmware中的虚拟系统:我们选择的是“Typical”的方式,点击“Next”进入下一步:选择稍后安装操作系统,点击“Next”进入下一步:选择安装Linux系统的Ub...
分类:
其他好文 时间:
2014-08-05 11:04:59
阅读次数:
309
近日,通用电气(NYSE: GE)发布2014年“全球创新趋势报告”,探讨了世界各地的企业为追求创新而采取的变革行动。报告显示,企业正在积极改变内部流程和架构——鼓励创新行为、开展和其他企业的合作以扩大竞争优势,并利用大数据和分析以更好地了解客户和市场动态。 根据2014年“GE全球创新趋势调...
分类:
其他好文 时间:
2014-08-05 11:00:49
阅读次数:
212
在用Hadoop框架处理大数据时使用最多就是HDFS--分布式文件系统,但Hadoop的文件系统不仅只有分布式文件系统,例如:hfs,HSFTP,HAR等在Hadoop中都是有集成的,用来处理存储在不同体系中的数据。事实上应该这么说,Hadoop其实是一个综合性的文件系统。 下面来看看文件系统...
分类:
其他好文 时间:
2014-08-05 03:01:09
阅读次数:
291
Worker所起的作用有以下几个:
1. 接受Master的指令,启动或者杀掉Executor
2. 接受Master的指令,启动或者杀掉Driver
3. 报告Executor/Driver的状态到Master
4. 心跳到Master,心跳超时则Master认为Worker已经挂了不能工作了
5. 向GUI报告Worker的状态...
分类:
其他好文 时间:
2014-08-05 00:50:08
阅读次数:
364
本文主要介绍了Spark SQL里目前的CLI实现,代码之后肯定会有不少变动,所以我关注的是比较核心的逻辑。主要是对比了Hive CLI的实现方式,比较Spark SQL在哪块地方做了修改,哪些地方与Hive CLI是保持一致的。
基本上Spark SQL在CLI这块的实现很靠近Hive Service项目里的CLI模块,主要类继承体系、执行逻辑差不多都一样。Spark SQL修改的关键逻辑在CLIService内的SessionManager内的OperationManager里,将非元数据查询操作的q...
分类:
数据库 时间:
2014-08-05 00:44:58
阅读次数:
939
无论在IT领域,还是传统行业,颠覆与重构都是不可回避的话题。利用ICT领域的技术创新与互联网思维,传统企业可以更好地实现业务转型与创新。阿里集团与上汽共研互联网汽车,东软致力于推动远程医疗新模式,Mock颠覆传统学习方式……互联网、云计算、大数据等新技术正在颠覆和重..
分类:
其他好文 时间:
2014-08-04 18:13:20
阅读次数:
278
为了更好地支持大数据应用,富士通推出了针对大数据进行优化的全闪存阵列和大数据一体机,在保证整个系统高性能和高可靠的前提下,进一步提升了数据处理和分析的效率。大数据是继云计算之后又一项将改变传统商业模式和IT应用方式的重要变革。从存储的角度看,富士通正逐渐将产..
分类:
其他好文 时间:
2014-08-04 18:12:48
阅读次数:
236
一个采用模块化设计的大数据平台可以解决80%的大数据问题,而解决另外20%的问题就要靠大数据平台厂商结合行业客户的特殊需求进行定制化开发。中兴通讯DAP2.0大数据平台就具备了这方面的能力,能够为行业客户带来实实在在的价值。大数据的本质在于,可以提升人类活动的准确性,..
分类:
其他好文 时间:
2014-08-04 18:12:18
阅读次数:
391
阿里云计算的ODPS从内部使用的工具变成了面向社会开放的大数据平台,开创了国内大数据公共服务的先河,降低了大数据在资金、人才和应用方面的门槛。小型企业只要花费几百元就能进行海量数据分析,这是真的吗?阿里云计算的大数据平台ODPS可以让你梦想成真。今年举行的阿里巴巴大..
分类:
其他好文 时间:
2014-08-04 18:11:18
阅读次数:
292
【互动问答分享】第6期决胜云计算大数据时代Spark亚太研究院公益大讲堂
分类:
其他好文 时间:
2014-08-04 17:08:57
阅读次数:
211