一、Tachyon配置说明Tachyon配置参数分为4类:Master,Worker,Common(MasterandWorker),andUserconfigurations。环境变量配置文件在$TACHYON_HOME/conf/tachyon-env.sh,这些变量将会被TACHYON_JAVA_OPTS调用,这个文件的配置模版为$TACHYON_HOME/conf/tachyon-env.sh.template..
分类:
其他好文 时间:
2014-10-14 20:55:19
阅读次数:
242
一、环境配置1.集群环境主机名IP角色
Node1192.168.1.1TachyonMaster、TachyonWorker
Node2192.168.1.2TachyonWorker
Node3192.168.1.3TachyonWorker2.每个节点上清空iptables规则#serviceiptablessave
iptables:将防火墙规则保存到/etc/sysconfig/iptables:[确定]
#3.每个节..
分类:
其他好文 时间:
2014-10-14 20:54:10
阅读次数:
174
一、主页描述了当前系统状态信息,包括Tachyon汇总状态、集群汇总状态、和节点汇总状态。二、系统配置查看页面三、文件系统查看页面四、查看在内存中的文件页面
分类:
Web程序 时间:
2014-10-14 19:50:00
阅读次数:
205
1.部署环境OS:Red Hat Enterprise Linux Server release 6.4 (Santiago)Hadoop:Hadoop 2.4.1Hive:0.11.0JDK:1.7.0_60Python:2.6.6(spark集群需要python2.6以上,否则无法在spark集...
分类:
其他好文 时间:
2014-09-04 18:59:49
阅读次数:
267
前面几章节谈论了企业如何利用大数据帮助企业建立精准营销模型,大家了解了"大数据"\"小数据",那么数据本身的问题解决了,今天我说一下另外一个非常重要的概念,就是"即时性"。可以说大数据最重要的意义之一是解决了营销上的“实时性”问题,在当下手机、平板多屏运作,快速处理用..
分类:
其他好文 时间:
2014-07-13 15:18:57
阅读次数:
183
最近在网上又看到有关于Hadoop适用性的讨论[1]。想想今年大数据技术开始由互联网巨头走向中小互联网和传统行业,估计不少人都在考虑各种“纷繁复杂”的大数据技术的适用性的问题。这儿我就结合我这几年在Hadoop等大数据方向的工作经验,与大家讨论一下Hadoop、Spark、HBase及Re..
分类:
其他好文 时间:
2014-06-16 17:07:55
阅读次数:
402
就在昨天,北京时间5月30日20点多。Spark 1.0.0终于发布了:Spark 1.0.0 released
根据官网描述,Spark 1.0.0支持SQL编写:Spark SQL Programming Guide
个人觉得这个功能对Hive的市场的影响很小,但对Shark冲击很大,就像win7和winXP的关系,自相残杀嘛?
这么着急的发布1.x 版是商业行为还是货真价实的体现,让我们拭目以待吧~~~~
本文是CSDN-撸大湿原创,如要转载请注明出处,谢谢:http://blog.csdn.net...
分类:
其他好文 时间:
2014-06-01 08:55:43
阅读次数:
460
本文是Pig系统分析系列中的最后一篇了,主要讨论如何扩展Pig功能,不仅介绍Pig本身提供的UDFs扩展机制,还从架构上探讨Pig扩展可能性。
补充说明:前两天同事发现twitter推动的Pig On Spark项目:Spork,准备研究下。
UDFs
通过UDFs(用户自定义函数),可以自定义数据处理方法,扩展Pig功能。实际上,UDFS除了使用之前需要register/define外,和...
分类:
其他好文 时间:
2014-05-07 05:10:44
阅读次数:
567