转载请在页首明显处注明作者与出处 一:说明 此为大数据系列的一些博文,有空的话会陆续更新,包含大数据的一些内容,如hadoop,spark,storm,机器学习等。 当前使用的hadoop版本为2.6.4 上一篇:hadoop系列二:HDFS文件系统的命令及JAVA客户端API 二:wordcoun ...
分类:
其他好文 时间:
2017-06-03 12:51:54
阅读次数:
144
随着人们逐渐认识到 “大数据”的价值,互联网、电商到金融业、政企等各行业开始处理海量数据。如何低成本、敏捷高效地搭建大数据处理平台,成为影响大数据创新效率的关键。 为了让用户以最简便地方式享用阿里云全球资源,在云端构建敏捷弹性、高可靠和高性价比的大数据平台,近日,阿里云在成都云栖大会上发布了一款Ha... ...
分类:
其他好文 时间:
2017-06-02 14:55:12
阅读次数:
289
#!/bin/bash# HOSTecho '10.211.55.101 spark01' >> /etc/hostsecho '10.211.55.102 spark02' >> /etc/hostsecho '10.211.55.103 spark03' >> /etc/hostsecho '1... ...
分类:
其他好文 时间:
2017-05-29 21:09:07
阅读次数:
314
Oracle中的查询如果放到spark-local模式中计算会有怎样的结果?下面我们看一个案例这里需要说明的是,我这里并没有用spark集群,以免大家认为这里性能的提示只是集群计算能力的功劳,具体原因和优化方式我会在后续的博客中说明。
分类:
数据库 时间:
2017-05-21 21:54:29
阅读次数:
224
SELECTCASE(pmod(datediff(f0.`4168388__c_0`,‘1970-01-04‘),7)+1)WHEN‘1‘THEN‘星期日‘WHEN‘2‘THEN‘星期一‘WHEN‘3‘THEN‘星期二‘WHEN‘4‘THEN‘星期三‘WHEN‘5‘THEN‘星期四‘WHEN‘6‘THEN‘星期五‘WHEN‘7‘THEN‘星期六‘ELSE‘星期六‘ENDASd_4168393FROMrrf0ORDERBYd_41683932.0.1中case..
分类:
数据库 时间:
2017-05-19 23:56:37
阅读次数:
323
市面上的BI工具形形色色,功能性能包装得十分亮丽,但实际应用中我们往往更关注的是朴实的技术特性和解决方案。对于大数据,未来的应用趋势不可抵挡,很多企业也正存在大数据分析处理展现的需求,以下我们列举市面上主流的三款BI系统,就“大数据”特性展开探讨,主要是与Hadoop、Spark、多维分析数据库的对 ...
分类:
其他好文 时间:
2017-04-12 11:13:49
阅读次数:
276
修改hostname bogon 为localhost 查看ip地址 执行结果 此时python 版本为2.7 将python版本升级至3.0及以上 一、 下载欲升级python版本 Python-3.4.5,将包放于本机与虚似机的共享目录下,上传至虚似机的opt目录下 二、 解压 三、阅读READ ...
分类:
其他好文 时间:
2017-03-21 15:53:31
阅读次数:
337
转载:http://www.cnblogs.com/ysisl/p/5979268.html 一、 下载资料 1. JDK 1.6 + 2. Scala 2.10.4 3. Hadoop 2.6.4 4. Spark 1.6 二、预先安装 1. 安装JDK 2. 安装Scala 2.10.4 解压安 ...
分类:
Web程序 时间:
2017-03-14 22:55:03
阅读次数:
234
对于我这样一个一直工作在.net平台上的developer来讲,Hadoop,Spark,HBase等这些大数据名词比较陌生,对于分布式计算,.net上也有类似的Parallel(我说的不是HDInsight), 这篇文章是我尝试从.net上的Parallel类库的角度去讲述什么是spark。 我们 ...
分类:
Web程序 时间:
2017-03-10 16:45:50
阅读次数:
243
转载请在页首明显处注明作者与出处 http://www.cnblogs.com/zhuxiaojie/p/6391518.html 一:说明 此为大数据系列的一些博文,有空的话会陆续更新,包含大数据的一些内容,如hadoop,spark,storm,机器学习等。 当前使用的hadoop版本为2.6. ...
分类:
编程语言 时间:
2017-02-12 22:22:19
阅读次数:
303