码迷,mamicode.com
首页 >  
搜索关键字:hadoop、spark    ( 198个结果
hadoop系列三:mapreduce的使用
转载请在页首明显处注明作者与出处 一:说明 此为大数据系列的一些博文,有空的话会陆续更新,包含大数据的一些内容,如hadoop,spark,storm,机器学习等。 当前使用的hadoop版本为2.6.4 上一篇:hadoop系列二:HDFS文件系统的命令及JAVA客户端API 二:wordcoun ...
分类:其他好文   时间:2017-06-03 12:51:54    阅读次数:144
如何低成本、高效率搭建Hadoop/Spark大数据处理平台
随着人们逐渐认识到 “大数据”的价值,互联网、电商到金融业、政企等各行业开始处理海量数据。如何低成本、敏捷高效地搭建大数据处理平台,成为影响大数据创新效率的关键。 为了让用户以最简便地方式享用阿里云全球资源,在云端构建敏捷弹性、高可靠和高性价比的大数据平台,近日,阿里云在成都云栖大会上发布了一款Ha... ...
分类:其他好文   时间:2017-06-02 14:55:12    阅读次数:289
[Hadoop][Spark]Cluster and HA
#!/bin/bash# HOSTecho '10.211.55.101 spark01' >> /etc/hostsecho '10.211.55.102 spark02' >> /etc/hostsecho '10.211.55.103 spark03' >> /etc/hostsecho '1... ...
分类:其他好文   时间:2017-05-29 21:09:07    阅读次数:314
Oracle 与spark-local 模式的性能对比
Oracle中的查询如果放到spark-local模式中计算会有怎样的结果?下面我们看一个案例这里需要说明的是,我这里并没有用spark集群,以免大家认为这里性能的提示只是集群计算能力的功劳,具体原因和优化方式我会在后续的博客中说明。
分类:数据库   时间:2017-05-21 21:54:29    阅读次数:224
spark-sql case when 问题
SELECTCASE(pmod(datediff(f0.`4168388__c_0`,‘1970-01-04‘),7)+1)WHEN‘1‘THEN‘星期日‘WHEN‘2‘THEN‘星期一‘WHEN‘3‘THEN‘星期二‘WHEN‘4‘THEN‘星期三‘WHEN‘5‘THEN‘星期四‘WHEN‘6‘THEN‘星期五‘WHEN‘7‘THEN‘星期六‘ELSE‘星期六‘ENDASd_4168393FROMrrf0ORDERBYd_41683932.0.1中case..
分类:数据库   时间:2017-05-19 23:56:37    阅读次数:323
论各类BI工具的“大数据”特性!
市面上的BI工具形形色色,功能性能包装得十分亮丽,但实际应用中我们往往更关注的是朴实的技术特性和解决方案。对于大数据,未来的应用趋势不可抵挡,很多企业也正存在大数据分析处理展现的需求,以下我们列举市面上主流的三款BI系统,就“大数据”特性展开探讨,主要是与Hadoop、Spark、多维分析数据库的对 ...
分类:其他好文   时间:2017-04-12 11:13:49    阅读次数:276
Hadoop/Spark开发环境配置
修改hostname bogon 为localhost 查看ip地址 执行结果 此时python 版本为2.7 将python版本升级至3.0及以上 一、 下载欲升级python版本 Python-3.4.5,将包放于本机与虚似机的共享目录下,上传至虚似机的opt目录下 二、 解压 三、阅读READ ...
分类:其他好文   时间:2017-03-21 15:53:31    阅读次数:337
Apache Spark 1.6 Hadoop 2.6 Mac下单机安装配置
转载:http://www.cnblogs.com/ysisl/p/5979268.html 一、 下载资料 1. JDK 1.6 + 2. Scala 2.10.4 3. Hadoop 2.6.4 4. Spark 1.6 二、预先安装 1. 安装JDK 2. 安装Scala 2.10.4 解压安 ...
分类:Web程序   时间:2017-03-14 22:55:03    阅读次数:234
从.net parallel角度解读spark
对于我这样一个一直工作在.net平台上的developer来讲,Hadoop,Spark,HBase等这些大数据名词比较陌生,对于分布式计算,.net上也有类似的Parallel(我说的不是HDInsight), 这篇文章是我尝试从.net上的Parallel类库的角度去讲述什么是spark。 我们 ...
分类:Web程序   时间:2017-03-10 16:45:50    阅读次数:243
hadoop系列二:HDFS文件系统的命令及JAVA客户端API
转载请在页首明显处注明作者与出处 http://www.cnblogs.com/zhuxiaojie/p/6391518.html 一:说明 此为大数据系列的一些博文,有空的话会陆续更新,包含大数据的一些内容,如hadoop,spark,storm,机器学习等。 当前使用的hadoop版本为2.6. ...
分类:编程语言   时间:2017-02-12 22:22:19    阅读次数:303
198条   上一页 1 ... 8 9 10 11 12 ... 20 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!