码迷,mamicode.com
首页 >  
搜索关键字:spark 大数据 hadoop hive parquet    ( 33788个结果
03 Spark RDD基础编程
1. 准备文本文件从文件创建RDD lines=sc.textFile()筛选出含某个单词的行 lines.filter()lambda 参数:条件表达式 2. 生成单词的列表从列表创建RDD words=sc.parallelize()筛选出长度大于2 的单词 words.filter() ...
分类:其他好文   时间:2021-03-29 12:45:18    阅读次数:0
Spark RDD编程
1.准备文本文件,从文件创建RDD lines=sc.textFile(),筛选出含某个单词的行 lines.filter(),lambda 参数:条件表达式 2.生成单词的列表,从列表创建RDD words=sc.parallelize(),筛选出长度大于2 的单词 words.filter() ...
分类:其他好文   时间:2021-03-29 12:44:51    阅读次数:0
Hadoop集群--linux虚拟机JDK安装与配置
Hadoop集群 第三章 linux虚拟机 jdk 配置 1、查看并卸载主机原有JDK 1)查找并卸载 jdk 相关软件 rpm -qa | grep -i java | xargs -n1 rqm -e --nodeps rpm -qa:查看安装的所有 rpm 软件包 grep -i :忽略大小写 ...
分类:系统相关   时间:2021-03-29 12:39:22    阅读次数:0
02 Spark RDD编程
1.准备文本文件,从文件创建RDD lines=sc.textFile(),筛选出含某个单词的行 lines.filter(),lambda 参数:条件表达式 2.生成单词的列表,从列表创建RDD words=sc.parallelize(),筛选出长度大于2 的单词 words.filter() ...
分类:其他好文   时间:2021-03-29 12:30:29    阅读次数:0
03 Spark RDD编程基础
1. 准备文本文件从文件创建RDD lines=sc.textFile()筛选出含某个单词的行 lines.filter()lambda 参数:条件表达式 2. 生成单词的列表从列表创建RDD words=sc.parallelize()筛选出长度大于2 的单词 words.filter() ...
分类:其他好文   时间:2021-03-29 12:04:28    阅读次数:0
Hive 列转行split函数按\切割Unexpected internal error near index 1 \ ^错误
能够看到是正则初始化编译时出现了错误,也就是split方法使用的正则写法出现了错误,因此上网找到了比较详细的写法。 故在使用split进行列转行时应该四个\ ...
分类:其他好文   时间:2021-03-18 14:07:12    阅读次数:0
有必要了解的大数据知识(二) Hadoop
前言 接上文,复习整理大数据相关知识点,这章节从MapReduce开始... MapReduce介绍 MapReduce思想在生活中处处可见。或多或少都曾接触过这种思想。MapReduce的思想核心是“分而治之”,适用于大量复杂的任务处理场景(大规模数据处理场景)。 Map负责“分”,即把复杂的任务 ...
分类:其他好文   时间:2021-03-17 15:09:28    阅读次数:0
arcgis sample代码之SOE示例代码PageLayout REST Server Object Extension的源码分析(Java)
为什么10.2里面没有pagelayout的代码了。。 原文:https://www.cnblogs.com/ayanmw/archive/2012/06/06/2538783.html ...
分类:编程语言   时间:2021-03-17 14:46:16    阅读次数:0
中国DLP获Gartner认可!关于DLP应用,技术大咖齐成岳这样说
处在数字化时代的浪潮中,相信大家对于“数据”都不会陌生。无论对于企业还是个人,数据已经成为了数字化时代的“石油”。早在几年前马云就曾提出过一个观点——未来将会实现从IT时代向DT时代的变革。而在几年后的今天,我们切实感受到了大数据所带来的滚滚红利。 ? 在享受大数据红利的同时,也同样要注意数据的安全 ...
分类:其他好文   时间:2021-03-17 14:23:44    阅读次数:0
大数据技术01---学习路径
大数据技术板块划分 数据采集 flume kafka logstash filebeat ... 数据存储 mysql redis hbase hdfs ... 虽然mysql不属于大数据范畴 但是我在这也列出来了,因为你在工作中离不开它 数据查询 hive impala elasticsearch ...
分类:其他好文   时间:2021-03-17 14:04:41    阅读次数:0
33788条   上一页 1 ... 22 23 24 25 26 ... 3379 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!