Redis基础 NoSQL 学名(not only sql) 特点: 存储结构与MySQL这一种关系型数据库完全不同,NoSQL存储的是key-value形式的数据。 NoSQL有很多产品,都有自己的api和语法,以及业务场景。 产品种类: Mongodb Redis Hbase hadoop No ...
                            
                            
                                分类:
其他好文   时间:
2021-04-19 14:35:28   
                                阅读次数:
0
                             
                    
                        
                            
                            
                                
                    javaSE总结 JDK 开发者工具包 配置环境变量 java_HOME 配置到JDK的根目录 在系统变量path中配置环境变量:开发环境、运行时环境 JRE 运行环境 基础语法 命令行参数: javac Hello.java java Hello 文档注释:/** */ javadoc生成帮助文档 ...
                            
                            
                                分类:
编程语言   时间:
2021-04-13 11:58:49   
                                阅读次数:
0
                             
                    
                        
                            
                            
                                
                    1.Spark概述 Apache Spark是一个闪电般快速的实时处理框架。它进行内存计算以实时分析数据。由于 Apache Hadoop MapReduce 仅执行批处理并且缺乏实时处理功能,因此它开始出现。因此,引入了Apache Spark,因为它可以实时执行流处理,也可以处理批处理。 除了实 ...
                            
                            
                                分类:
其他好文   时间:
2021-04-06 15:01:09   
                                阅读次数:
0
                             
                    
                        
                            
                            
                                
                    2.1 序列化概述 1)什么是序列化 序列化就是把内存中的对象,转换成字节序列(或其他数据传输协议)以便于存储到磁盘(持久化)和网络传输。 反序列化就是将收到字节序列(或其他数据传输协议)或者是磁盘的持久化数据,转换成内存中的对象。 2)为什么要序列化 一般来说,“活的”对象只生存在内存里,关机断电 ...
                            
                            
                                分类:
其他好文   时间:
2021-04-06 14:52:31   
                                阅读次数:
0
                             
                    
                        
                            
                            
                                
                    1.1 MapReduce定义 MapReduce 是一个分布式运算程序的编程框架,是用户开发“基于 Hadoop 的数据分析 应用”的核心框架。 MapReduce 核心功能是将用户编写的业务逻辑代码和自带默认组件整合成一个完整的分布式运算程序,并发运行在一个 Hadoop 集群上。 1.2 Ma ...
                            
                            
                                分类:
其他好文   时间:
2021-04-05 12:32:51   
                                阅读次数:
0
                             
                    
                        
                            
                            
                                
                    mvn install:install-file -DgroupId=com.hadoop.XXXXX -DartifactId=hadoop-XXXXX -Dversion=0.4XXXXX -Dpackaging=jar -Dfile=/hadoopXXXX.jar ...
                            
                            
                                分类:
编程语言   时间:
2021-04-05 12:04:49   
                                阅读次数:
0
                             
                    
                        
                            
                            
                                一、filter,map,flatmap练习: 1.读文本文件生成RDD lines lines = sc.textFile('file:///home/hadoop/word.txt') lines.collect() 2.将一行一行的文本分割成单词 words words=lines.flatM ...
                            
                            
                                分类:
其他好文   时间:
2021-04-01 13:07:18   
                                阅读次数:
0
                             
                    
                        
                            
                            
                                Hadoop集群 第三章 linux虚拟机 jdk 配置 1、查看并卸载主机原有JDK 1)查找并卸载 jdk 相关软件 rpm -qa | grep -i java | xargs -n1 rqm -e --nodeps rpm -qa:查看安装的所有 rpm 软件包 grep -i :忽略大小写 ...
                            
                            
                                分类:
系统相关   时间:
2021-03-29 12:39:22   
                                阅读次数:
0
                             
                    
                        
                            
                            
                                
                    前言 接上文,复习整理大数据相关知识点,这章节从MapReduce开始... MapReduce介绍 MapReduce思想在生活中处处可见。或多或少都曾接触过这种思想。MapReduce的思想核心是“分而治之”,适用于大量复杂的任务处理场景(大规模数据处理场景)。 Map负责“分”,即把复杂的任务 ...
                            
                            
                                分类:
其他好文   时间:
2021-03-17 15:09:28   
                                阅读次数:
0
                             
                    
                        
                            
                            
                                1、为什么要引入Yarn和Spark。 (1)现有的hadoop生态系统中存在的问题 1)使用mapreduce进行批量离线分析; 2)使用hive进行历史数据的分析; 3)使用hbase进行实时数据的查询; 4)使用storm进行实时的流处理; (2)选用spark的原因 1) 应用于流式计算的S ...
                            
                            
                                分类:
其他好文   时间:
2021-03-16 13:32:12   
                                阅读次数:
0