概述 环境安装 设置是否自动启动 基本使用 创建环境 进入/退出环境 安装 python package 概述 使用 python 做数据分析,目前最方便和最流行的环境就是 Anaconda。 Anaconda 太重,刚开始学习使用 python 数据分析,还是觉得 Miniconda 更好一些。 ...
分类:
其他好文 时间:
2021-04-07 11:41:41
阅读次数:
0
概述 计算机包括硬件和软件两个部分。硬件包括计算机中可以看得到的物理部分,而软件提供看不见的指令部分。这些指令控制硬件并且使得硬件完成特定的任务。 程序设计 创建或者开发软件,软件包含了指令,告诉计算机做什么。 程序设计语言 软件开发人员在程序语言工具帮助下创建软件 如何学习那种程序设计语言? 没有 ...
分类:
其他好文 时间:
2021-04-07 10:30:43
阅读次数:
0
1.Spark概述 Apache Spark是一个闪电般快速的实时处理框架。它进行内存计算以实时分析数据。由于 Apache Hadoop MapReduce 仅执行批处理并且缺乏实时处理功能,因此它开始出现。因此,引入了Apache Spark,因为它可以实时执行流处理,也可以处理批处理。 除了实 ...
分类:
其他好文 时间:
2021-04-06 15:01:09
阅读次数:
0
2.1 序列化概述 1)什么是序列化 序列化就是把内存中的对象,转换成字节序列(或其他数据传输协议)以便于存储到磁盘(持久化)和网络传输。 反序列化就是将收到字节序列(或其他数据传输协议)或者是磁盘的持久化数据,转换成内存中的对象。 2)为什么要序列化 一般来说,“活的”对象只生存在内存里,关机断电 ...
分类:
其他好文 时间:
2021-04-06 14:52:31
阅读次数:
0
集合框架简介 概述 集合就像一种容器,可以把多个对象放进容器内 特点:提供一种存储空间可变的存储模型,存储的数据容量可以随时发生改变 集合按照其存储结构可以分为两大类: 单列集合 java.util.Collection 双列集合 java.util.Map 四大体系 Set:无序、不可重复的集合 ...
分类:
其他好文 时间:
2021-04-06 14:42:03
阅读次数:
0
1.1 MapReduce定义 MapReduce 是一个分布式运算程序的编程框架,是用户开发“基于 Hadoop 的数据分析 应用”的核心框架。 MapReduce 核心功能是将用户编写的业务逻辑代码和自带默认组件整合成一个完整的分布式运算程序,并发运行在一个 Hadoop 集群上。 1.2 Ma ...
分类:
其他好文 时间:
2021-04-05 12:32:51
阅读次数:
0
实时流式计算 Kafka Stream 2.1 概述 Kafka Stream是Apache Kafka从0.10版本引入的一个新Feature。它是提供了对存储于Kafka内的数据进行流式处理和分析的功能。 Kafka Stream的特点如下: Kafka Stream提供了一个非常简单而轻量的L ...
分类:
其他好文 时间:
2021-04-05 12:27:09
阅读次数:
0
概述 HttpSession是由javaWeb提供的,session是服务器对象,保存在服务器端 HttpSession是Servlet三大域对象之一,所以他也有setAttribute(),getAttribute(),removeAttribute() HttpSession底层依赖Cookie ...
分类:
Web程序 时间:
2021-04-05 12:14:19
阅读次数:
0
(JAVA中过滤器(Filter)与拦截器(Interceptor)) 概述 过滤器(Filter) 过滤器实际上就是对web资源进行拦截,做一些处理后再交给下一个过滤器或servlet处理 通常都是用来拦截request进行处理的,也可以对返回的response进行拦截处理。 拦截器(Interc ...
分类:
编程语言 时间:
2021-04-02 12:57:04
阅读次数:
0
管道通信(上) (一)概述 Linux Shell 都允许重定向,而重定向使用的就是管道。例如,ps | grep vsftpd 。管道是单向的、先进先出的、无结构的、固定大小的字节流。管道是Linux由Unix那里继承过来的进程间的通信机制,它是Unix早期的一个重要通信机制。其思想是,在内存中创 ...
分类:
其他好文 时间:
2021-04-01 13:26:09
阅读次数:
0