什么是分组聚合? 如图: groupby:(by=None,as_index=True) by:根据什么进行分组,用于确定groupby的组 as_index:对于聚合输出,返回以组便签为索引的对象,仅对DataFrame df1 = pd.DataFrame({'fruit':['apple',' ...
分类:
编程语言 时间:
2021-04-10 13:05:19
阅读次数:
0
概述 环境安装 设置是否自动启动 基本使用 创建环境 进入/退出环境 安装 python package 概述 使用 python 做数据分析,目前最方便和最流行的环境就是 Anaconda。 Anaconda 太重,刚开始学习使用 python 数据分析,还是觉得 Miniconda 更好一些。 ...
分类:
其他好文 时间:
2021-04-07 11:41:41
阅读次数:
0
1.1 MapReduce定义 MapReduce 是一个分布式运算程序的编程框架,是用户开发“基于 Hadoop 的数据分析 应用”的核心框架。 MapReduce 核心功能是将用户编写的业务逻辑代码和自带默认组件整合成一个完整的分布式运算程序,并发运行在一个 Hadoop 集群上。 1.2 Ma ...
分类:
其他好文 时间:
2021-04-05 12:32:51
阅读次数:
0
1. 四种数据库的比较 数据库描述 Greenplum 开源大规模并行数据分析引擎。借助MPP架构,在大型数据集上执行复杂SQL分析的速度比很多解决方案都要快。应用广泛。 Teradata 大型数据仓库系统,产品成熟,价格昂贵。用于证券系统。 Presto 分布式SQL查询引擎, 专门进行高速、实时 ...
分类:
数据库 时间:
2021-04-05 12:00:18
阅读次数:
0
数据分析-Numpy 1.numpy-安装和使用 1.1 简介 1.2 安装 pip install numpy 1.3 使用 import numpy as np 2.numpy-ndarray的数据类型 简单示例 下划线是为了和python关键字区分 a = np.array(range(10) ...
分类:
其他好文 时间:
2021-04-05 11:42:01
阅读次数:
0
VR智慧线上工厂3D建模可视化三维模型大屏应用强化工厂安全保障为核心,建立智能自动化系统、远程监控系统、实时定位分析系统以及监控人员数据分析。商迪3DVR智慧线上工厂3D建模可视化三维模型大屏应用建设远程监控视频、指纹识别、周边安防系统、人员实时定位、智能手环、智能探头、温度检测等各类感知设备、实现 ...
分类:
其他好文 时间:
2021-03-31 12:16:30
阅读次数:
0
1. awk命令解析: awk是一个强大的文本分析工具,相对于grep的查找,sed编辑,awk在其对数据分析并生成报告时,显得尤为强大;简单来说,awk就是把文件逐行的读入,(空格,制表符)为默认分隔符将每行切片,切开的部分再进行各种分析处理。 2.用法总览: 3.实例展示: (1) (2) (3 ...
分类:
其他好文 时间:
2021-03-18 14:38:55
阅读次数:
0
一、火焰图的生成。 1、采集原始CPU消耗数据:perf record -e cpu-clodk -g -p 3578 -o perf.data, 统计大概1-2分钟,ctrl+c中断即可。 2、使用perf script工具分析perf.data文件:perf script -i perf.dat ...
分类:
其他好文 时间:
2021-03-17 15:10:21
阅读次数:
0
数据应用,是真正体现数仓价值的部分,包括且又不局限于 数据可视化、BI、OLAP、即席查询,实时大屏,用户画像,推荐系统,数据分析,数据挖掘,人脸识别,风控反欺诈,ABtest等等 OLAP(On-Line Analytical Processing):在线分析处理,主要用于支持企业决策管理分析。 ...
分类:
其他好文 时间:
2021-03-16 11:54:33
阅读次数:
0
思考 scrapy 为什么是框架而不是库? scrapy 是如何工作的? Python爬虫、数据分析、网站开发等案例教程视频免费在线观看 https://space.bilibili.com/523606542 Python学习交流群:1039649593 项目结构 在开始爬取之前,必须创建一个新的 ...
分类:
编程语言 时间:
2021-03-09 13:15:09
阅读次数:
0