1.清洗数据中的全空行 2.清洗user列中的空值的行 3.统计上行流量列以及下行流量列的当天每人每终端服务app的总量。 4.统计每人每天终端服务app的次数。 1.用正则表达以及loc清洗tm_type列的数据,做以下更改 系统移动终端=mobile() pc=pc() 多终端=多终端() 未知 ...
分类:
其他好文 时间:
2019-06-01 19:40:33
阅读次数:
97
介绍:https://redstonewill.com/2372/ 项目网址:https://github.com/FavioVazquez/ds-cheatsheets ...
分类:
数据库 时间:
2019-05-31 13:53:29
阅读次数:
106
1、删除无效列(整列都是空白,且说明无效的列) 2、删除无效行(整行都是空白,且说明无效的行) ...
分类:
其他好文 时间:
2019-05-29 14:35:42
阅读次数:
103
工作中遇到的一个问题: 统计各地区新能源汽车的充电时长 数据来源是北理新源的单日全球的运行数据。 这里仅统计北上广重庆四个地区的 数据处理的代码就省略了 需要整理好的是4个dataframe 分别是对应上述4个城市的: 例: 这时候我们需要提取其中的时间序列统计所有vid的 充电状态为1的第一个时间 ...
分类:
其他好文 时间:
2019-05-27 16:28:02
阅读次数:
135
reshape(行数,列数)常用来更改数据的行列数目 一般可用于numpy的array和ndarray, pandas的dataframe和series(series需要先用series.values把对象转化成ndarray结构) 那么问题来了reshape(-1,1)是什么意思呢?难道有-1行? ...
分类:
编程语言 时间:
2019-05-26 00:14:23
阅读次数:
136
一、Pandas概要介绍 pandas是一个开源的,BSD许可的库,为Python编程语言提供高性能,易于使用的数据结构和数据分析工具。可以用于对CSV和文本文件、Microsoft Excel、SQL数据库数据的读写。 能够帮助数据清洗,数据分析和数据建模。 二、主要的两种数据结构 序列(Seri ...
分类:
其他好文 时间:
2019-05-25 19:51:16
阅读次数:
122
# Author:Zhang Yuan整理,版本Pandas0.24.2 # 0. 习惯上,我们会按下面格式引入所需要的包: import pandas as pd import numpy as np import matplotlib.pyplot as plt # 1. 创建对象 Object... ...
分类:
其他好文 时间:
2019-05-23 23:25:38
阅读次数:
227
#%% #载入数据 、查看相关信息 import pandas as pd import numpy as np from sklearn.preprocessing import LabelEncoder print('第一步:加载、查看数据') file_path = r'D:\train\20... ...
分类:
编程语言 时间:
2019-05-23 13:09:41
阅读次数:
119
Ipython:交互式的Python命令行 TAB:自动完成 ?:内省,命令空间搜索 !:执行系统命令 %run:命令执行文件代码 Ipython常用魔术命令: %quickref:显示Ipython的快速参考 %magic:显示所有魔术命令的详细文档 %debug:从最新的异常追踪的底部进入交互式 ...
分类:
编程语言 时间:
2019-05-20 21:16:13
阅读次数:
189