groupby:1.对单行操作,例:data.groupby("someone_column1").size() 2.对两行操作,例:data.groupby("someone_column1")."someone_column2".sum() 返回series pivot_table(): 对三列 ...
分类:
其他好文 时间:
2018-12-26 00:32:56
阅读次数:
137
Outline 处理数据时,遇到文件中包含一些不需要的数据(行),需要把这些不符合要求的行给删除掉。 例如:该数据中应该都是2000年的数据,但是包含了一些2001年的数据,所以需要把2001年的数据给删除掉。 筛选出指定行 找到所有包含2000年的数据: 根据pandas中取反操作:”~“, 取出 ...
分类:
其他好文 时间:
2018-12-23 18:34:18
阅读次数:
2400
转自:https://www.cnblogs.com/dreamroute/p/5207813.html 进程(process)和线程(thread)是操作系统的基本概念,但是它们比较抽象,不容易掌握。 最近,我读到一篇材料,发现有一个很好的类比,可以把它们解释地清晰易懂。 1. 计算机的核心是CP ...
分类:
编程语言 时间:
2018-12-19 23:59:08
阅读次数:
341
原始文件 下面是Excel打开以及pd.read_csv() 打开: 里面只是干巴巴的数据,没有列名,so,需要给其设置列名。 Method1 不让第一行数据默认当作列名(默认第一行数据是列名了)。 只需要在pd.read_csv() 中加参数 header=None 这样读出来的数据就默认以1、2 ...
分类:
其他好文 时间:
2018-12-19 19:35:31
阅读次数:
531
原文地址:https://chrisalbon.com/python/data_wrangling/pandas_join_merge_dataframe/ Join And Merge Pandas Dataframe 20 Dec 2017 import modules import panda ...
分类:
其他好文 时间:
2018-12-16 11:02:38
阅读次数:
156
使用yield可以构造一个生成器,可以在循环中避免前面的内容被后面的内容覆盖。例如: ...
分类:
编程语言 时间:
2018-12-15 12:02:11
阅读次数:
289
1 import pandas as pd 2 data = pd.read_csv('D:/suning/iris.csv') 3 data = data.iloc[:,1:] 4 5 ###2维散点图 6 import matplotlib.pyplot as plt 7 8 k=[ 9 'Se... ...
分类:
编程语言 时间:
2018-12-10 14:16:19
阅读次数:
406
1、离散值的onehot编码 1. DF= DF.drop('column_name', 1); 2. DF.drop('column_name',axis=1, inplace=True) 3. DF.drop([DF.columns[[0,1, 3]]], axis=1,inplace=True ...
分类:
其他好文 时间:
2018-12-10 11:30:34
阅读次数:
231
https://blog.csdn.net/luqiwei_1981/article/details/80891009 from pandas.api.types import is_list_like#from pandas.core.common import is_list_likefrom ...
分类:
其他好文 时间:
2018-12-06 22:21:30
阅读次数:
254
from sklearn.datasets import load_boston boston=load_boston() boston.keys() print(boston.DESCR) boston.data.shape import pandas as pd pd.DataFrame(bos... ...
分类:
其他好文 时间:
2018-12-06 14:36:40
阅读次数:
196