十分钟学会Pandas 这是关于Pandas的简短介绍主要面向新用户。你可以参考Cookbook了解更复杂的使用方法 习惯上,我们这样导入: 创建对象 请参阅数据结构简介部分 通过传递一个列表的值创建一个Series,让Pandas创建一个默认的整数索引: 通过传递的numpy数组创建一个DataF ...
分类:
其他好文 时间:
2017-10-29 23:22:08
阅读次数:
272
#Author:Mini#!/usr/bin/env pythonimport pandas as pimport numpy as nimport matplotlib.pylab as pyldata=p.read_csv("F:/BaiduYunDownload/hexun1.csv")a=d ...
分类:
编程语言 时间:
2017-10-29 18:47:47
阅读次数:
215
先引入包,一般EDA需要引入如下包: 1 import numpy as np 2 import pandas as pd 3 import matplotlib.pyplot as plt 4 import seaborn as sns 5 plt.style.use('fivethirtyeig ...
分类:
其他好文 时间:
2017-10-28 20:29:32
阅读次数:
320
使用前提:Windows环境配置了Anaconda 3,其中python版本为3.6.2. 默认安装pandas。 Mysql版本:下载了Mysql 5.7.17版本,一路next安装完成。 目标:将pandas的dataframe数据存到数据库中。 遇到的问题: 返回: 搜了下,应该是MySQLd ...
分类:
数据库 时间:
2017-10-28 17:42:51
阅读次数:
305
最近学习matplotlib绘图可视化,感觉知识点比较多,边学习边记录。 对于数据可视化,个人建议Jupyter Notebook。 1.首先导包,设置环境 import pandas as pd import numpy as np import sys reload(sys) sys.setde ...
分类:
编程语言 时间:
2017-10-28 15:29:40
阅读次数:
533
1、删除重复元素 1、删除重复元素 1、删除重复元素 1、删除重复元素 使用duplicated()函数检测重复的行, 返回元素为布尔类型的Series对象, 每个元素对应一行,如果该行不是第一次出现,则元素为True 使用drop_duplicates()函数删除重复的行 如果使用pd.conca ...
分类:
其他好文 时间:
2017-10-27 23:09:20
阅读次数:
275
现在有文件data.csv 文件编码格式为:ANSI data.csv 在python控制台输入以下代码: >>> import pandas as pd>>> df = pd.read_excel('C:\\Users\\Thinkpad\\Desktop\\data.csv')>>> df 报错 ...
分类:
编程语言 时间:
2017-10-27 11:33:41
阅读次数:
656
1. 创建多层行索引 1. 创建多层行索引 1. 创建多层行索引 1. 创建多层行索引 1) 隐式构造 最常见的方法是给DataFrame构造函数的index参数传递两个或更多的数组 1) 隐式构造 最常见的方法是给DataFrame构造函数的index参数传递两个或更多的数组 1) 隐式构造 最常 ...
分类:
其他好文 时间:
2017-10-27 01:57:33
阅读次数:
302
pandas的拼接分为两种: 级联:pd.concat, pd.append 合并:pd.merge, pd.join 1. 使用pd.concat()级联 1. 使用pd.concat()级联 1. 使用pd.concat()级联 1. 使用pd.concat()级联 pandas使用pd.con ...
分类:
其他好文 时间:
2017-10-27 01:29:19
阅读次数:
290
一、结构化 1、单条新闻的详情字典:news 2、一个列表页所有单条新闻汇总列表:newsls.append(news) 3、所有列表页的所有新闻汇总列表:newstotal.extend(newsls) 二、转换成pandas的数据结构DataFrame 三、从DataFrame保存到excel ...
分类:
其他好文 时间:
2017-10-26 15:38:26
阅读次数:
166