在用python进行数据分析的时候,需要提前安装如下几个库: Numpy:是python进行科学计算的科学包 pandas:提供了能够快速便捷地处理结构化数据的大量数据结构和函数 matplotlib: 看名字和matlab有点像,matplotlib是用于绘制数据图表的python库 ipytho ...
分类:
编程语言 时间:
2018-01-15 20:36:28
阅读次数:
625
一:创建链接数据库引擎 二:读取数据库数据,存储为DataFrame格式 部分来自于博客:http://blog.csdn.net/u011301133/article/details/52488690 1:读取自定义数据(通过SQL语句) pandas.read_sql_query(sql, co ...
分类:
数据库 时间:
2018-01-15 20:22:10
阅读次数:
1004
问题1:错误提示:UnicodeDecodeError: 'ascii' codec can't decode byte 0xb8 原因:含有中文字符 问题2:将DataFrame格式的文件保存为csv格式,比如,DF变量为DataFrame格式的数据 ...
分类:
编程语言 时间:
2018-01-15 18:45:33
阅读次数:
185
一、DataFrame简介 一个表型格数的、据结构,包含有一组有序的列,每列可以是不同的值类型(数值、字符串布尔型等),DataFrame即有行索引也有列索引,可以被看做是由Series组成的字典。 二、DataFrame创建 DataFrame可以使用数组,列表和字典等方式进行创建 当DataFr ...
分类:
其他好文 时间:
2018-01-14 22:39:00
阅读次数:
194
作者:JSong 时间:2017.12 我想通过几篇文章,给评分卡的全流程一个中等粒度的介绍。另外我的本职工作不是消费金融的数据分析,所以本系列的文章会偏技术一些。 数据分析工具主要有Python3及pandas、sklearn等科学计算包,另外也会有自己的工具包reportgen。 信用记录数据采 ...
分类:
其他好文 时间:
2018-01-14 20:17:22
阅读次数:
762
Python学习笔记一、主要基本内容1.1主要python库(1)Numpy库:主要进行数据处理,对于数组进行元素级运算;线性代数运算,傅立叶变换,随机数的生产;(2)Pandas库:便捷处理结构化数据的大量数据结构和函数;(3)Matplotlib库:绘制数据图表;1.2主要工作(1)与外界交互:读写各种各样的格式和数据库;(2)准备:对数据进行清理、修整、整和、规范化、重塑、切片切块、变形等处
分类:
编程语言 时间:
2018-01-14 15:55:37
阅读次数:
212
怎样删除list中空字符? 最简单的方法:new_list = [ x for x in li if x != '' ] 今天是5.1号。 这一部分主要学习pandas中基于前面两种数据结构的基本操作。 设有DataFrame结果的数据a如下所示: a b c one 4 1 1 two 6 2 0 ...
分类:
其他好文 时间:
2018-01-13 20:41:10
阅读次数:
369
1.Series出现原因:当系统需要字典式的数组,需要用到map数据结构,但是map结构是无序的,不支持排序。Seires结构综合了list和map的特点 2.使用数组生成索引 3.使用字典生成索引 4.简单运算 注:Seires只有name和index.name两列 5.基本操作 ...
分类:
其他好文 时间:
2018-01-11 23:49:52
阅读次数:
211
df1为dataframe结构的测试数据:df1数据是从test.xlsx文档中读取的,使用示例代码如下:tushare?ts
pandas?pd
df?=?pd.read_excel()
df1?=?df.head()
分类:
编程语言 时间:
2018-01-10 23:51:17
阅读次数:
913
转自:http://blog.csdn.net/stevenkwong/article/details/52528616 1 concat 参数说明 objs: series,dataframe或者是panel构成的序列lsit axis: 需要合并链接的轴,0是行,1是列 join:连接的方式 i ...
分类:
其他好文 时间:
2018-01-10 18:35:52
阅读次数:
318