最近使用pandas,一直搞不清楚其中几种切片方法的区别,今天专门看了一下。 0. 把Series的行index或Dataframe的列名直接当做属性来索引。 如: 但是这种方法索引的名字可能会与自带的方法冲突,比如min,max等等,所以可能会失效。另外,在新版本中,这种索引方法不能作为左值。 1 ...
分类:
其他好文 时间:
2018-04-30 14:31:39
阅读次数:
340
官方帮助文档解释; DataFrame.sum(axis=None, skipna=None, level=None, numeric_only=None, **kwargs) axis : {index (0), columns (1)},axis=0代表对列进行求和,axis=1代表对行进行求和 ...
分类:
其他好文 时间:
2018-04-30 11:44:09
阅读次数:
1096
数据挖掘比赛中,获得的数据中可能有个人的生日,在数据分析中并不需要生日,而是需要年龄。不同年龄会呈现不同的状态,比如收入、健康、居住条件等,年龄能够很好的把不同样本的差异性进行大范围的划分。下面讲述如果将生日转年龄: # -*- coding: utf-8 -*- # 生成数据 import pan... ...
分类:
其他好文 时间:
2018-04-29 16:22:43
阅读次数:
580
https://stackoverflow.com/questions/33181846/programmatically-convert-pandas-dataframe-to-markdown-table https://stackoverflow.com/questions/20685635/ ...
分类:
其他好文 时间:
2018-04-28 23:47:32
阅读次数:
631
原创博文,转载请注明出处! 本文代码的github地址 例子: 1 # -*- coding: utf-8 -*- 2 # 创建dataframe 3 import pandas as pd 4 s = pd.DataFrame(['a,b,c','c,d,e']) 5 print(s) 6 """... ...
分类:
其他好文 时间:
2018-04-26 19:55:04
阅读次数:
958
一、准备过程 首先打开hao123漫画筛选区,网址是https://www.hao123.com/manhua/list/?finish=&audience=&area=&cate=&order=1 在这里可以通过审查模式看到第一页的详细信息,而目的则是通过爬取漫画筛选页面的每部漫画的人气与题材来分 ...
分类:
其他好文 时间:
2018-04-24 23:15:12
阅读次数:
272
# coding: utf-8 # In[19]: # 0.78468 # In[20]: import numpy as np import pandas as pd import warnings warnings.filterwarnings('ignore') from sklearn im... ...
分类:
其他好文 时间:
2018-04-23 16:34:28
阅读次数:
200
一、pandas的简介 Python Data Analysis Library 或 pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。pandas提供了大量能使我们快速便捷地处理数 ...
分类:
其他好文 时间:
2018-04-22 18:12:26
阅读次数:
219
python数据表的合并(python pandas join() 、merge()和concat()的用法) merage# pandas提供了一个类似于关系数据库的连接(join)操作的方法<Strong>merage</Strong>,可以根据一个或多个键将不同DataFrame中的行连接起来 ...
分类:
编程语言 时间:
2018-04-22 10:55:15
阅读次数:
699
本篇为《Python机器学习》一书的笔记。 一、简单线性回归模型 简单(单变量)线性回归的目标是:通过模型来描述某一特征(解释变量x),与连续输出(目标特征y)之间的关系。当只有一个解释变量时,线性模型的函数定义如下: 线性回归可以看成是求解样本点的最佳拟合直线,这条最佳拟合线被称为回归线,回归线与 ...
分类:
其他好文 时间:
2018-04-19 17:42:13
阅读次数:
303