思路: 1、先将DataFrame数据转换为numpy 2、通过numpy来修改对角线值 3、再将数据转换为DataFrame 代码: import pandas as pd import numpy as np # 数据 df = pd.DataFrame(np.arange(16).reshap ...
分类:
其他好文 时间:
2020-05-12 11:30:04
阅读次数:
104
https://datawhalechina.github.io/pms50/#/chapter3/chapter3 如果你想了解两个变量如何相互改变,那么最佳拟合线就是常用的方法。 下图显示了数据中各组之间最佳拟合线的差异。 要禁用分组并仅为整个数据集绘制一条最佳拟合线,请从下面的 sns.lmp ...
分类:
其他好文 时间:
2020-05-11 23:47:07
阅读次数:
402
数据分析与建模,本次尝试使用C++进行处理,数据在excel中,遂考虑使用Python进行excel转txt操作,代码如下: 1 # -*- coding: UTF-8 -*- 2 import sys 3 import json 4 5 import pandas as pd 6 import n ...
分类:
编程语言 时间:
2020-05-11 13:07:30
阅读次数:
58
Python中的pandas模块进行数据分析。 接下来pandas介绍中将学习到如下8块内容: 1、数据结构简介:DataFrame和Series 2、数据索引index 3、利用pandas查询数据 4、利用pandas的DataFrames进行统计分析 5、利用pandas实现SQL操作 6、利 ...
分类:
其他好文 时间:
2020-05-11 10:32:07
阅读次数:
65
def getDataDict(): dataFrame = pandas.read_excel('D:/Py/2010人口普查.xlsx',skiprows=2) raceList = list(map(lambda s:str(s).replace("\xa0",""),dataFrame.il ...
分类:
其他好文 时间:
2020-05-10 13:15:35
阅读次数:
98
set_index() 函数原型:DataFrame.set_index(keys, drop=True, append=False, inplace=False, verify_integrity=False) 参数解释: keys:列标签或列标签/数组列表,需要设置为索引的列 drop:默认为T ...
分类:
其他好文 时间:
2020-05-10 11:20:35
阅读次数:
76
#!/usr/bin/env python import os import numpy as np import py7zr import shutil import pandas as pd import time #处理7Z分笔数据 path = r'G:\datas of status\ti ...
分类:
其他好文 时间:
2020-05-10 10:58:21
阅读次数:
190
一、创建Series # 参数# - Series (Series)是能够保存任何类型的数据(整数,字符串,浮点数,Python对象等)的一维标记数组。轴标签统称为索引。 - data 参数 - index 索引 索引值必须是唯一的和散列的,与数据的长度相同。 默认np.arange(n)如果没有索 ...
分类:
其他好文 时间:
2020-05-09 21:22:33
阅读次数:
60
为什么要学习pandas 数据处理基本就是使用pandas, pandas就是numpy++ pandas是一个强大的数据分析工具集 pandas的常用数据类型 (1) Series (2) Dataframe Series Series创建 通过序列来创建Series对象 通过字典来创建Serie ...
分类:
其他好文 时间:
2020-05-09 01:10:51
阅读次数:
58
Pandas详解 Pandas是一个强大的分析结构化数据的工具集;它的使用基础是Numpy(提供高性能的矩阵运算);用于数据挖掘和数据分析,同时也提供数据清洗功能。 1、安装包 pip install pandas 2、数据结构 Pandas有三大数据结构,Series、DataFrame以及Pan ...
分类:
其他好文 时间:
2020-05-09 00:32:44
阅读次数:
78