1、导入:import pandas as pd 2、Series 函数,默认标签0-(n-1) In [3]: a=pd.Series([1,2,3,4]) In [4]: a Out[4]: 0 1 1 2 2 3 3 4 dtype: int64 获取值与标签: In [5]: a.value ...
分类:
其他好文 时间:
2020-02-18 15:07:38
阅读次数:
64
数据规整:聚合、合并和重塑 《利用pandas进行数据分析-e2》 数据可能分散在许多文件或数据库中,存储的形式也不利于分析。 本章关注可以聚合、合并、重塑数据的方法。 首先,我会介绍pandas的层次化索引,它广泛用于以上操作。 然后,我深入介绍了 一些特殊的数据操作。 最后,实战应用:在第14章 ...
分类:
其他好文 时间:
2020-02-18 12:46:21
阅读次数:
80
平行坐标是可视化高维几何和分析多元数据的常用方法。 为了在n维空间中显示一组点,绘制由n条平行线组成的背景,通常是垂直且等距的。所述的点N 维空间被表示为折线与顶点在平行的轴线; 第i 轴上顶点的位置对应于该点的第i个坐标。 此可视化与时间序列可视化密切相关,除了它应用于轴与时间点不对应的数据,因此 ...
分类:
编程语言 时间:
2020-02-17 18:06:55
阅读次数:
179
在家为国家做贡献太无聊,不如跟我一起学点 Python 人生苦短,我用 Python 前文传送门: "小白学 Python 数据分析(1):数据分析基础" "小白学 Python 数据分析(2):Pandas (一)概述" "小白学 Python 数据分析(3):Pandas (二)数据结构 Ser ...
分类:
编程语言 时间:
2020-02-17 16:02:42
阅读次数:
64
import pandas as pd from dateutil.parser import parse #测试数据 test_dict = {0: {'startTime': 20190825131028, 'value': 1097}, 1: {'startTime': 20190825132 ...
分类:
其他好文 时间:
2020-02-17 10:39:33
阅读次数:
97
import pandas as pd import os #文件路径注意用\\ inputfilepath = 'C:\\Users\\Administrator\\AAA\\BBB\\' outputfilepath = 'C:\\Users\\Administrator\\AAA\\' df_ ...
分类:
其他好文 时间:
2020-02-16 12:52:35
阅读次数:
94
输入 输入1:包含200部电影的数据集,集合中包含两列,一列为电影的id,一列为电影的流派集合,如下图所示: 输入2:一个用户的电影兴趣记录,like字段为1表示喜欢,0表示不喜欢,如下图所示: 输出 输出1:输入1的One-Hot编码形式,类似下图所示: 输出2:根据输入2和输出1,从电影数据集中 ...
分类:
编程语言 时间:
2020-02-16 01:06:35
阅读次数:
99
在日常的数据分析中,经常需要将数据根据某个(多个)字段划分为不同的群体(group)进行分析,如电商领域将全国的总销售额根据省份进行划分,分析各省销售额的变化情况,社交领域将用户根据画像(性别、年龄)进行细分,研究用户的使用情况和偏好等。在 Pandas 中,上述的数据处理操作主要运用 groupb ...
分类:
其他好文 时间:
2020-02-14 16:27:11
阅读次数:
122
转自:https://blog.csdn.net/qq_42711381/article/details/90451301 由于刚好也遇到这个问题,记录下来 使用的DataFrame的 当使用 frame2['year']['two'] = 10000, 即df名[列名][行名]的方式去赋值就会报错... ...
分类:
其他好文 时间:
2020-02-14 12:31:36
阅读次数:
75
生成一个 DataFrame import pandas as pd name = ['Cindy','John','Matt'] point = [78,87,88] df_grade = pd.DataFrame(name, columns=['name']) df_grade = pd.con ...
分类:
编程语言 时间:
2020-02-13 21:09:47
阅读次数:
90