Numpy 和 Pandas 有什么不同 如果用 python 的列表和字典来作比较, 那么可以说 Numpy 是列表形式的,没有数值标签,而 Pandas 就是字典形式。Pandas是基于Numpy构建的,让Numpy为中心的应用变得更加简单。 要使用pandas,首先需要了解他主要两个数据结构: ...
分类:
其他好文 时间:
2020-02-21 19:49:31
阅读次数:
70
train_data = pd.read_csv(r"D:\data\cs-training.csv",index_col=0) # index_col指明y的索引是第?列 # 如果您有一个格式不正确的文件,文件末尾有分隔符在每一行中,您可以考虑“index_col=None”来强制pandas不使 ...
分类:
其他好文 时间:
2020-02-20 22:19:31
阅读次数:
93
[toc] 1.去重复:duplicated 输出结果: 2.替换:replace 输出结果: ...
分类:
编程语言 时间:
2020-02-20 22:07:32
阅读次数:
101
产生多个目录,每个目录下产生多个对话主题,写入到表格中 # -*- coding: utf-8 -*- # @Time : 2020/2/10 14:18 # @File : write_excel2.py # @Author: Hero Liu import pandas as pd def li ...
分类:
其他好文 时间:
2020-02-20 15:12:41
阅读次数:
50
[TOC] 下面继续讲解pandas的第二个工具DataFrame。 二:pandas数据结构介绍 2.DataFarme DataFarme表示的是矩阵的数据表,包含已排序的列集合,是一个二维数据工具。每一列可以是不同的数据类型值。它既有行索引又有列索引,可以看作是一组共享相同索引的Series对 ...
分类:
编程语言 时间:
2020-02-20 13:00:58
阅读次数:
61
项目目的:利用车贷金融数据建立评分卡,并尝试多次迭代观察不同行为对模型,以及建模中间过程产生哪些影响。 首先是标准化导入需要使用的工具 import pandas as pd import numpy as np import matplotlib.pyplot as plt plt.style.u ...
分类:
其他好文 时间:
2020-02-19 23:56:41
阅读次数:
148
[TOC] python是数据分析的主要工具,它包含的数据结构和数据处理工具的设计让python在数据分析领域变得十分快捷。它以NumPy为基础,并对于需要类似 for循环 的大量数据处理的问题有非常快捷的数组处理函数。 但是pandas最擅长的领域还是在处理表格型二维以上不同数据类型数据。 基本导 ...
分类:
编程语言 时间:
2020-02-19 23:40:50
阅读次数:
74
[toc] 1.Merge Pandas具有全功能的,高性能内存中连接操作,与关系型数据库中的连接操作类似。 语法: 1.1 简单关联:left_on与right_on 下面是Merge的一些实战案例: (1)创建测试数组 (2)使用Merge,找出每个学生对应的班级名字 输出结果: 1.2 使用h ...
分类:
编程语言 时间:
2020-02-19 19:18:27
阅读次数:
99
Pandas简介 pandas是用于对数据进行分析,其需要依赖numpy模块,所以需要首先安装numpy 安装:pip install pandas 导入:import pandas as pd 主要功能: 1、具备对其功能的数据结构DataFrame、Series(即两种对象,其实有更多) 2、集 ...
分类:
其他好文 时间:
2020-02-19 17:28:25
阅读次数:
60
concordance/k?n'k??d(?)ns/一致```py'''读取数据,预处理3600=3200 400'''import pandas as pdimport numpy as npimport matplotlib.pyplot as plttrain_data=pd.read_csv... ...
分类:
其他好文 时间:
2020-02-19 17:01:01
阅读次数:
79