从这里找的一个宝贝源码,可以大大缓解内存问题。https://www.kaggle.com/arjanso/reducing dataframe memory size by 65/code ...
分类:
其他好文 时间:
2020-03-06 23:40:50
阅读次数:
117
pandas过滤文件重复行 import pandas as pd import os import argparse import random import string # 增加参数 parser = argparse.ArgumentParser( description="过滤文件重复行, ...
分类:
其他好文 时间:
2020-03-06 10:44:39
阅读次数:
85
主要是记录一个采坑的过程. 当 字符串 的 " " 和 pandas 中的 " " 不是一个概念 . 需求 一个小伙伴要用 pandas 来处理一个, 表格填充的的问题, 脱敏 数据大致是这样的. | 区域名称 | 门店 | 店组 | | | | | | 龙华新城大区 | 壹城中心店 | 壹城中心一 ...
分类:
其他好文 时间:
2020-03-06 01:02:50
阅读次数:
49
最近发现excel数据量极大,并且通过简单的数据操作不能提取到我需要的数据,如果单独操作,数据量太大耗时太长。想着通过简单的方式,并且快速提取数据,就想到了Python。python操作Excel使用的openyxl和pandas对Excel进行操作。代码如下:#!/usr/bin/envpython#-*-coding:utf-8-*-#@Time:2020-02-24下午03:43#@Auth
分类:
编程语言 时间:
2020-03-05 11:53:36
阅读次数:
90
pandas的索引操作可以快速的完成多种功能。 import pandas as pd import numpy as np 1. 首先pandas创建DataFrame df_1 = pd.DataFrame([['Jack','M',40],['Tony','M',20],['Mary','F' ...
分类:
其他好文 时间:
2020-03-04 21:18:51
阅读次数:
71
pyinstaller打包一个exe动辄几十M几百M (特别是import pandas以后) 知乎上居然没有人po这方面的”知识“ 查了很多关于reduce pyinstaller打包出exe大小的方法 列举如下 玄学解法1 去除不必要的库 当我们用cmd/powershell 输入这一段神秘代码 ...
分类:
编程语言 时间:
2020-03-04 14:59:11
阅读次数:
349
参考 https://blog.csdn.net/weixin_44663675/article/details/101030800 ...
分类:
其他好文 时间:
2020-03-04 14:42:21
阅读次数:
64
人生苦短,我用 Python 前文传送门: "小白学 Python 数据分析(1):数据分析基础" "小白学 Python 数据分析(2):Pandas (一)概述" "小白学 Python 数据分析(3):Pandas (二)数据结构 Series" "小白学 Python 数据分析(4):Pan ...
分类:
编程语言 时间:
2020-03-04 10:02:24
阅读次数:
84
最简单的机器学习流程 1读取数据 import pandas as pd data = pd.read_csv 2切分数据与标签 datax = data.iloc[] datay = data.iloc[] 3划分数据集 from sklearn.model_selection import tr ...
分类:
其他好文 时间:
2020-03-03 14:30:31
阅读次数:
97
人生苦短,我用 Python 前文传送门: "小白学 Python 数据分析(1):数据分析基础" "小白学 Python 数据分析(2):Pandas (一)概述" "小白学 Python 数据分析(3):Pandas (二)数据结构 Series" "小白学 Python 数据分析(4):Pan ...
分类:
编程语言 时间:
2020-03-03 10:58:19
阅读次数:
60