# coding:utf-8 import pandas as pd import numpy as np from matplotlib import pylab as plt # 导入数据可视化库Matplotlib并重命名为plt plt.rcParams['font.sans-serif'] ...
分类:
编程语言 时间:
2020-01-12 20:06:50
阅读次数:
136
6. 数据加载、存储和文件格式 输出输出通常包括几个大类: 读取文本文件和其他更高效的磁盘存储格式; 加载数据库中的数据; 利用Web API 操作网络资源。 这里着重介绍pandas的输入输出对象。 6.1 读取文本格式的数据 pandas 提供了一些用于将表格数据读取为DataFrame 对象的 ...
分类:
其他好文 时间:
2020-01-12 18:07:15
阅读次数:
92
本文对应脚本及数据已上传至我的 仓库 "https://github.com/CNFeffery/DataScienceStudyNotes" 1 简介 在数据分析任务中,从原始数据读入,到最后分析结果出炉,中间绝大部分时间都是在对数据进行一步又一步的加工规整,以流水线(pipeline)的方式完成 ...
分类:
其他好文 时间:
2020-01-12 17:59:41
阅读次数:
79
官网地址:https://openpyxl.readthedocs.io/en/stable/charts/line.html#id1 openpyxl+pandas # coding=utf-8 import pandas as pd import time from openpyxl impor ...
分类:
其他好文 时间:
2020-01-12 17:55:19
阅读次数:
372
# 目标
统计三国演义中出现次数前100,并绘制云图
# 准备
分析工具:jieba,pandas,matplotlib,wordcloud
数据文档:三国演义.txt(原著),三国人物.txt(三国人名,大约1000多个),三国字.txt(一些常见人名及字,约800)
这些文档,放到了后面
## ... ...
分类:
其他好文 时间:
2020-01-12 13:24:11
阅读次数:
95
pandas 入门: pandas 含有使数据分析工作变得更快更简单的高级数据结构和操作工具。pandas 是基于Numpy 构建的。 导入pandas包: from pandas import Series , DataFrame import pandas as pd pandas 的数据结构介 ...
分类:
其他好文 时间:
2020-01-12 11:35:59
阅读次数:
78
1、问题描述: 在使用pandas的read_csv的时候,报错,如下,UnicodeDecodeError: 'utf-8' codec can't decode byte 0xd0 in position 254: unexpected end of data。 经过分析,可能是utf-8不识别 ...
分类:
其他好文 时间:
2020-01-12 00:30:34
阅读次数:
319
代码: import sys, matplotlib, sklearn, IPython import numpy as np, pandas as pd, scipy as sp modules = {'NumPy': np, 'pandas': pd, 'scikit-learn': sklea ...
分类:
编程语言 时间:
2020-01-11 20:38:30
阅读次数:
137
matplotlib :绘图库 seaborn:基于matplotlib的图形可视化包 numpy:函数、矩阵运算库 pandas :基于numpy的结构化数据分析库 首先看一下cmd能不能使用pip(一般安装了python都自带安装pip的),不能就把pip的位置加入环境变量电脑的Path里面。 ...
分类:
编程语言 时间:
2020-01-11 15:19:47
阅读次数:
151
import numpy as npimport pandas as pd# # 目录# 生成数据# 查看数据# 选择# 缺失值# 运算-apply# 合并# 分组# 重塑-reshape# 数据透视表# 时间序列# 类别-Category# csv数据输入/输出# s = pd.Series([1 ...
分类:
编程语言 时间:
2020-01-11 00:10:06
阅读次数:
99