码迷,mamicode.com
首页 >  
搜索关键字:pandas    ( 1200个结果
Scrapy:虎牙爬取,图片存储与数据分析
第一次爬取虎牙主播数据,有点小激动 1.共批量爬取的101个主播的,包括 头像 主播名字 房间号 房间链接 2.数据规整部分,需要将json数据加载到pandas的Dataframe,只显示的前15个主播的信息 3.数据绘图部分,有一个字体问题没解决,中文乱码,明日修正 ...
分类:其他好文   时间:2018-10-15 00:00:04    阅读次数:15
Python数据分析-知识宝藏
1. python基础知识 2. 重点工具掌握:数据解析核心技巧 - Numpy| Pandas| Matplotlib 3. 数据特征分析:分布| 对比| 统计| 帕累托| 正态| 相关性分析 4. 数据处理:缺失值| 异常值| 数据归一| 数据连续属性离散化 5. 数学建模:监督学习(回归分析、 ...
分类:编程语言   时间:2018-10-14 20:57:36    阅读次数:6
Pandas之Dropna滤除缺失数据
一、处理Series对象 通过dropna()滤除缺失数据 结果如下: 通过布尔序列也能滤除: 结果如下: 二、处理DataFrame对象 处理DataFrame对象比较复杂,因为你可能需要丢弃所有的NaN或部分NaN 结果如下: 默认滤除所有包含NaN: 结果如下 传入how=’all’滤除全为N ...
分类:其他好文   时间:2018-10-14 00:16:31    阅读次数:11
pandas
Pandas是一款开放源码的BSD许可的Python库,为Python编程语言提供了高性能,易于使用的数据结构和数据分析工具。Pandas用于广泛的领域,包括金融,经济,统计,分析等学术和商业领域。 Pandas的官方网站是: http://pandas.pydata.org/ import num ...
分类:其他好文   时间:2018-10-13 02:33:32    阅读次数:8
pandas 绘图与滑窗
```python #import nessary library before start import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns import os ... ...
分类:其他好文   时间:2018-10-12 21:15:18    阅读次数:8
【逻辑回归的特征筛选方法】
数据特征如下 使用逻辑回归的稳定性选择 import pandas as pd import numpy as np import pyecharts import xlrd # with open(r'F:\数据分析专用\数据分析与机器学习\bankloan.xls', 'rb') as f: f ...
分类:其他好文   时间:2018-10-12 13:44:04    阅读次数:6
python_库学习_01
一。python的库学习之 财经数据接口包 1.安装ThShare 直接pip install tushare 可能会出现缺少依赖库的情况,依次安装,大概有lxml,pandas,bs4,requests,pandas依次安装后查看tushare官方文档详细接口的使用 import tushare ...
分类:编程语言   时间:2018-10-11 23:44:30    阅读次数:13
House price test one
import numpy as np import pandas as pd train_data = pd.read_csv("C:/Users/Liubotao/Desktop/House_price/input/train.csv", index_col=0) test_data = pd.r... ...
分类:其他好文   时间:2018-10-11 16:50:52    阅读次数:11
(4)pyspark中dataframe的清理操作
1、交叉表(crosstab): pandas中也有,常和pivot_table比较。 查看家庭ID与评分的交叉表: 2、处理缺失值:fillna withColumn:新增一列数据 cast : 用于将某种数据类型的表达式显式转换为另一种数据类型 将缺失值删除:dropna 3、处理重复值 查看有 ...
分类:其他好文   时间:2018-10-11 14:26:50    阅读次数:11
(3)pyspark中的dataframe的观察操作
1、读取: sparkDF = spark.read.csv(path) sparkDF = spark.read.text(path) 2、打印: sparkDF.show()【这是pandas中没有的】:打印内容 sparkDF.head():打印前面的内容 sparkDF.describe() ...
分类:其他好文   时间:2018-10-11 13:38:40    阅读次数:17
1200条   1 2 3 4 ... 120 下一页
© 2014 mamicode.com 版权所有 京ICP备13008772号-2
迷上了代码!