目录 读取数据 条目2 条目3 条目4 条目5 条目6 条目7 条目8 条目9 读取数据 a.csv 返回目录 条目2 引例 现有训练集如下,请训练一个决策树模型,对未来的西瓜的优劣做预测。 返回目录 条目3 引例 现有训练集如下,请训练一个决策树模型,对未来的西瓜的优劣做预测。 返回目录 条目4 ...
分类:
其他好文 时间:
2017-12-30 18:09:01
阅读次数:
172
# -*- coding: utf-8 -*-from sklearn.cluster import KMeansfrom sklearn.externals import joblibimport numpyimport pandas as pddef kmeans(inputfile,n): f ...
分类:
其他好文 时间:
2017-12-29 12:22:12
阅读次数:
150
Pandas基础篇 Pandas基于Numpy开发,提供了很多高级的数据处理功能。 1、Pandas中的数据对象 Series和DataFrame是Pandas中最常用的两个对象。 1.1 Series对象 是Pandas中最基本的对象,可用Numpy的数组处理函数直接对Series对象进行处理。支 ...
分类:
其他好文 时间:
2017-12-27 21:34:41
阅读次数:
909
Pandas 数据结构 first: import numpy as np import pandas as pd Series 1.支持任意类型的一维标签数据,分为数据部分和轴标签部分(索引) 2.可以从list,dict,ndarray,scalar value等数据类型来创建 3.Series ...
分类:
其他好文 时间:
2017-12-27 18:49:34
阅读次数:
215
问题: ubuntu16.04 Anaconda 安装成功 Eclispe 写Python代码 无法使用 (pandas库等) 原因: Eclispe 此时的python解释器==>用的并不是Anaconda 解决办法: eclipse 使用Anaconda python 解释器 (就是使eclip ...
分类:
编程语言 时间:
2017-12-27 17:57:16
阅读次数:
353
在pandas.dataframe转换时,会使用默认的6位小数,导致数据经常精度不够。 df.round()不起作用。所以只能用暴力的设置全局 pd.set_option('precision', 8) 可以解决转换时候的精度丢失 ...
分类:
其他好文 时间:
2017-12-26 14:45:12
阅读次数:
522
删除pandas DataFrame的某一/几列: 方法一:直接del DF['column-name'] 方法二:采用drop方法,有下面三种等价的表达式: 1. DF= DF.drop('column_name', 1); 2. DF.drop('column_name',axis=1, inp ...
分类:
编程语言 时间:
2017-12-26 11:58:08
阅读次数:
2388
python课程笔记 【I】应用领域 (1)云计算:OpenStack (2)web开发:豆瓣、Django (3)科学运算、人工智能:pandas (4)系统运维 (5)金融 (6)图形GUI 【II】特征 (1)编译型语言:C、C++ 需编译,运行速度较快 (2)解释型语言:python 平台兼 ...
分类:
编程语言 时间:
2017-12-26 00:52:37
阅读次数:
176
参考书籍:《利用Python进行数据分析》 DataFrame简介: DataFrame是一个表格型的数据结构,它含有一组有序的列,每列可以是不同的值类型(数值、字符串、布尔值等)。DataFrame既有行索引也有列索引,它可以被看做由Series组成的字典(共用同一个索引)。跟其他类似的数据结构相 ...
分类:
其他好文 时间:
2017-12-25 19:25:47
阅读次数:
422