#导入boston房价数据集from sklearn.datasets import load_bostonimport pandas as pd boston = load_boston()df = pd.DataFrame(boston.data) #一元线性回归模型,建立一个变量与房价之间的预 ...
分类:
其他好文 时间:
2018-12-21 00:59:49
阅读次数:
190
一 简介 spark核心是RDD,官方文档地址:https://spark.apache.org/docs/latest/rdd-programming-guide.html#resilient-distributed-datasets-rdds官方描述如下:重点是可容错,可并行处理 Spark r ...
分类:
其他好文 时间:
2018-12-20 21:35:21
阅读次数:
159
接下来pandas介绍中将学习到如下8块内容:1、数据结构简介:DataFrame和Series2、数据索引index3、利用pandas查询数据4、利用pandas的DataFrames进行统计分析5、利用pandas实现SQL操作6、利用pandas进行缺失值的处理7、利用pandas实现Exc ...
分类:
编程语言 时间:
2018-12-20 14:36:50
阅读次数:
216
1. 导入boston房价数据集。 1 2 3 4 from sklearn.datasets import load_boston boston = load_boston() boston.keys() print(boston.data) 2. 一元线性回归模型,建立一个变量与房价之间的预测模 ...
分类:
其他好文 时间:
2018-12-17 22:02:12
阅读次数:
199
from sklearn.datasets import load_boston#导入数据集 boston=load_boston() #住宅平均房数与房价之间的关系 import matplotlib.pyplot as plt from sklearn.linear_model import L... ...
分类:
其他好文 时间:
2018-12-16 23:16:31
阅读次数:
178
原文地址:https://chrisalbon.com/python/data_wrangling/pandas_apply_operations_to_dataframes/ Applying Operations Over pandas Dataframes 20 Dec 2017 Import ...
分类:
移动开发 时间:
2018-12-16 11:06:40
阅读次数:
166
·统计样本周边的密度,把密度给定一个阈值,不断的把样本添加到最近的簇。例如:人口密度,根据密度,聚类出城市 ·解决类似圆形的K-Means聚类的特点;密度聚类缺点:计算复杂度大,空间索引来降低计算时间,降低查找速度。 (DBSCAN算法): 参数:DBSCAN(eps=0.5, min_sample ...
分类:
其他好文 时间:
2018-12-12 19:05:03
阅读次数:
426
过拟合和欠拟合 过拟合:在训练集上的准确率较高,而在测试集上的准确率较低 欠拟合:在训练集和测试集上的准确率均较低 1)概念概述 学习曲线就是通过画出不同训练集大小时训练集和交叉验证的准确率,可以看到模型在新数据上的表现,进而来判断模型是否方差偏高或偏差过高,以及增大训练集是否可以减小过拟合。 先明 ...
分类:
其他好文 时间:
2018-12-10 14:22:23
阅读次数:
320
from sklearn.datasets import load_boston boston = load_boston() boston.keys() dict_keys(['data', 'target', 'feature_names', 'DESCR']) print(boston.DES... ...
分类:
其他好文 时间:
2018-12-10 14:06:41
阅读次数:
183
from sklearn.datasets import load_boston boston = load_boston() print(boston.keys()) data = boston.data x = data[:,5] y = boston.target import matplot... ...
分类:
其他好文 时间:
2018-12-10 11:49:25
阅读次数:
217