1.数据收集 BeautifulSoup、scrapy、selenium、requests 2.数据分析 pandas、numpy、pyDD、spacy 3.数据可视化 matplotlib、seaborn、bokeh 4.建模 scikit-learn、tensorflow、pytorch 5.模 ...
分类:
编程语言 时间:
2019-10-08 23:54:02
阅读次数:
133
利用UCI大学公开的机器学习数据来跑线性回归,数据集是一个循环发电场的数据,共有9568个样本数据,每个数据有5列,分别是:AT(温度), V(压力), AP(湿度), RH(压强), PE(输出电力)。我们的目标是得到一个线性关系,其中AT/V/AP/RH这4个是样本特征,PE是样本输出, 也就是 ...
分类:
其他好文 时间:
2019-10-03 22:05:17
阅读次数:
104
决策树算法 决策树算法主要有ID3, C4.5, CART这三种。(在西瓜书中有详细介绍) $scikit learn$提供的$DecisionTreeClassifier$类可以做多分类任务。 和其他分类器一样,$DecisionTreeClassifier$需要两个数组作为输入: X: 训练数据 ...
分类:
编程语言 时间:
2019-09-27 22:43:33
阅读次数:
293
前言sklearn想必不用我多介绍了,一句话,她是机器学习领域中最知名的python模块之一,若想要在机器学习领域有一番建树,必绕不开sklearn sklearn的官网链接http://scikit-learn.org/stable/index.html# 首先,放上一张官网上的sklearn的结 ...
分类:
其他好文 时间:
2019-09-27 16:30:26
阅读次数:
147
文档地址:https://scikit-learn.org/stable/modules/generated/sklearn.model_selection.train_test_split.html#sklearn.model_selection.train_test_split ...
分类:
其他好文 时间:
2019-09-22 11:11:40
阅读次数:
111
0.1准备工作 安装好CentOS7,配置好网络,确保网络畅通。 0.2root授权 首先:当前用户为kaid 0.3安装git 0.4 安装vimplus 注: 现在vimplus支持ubuntu14.04之后的所有ubuntu 64位系列以及centos7 64位,运行install.sh脚本, ...
分类:
编程语言 时间:
2019-09-21 16:54:54
阅读次数:
82
1、PCA分类介绍 在scikit-learn中,与PCA相关的类都在sklearn.decomposition包中。最常用的PCA类就是sklearn.decomposition.PCA。 原理:线性映射(或线性变换),简单的来说就是将高维空间数据投影到低维空间上,那么在数据分析上,我们是将数据的 ...
分类:
其他好文 时间:
2019-09-14 22:24:57
阅读次数:
119
scikit learn中的逻辑回归 构造数据集 import numpy import matplotlib.pyplot as plt numpy.random.seed(666) X = numpy.random.normal(0,1,size=(200,2)) 决策边界为二次函数 y = n ...
分类:
其他好文 时间:
2019-09-10 23:51:38
阅读次数:
110
第9章 运行TensorFlow [TOC] 参考书 《机器学习实战——基于Scikit Learn和TensorFlow》 工具 python3.5.1,Jupyter Notebook, Pycharm 创建一个计算图并在会话中执行 其中x.initializer.run()等价于tf.get_ ...
分类:
其他好文 时间:
2019-09-03 09:38:08
阅读次数:
92
版权所有,转帖注明出处 章节SciKit Learn 加载数据集 SciKit Learn 数据集基本信息 SciKit Learn 使用matplotlib可视化数据 SciKit Learn 可视化数据:主成分分析(PCA) SciKit Learn 预处理数据 SciKit Learn K均值 ...
分类:
其他好文 时间:
2019-09-02 09:49:01
阅读次数:
185