Scikit-learn Scikit-learn是Python中开发和实践机器学习的类库之一,依赖于Scipy及其相关类库来运行。 Scikit-learn的基本功能主要分为六大类:分类,回归,聚类,数据降维,模型选择,数据处理。需要指出的是,由于Scikit-learn本身不支持深度学习,也不支 ...
分类:
系统相关 时间:
2020-02-01 13:00:26
阅读次数:
84
机器学习的算法分为两大类:监督学习和无监督学习。 监督学习即在机器学习的过程中提供对错指示。一般是在数据组中包含最终结果(0,1),通过算法让机器减少误差。这一类学习主要应用于分类与预测(Regression & Classify)。监督学习从给定的训练数据集中学习出一个目标函数,当新的数据到来时, ...
分类:
系统相关 时间:
2020-02-01 12:42:08
阅读次数:
85
图书简介 实用性是本书的第一个基本出发点,书中介绍了近年来在工业界被广泛应 用的机器学习算法,这些算法经受了时间的考验,不但效果好而且使用方便。此 外作者也十分注意理论的深度和完整性,组织各章节的内容时力求由浅入深、推 理完整、先后连贯、自成体系,先讲统计学、矩阵、优化方法这些基础知识,再 由简到繁 ...
分类:
编程语言 时间:
2020-02-01 12:34:19
阅读次数:
79
机器学习中的HelloWorld项目 这个项目是针对鸢尾花(Iris Flowers)进行分类的一个项目,数据集是含鸢尾花的三个亚属得分类信息,通过机器学习算法生成一个模型,自动分类新数据到这三个亚属的某一个中。项目中使用的鸢尾花数据集是一个非常容易理解的数据集,这个数据集具有以下特点: 所有的特征 ...
分类:
系统相关 时间:
2020-02-01 12:24:18
阅读次数:
86
1、梯度下降思想在数学中的梯度下降是:xk+1=xk+λkPkλk表示步长Pk表示方向,沿梯度方向下降最快沿着方向不断更新x,直到x达到最小为了得到最好的拟合线,我们的目标是让损失函数达到最小因此,引入梯度下降的思想:条件:有一个J(θ0,θ1)目标:让J(θ0,θ1)最小步骤:1、初始化θ0,θ12、持续改变θ0,θ1的值,让J(θ0,θ1)越来越小3、直到得到一个J(θ0,θ1)的最小值2、梯
分类:
编程语言 时间:
2020-02-01 00:35:31
阅读次数:
104
?fig, axes = plt.subplots(1, 3, figsize=(10, 3)) plt.subplots()用来构建一张图,其中参数1和3分别代表子图的行数和列数,一共有 1x3 个子图像。 figsize=(10,3)用来设置子图的宽度和高度。 函数返回一个figure图像和子图 ...
分类:
编程语言 时间:
2020-01-31 21:08:10
阅读次数:
57
现在无人不谈“大数据技术”和“人工智能技术”,而商业智能和机器学习等应用的具体开发中又大量使用Python程序设计语言,用Python语言来描述算法和讲述数据结构就成为顺其自然的事情了。 “数据结构”毫无疑问是计算机科学既经典又核心的课程之一,只要从事计算机相关的开发工作,系统地学习数据结构是进入这 ...
分类:
编程语言 时间:
2020-01-31 19:18:51
阅读次数:
312
[TOC] 资料 "Spark机器学习库(MLlib)中文指南" "关于spark机器学习的知乎专栏" "Spark入门实战系列 8.Spark MLlib(上) 机器学习及SparkMLlib简介" "基本Kmeans算法介绍及其实现" [spark MLlib 概念 1:相关系数( PPMCC ...
分类:
其他好文 时间:
2020-01-31 13:59:26
阅读次数:
104
一、牛顿方法: 基本思想是利用迭代点$x_k$处的一阶导数(梯度)和二阶导数(Hessen矩阵)对目标函数进行二次函数近似,然后把二次模型的极小点作为新的迭代点,并不断重复这一过程,直至求得满足精度的近似极小值。 对于f(x)=0,求解x; 初始化$\theta$ ,然后一直迭代:$\theta^{ ...
分类:
其他好文 时间:
2020-01-30 23:00:59
阅读次数:
88
导数 导数是一个数,函数y(x)在x0点的导数y'(x0)反应了在x0处y随x的变化快慢 微分 微分指函数值的微小变化 在x0可微:在x0点y和x的微分成线性关系(只与该点函数值有关) 导数可看做函数的微分与自变量的微分之商,故导数又称微商 偏导数 函数在一点处沿坐标轴的变化率 方向导数 函数在一点 ...
分类:
编程语言 时间:
2020-01-29 22:00:26
阅读次数:
96