《机器学习及实践--从零开始通往Kaggle竞赛之路》 《机器学习及实践--从零开始通往Kaggle竞赛之路》 在开始说之前一个很重要的Tip:电脑至少要求是64位的,这是我的痛。 断断续续花了个把月的时间把这本书过了一遍。这是一本非常适合基于python入门的机器学习入门的书籍,全书通俗易懂且有代 ...
分类:
其他好文 时间:
2017-04-18 10:11:01
阅读次数:
450
1. 线性回归 在统计学中,线性回归(Linear Regression)是利用称为线性回归方程的最小平方函数对一个或多个自变量和因变量之间关系进行建模的一种回归分析。这种函数是一个或多个称为回归系数的模型参数的线性组合(自变量都是一次方)。只有一个自变量的情况称为简单回归,大于一个自变量情况的叫做 ...
分类:
其他好文 时间:
2017-04-14 00:13:58
阅读次数:
217
梯度下降法的作用是求到一种方案,使得拟合过程中的损失函数最小(结果可能只为局部最优值),除此之外还有最小二乘法等方法。 关于此方法详细的阐述参见:http://www.cnblogs.com/LeftNotEasy/archive/2010/12/05/mathmatic_in_machine_le ...
分类:
其他好文 时间:
2017-04-04 00:31:54
阅读次数:
153
决策树 决策树模型是一种树形结构,基于特征对实例进行分类或回归的过程。即根据某个特征把数据分划分到若干个子区域(子树),再对子区域递归划分,直到满足某个条件则停止划分并作为叶子节点,不满足条件则继续递归划分。 一个简单的决策树分类模型:红色框出的是特征。 决策树模型学习过程通常包3个步骤:特征选择、 ...
分类:
编程语言 时间:
2017-04-01 01:10:42
阅读次数:
256
Minitab软件是现代质量管理统计的领先者,全球六西格玛实施的共同语言,以无可比拟的强大功能和简易的可视化操作深受广大质量学者和统计专家的青睐。 MINITAB 功能菜单包括: 基础和高级统计工具: 假设检验 (参数检验和非参数检验) 回归分析(一元回归和多元回归、线性回归和非线性回归) 方差分析 ...
分类:
编程语言 时间:
2017-03-26 11:27:47
阅读次数:
350
一、正则化应用于基于梯度下降的线性回归 上一篇文章我们说过,通过正则化的思想,我们将代价函数附加了一个惩罚项,变成如下的公式: 那么我们将这一公式套用到线性回归的代价函数中去。我们说过,一般而言θ0我们不做处理,所以我们把梯度下降计算代价函数最优解的过程转化为如下两个公式。 我们通过j>0的式子,能... ...
分类:
其他好文 时间:
2017-03-17 00:12:37
阅读次数:
214
灵感 因为最近一直在做rnn based NLP,其中无论是什么cell,lstm, GRU或者cnn都是基于单词的embedding表示;单词的embdding就是把每个单词表示成一个向量, 然后通过bp训练这些向量的值,这种想法很奇妙,于是我尝试性的把这种思想用在logistic regress ...
分类:
其他好文 时间:
2017-03-16 18:36:09
阅读次数:
264
1、综述 scikit-learn的线性回归模型都是通过最小化成本函数来计算参数的,通过矩阵乘法和求逆运算来计算参数。当变量很多的时候计算量会非常大,因此我们改用梯度下降法,批量梯度下降法每次迭代都用所有样本,快速收敛但性能不高,随机梯度下降法每次用一个样本调整参数,逐渐逼近,效率高,本节我们来利用 ...
分类:
其他好文 时间:
2017-03-13 13:15:21
阅读次数:
401
一,机器学习是什么? "A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P, if its performance ...
分类:
其他好文 时间:
2017-03-11 19:39:23
阅读次数:
211
笔记︱范数正则化L0、L1、L2-岭回归&Lasso回归(稀疏与特征工程) 一、正则化背景 监督机器学习问题无非就是“minimizeyour error while regularizing your parameters”,也就是在规则化参数的同时最小化误差。最小化误差是为了让我们的模型拟合我们 ...
分类:
其他好文 时间:
2017-02-19 18:21:35
阅读次数:
403