PCA(Principal Component Analysis)是一种常用的数据分析方法。PCA通过线性变换将原始数据变换为一组各维度线性无关的表示,可用于提取数据的主要特征分量,常用于高维数据的降维。网上关于PCA的文章有很多,但是大多数只描述了PCA的分析过程,而没有讲述其中的原理。这篇文章的目的是介绍PCA的基本数学原理,帮助读者了解PCA的工作机制是什么。
当然我并不打算把文章写成...
分类:
其他好文 时间:
2016-04-22 19:50:00
阅读次数:
241
形式:
采用sigmoid函数:g(z)=11+e?zg(z)=\frac{1}{1+e^{-z}}
其导数为g′(z)=(1?g(z))g(z)g^\prime(z)=(1-g(z))g(z)
假设:
即:
若有m个样本,则似然函数形式是:
对数形式:
采用梯度上升法求其最大值
求导:
更新规则为:
可以发现,则个规则形式上和LMS更新规则是一样...
分类:
编程语言 时间:
2016-04-22 19:32:34
阅读次数:
314
在讨论逻辑回归问题(Logistic Regression)之前,我们先讨论一些实际生活中的情况:判断一封电子邮件是否是垃圾邮件?判断一次交易是否是欺诈交易?判断一份文件是否是有效文件?这类问题,我们称之为分类问题(Classication Problem)。在分类问题中,我们往往尝试去预测的结果是否属于某一个类(正确活错误)。
我们从二元的分类问题开始讨论,即问题是正确或错误的。
我们将因变...
分类:
其他好文 时间:
2016-04-22 19:27:45
阅读次数:
118
逻辑回归是一个形式是Y=1/(1+E(-X))的函数,它的特点是: 1, 当X>0,随着X增大,Y很快的接近1; 2,当x<0,随着X的减小,Y很快的接近0; 3,当X=0时,Y=1/2。 由于逻辑回归的这种特性(在0-1之间连续),它被用来判断一个学习算法是否正确。 除了正确和不正确的结果之外,使... ...
分类:
其他好文 时间:
2016-04-21 01:28:32
阅读次数:
166
(一)生成学习算法 在线性回归和Logistic回归这种类型的学习算法中我们探讨的模型都是p(y|x;θ),即给定x的情况探讨y的条件概率分布。如二分类问题,不管是感知器算法还是逻辑回归算法,都是在解空间中寻找一条直线从而把两种类别的样例分开,对于新的样例,只要判断在直线的哪一侧即可;这种直接对问题 ...
分类:
编程语言 时间:
2016-04-21 01:15:01
阅读次数:
538
(一)局部加权回归 通常情况下的线性拟合不能很好地预测所有的值,因为它容易导致欠拟合(under fitting)。如下图的左图。而多项式拟合能拟合所有数据,但是在预测新样本的时候又会变得很糟糕,因为它导致数据的 过拟合(overfitting),不符合数据真实的模型。如下图的右图。 下面来讲一种非 ...
分类:
编程语言 时间:
2016-04-21 01:09:40
阅读次数:
369
逻辑回归(logistic-regression)之梯度下降法详解
逻辑回归常用于预测疾病发生的概率,例如因变量是是否恶性肿瘤,自变量是肿瘤的大小、位置、硬度、患者性别、年龄、职业等等(很多文章里举了这个例子,但现代医学发达,可以通过病理检查,即获取标本放到显微镜下观察是否恶变来判断);广告界中也常用于预测点击率或者转化率(cvr/ctr),例如因变量是是否点击,自变量是物料的长、宽、广告的位置...
分类:
其他好文 时间:
2016-04-19 19:58:03
阅读次数:
1139
机器学习总结之逻辑回归Logistic Regression 逻辑回归logistic regression,虽然名字是回归,但是实际上它是处理分类问题的算法。简单的说回归问题和分类问题如下: 回归问题:预测一个连续的输出。 分类问题:离散输出,比如二分类问题输出0或1. 逻辑回归常用于垃圾邮件分类... ...
分类:
其他好文 时间:
2016-04-14 17:31:14
阅读次数:
513
本文主要记录我在学习逻辑回归时的心得笔记,从假设函数、代价函数、优化方法等方面介绍了逻辑回归。...
分类:
其他好文 时间:
2016-04-10 14:52:08
阅读次数:
214