回归的一般方法:
(1)收集数据:采用任意方法收集数据
(2)准备数据:回归需要数值型数据,标称型数据将被转化成二值型数据
(3)分析数据:绘出数据的可视化二维图将有助于对数据做出理解和分析,在采用缩减法求得新回归系数之后,可以将新拟合线在图上作为对比
(4)训练算法:求得回归系数
(5)测试算法:使用R2或者预测值和数据的拟合度,来分析模型的效果
(6)使用算法:使用回归,可以在给定输入的时候预测出一个数值,这是对分类方法的提升,因为这样可以预测连续性数据而不仅仅是离散的类别标签
github...
分类:
其他好文 时间:
2016-05-18 19:35:49
阅读次数:
217
参考学习资料:http://cs229.stanford.edu/materials.html
通过对学习,掌握的知识点包括:
什么是 cost fuction Linear regression的概念Logistic regression的概念
============监督学习的引出==============
机器学习可以分为两个大类,一个是监督学习(superv...
分类:
其他好文 时间:
2016-05-18 19:35:21
阅读次数:
290
机器学习一Linear Regression(线性回归),采用的是python实现梯度下降方法,使用了L2正则化...
分类:
其他好文 时间:
2016-05-18 18:46:50
阅读次数:
198
本篇讲的是SVM与logistic regression的关系。 (一) SVM算法概论 首先我们从头梳理一下SVM(一般情况下,SVM指的是soft-margin SVM)这个算法。 这个算法要实现的最优化目标是什么?我们知道这个目标必然与error measurement有关。 那么,在SVM中 ...
分类:
其他好文 时间:
2016-05-18 16:09:12
阅读次数:
266
声明:本博客整理自博友@zhouyong计算广告与机器学习-技术共享平台,尊重原创,欢迎感兴趣的博友查看原文。 符号定义 声明:本博客整理自博友@zhouyong计算广告与机器学习-技术共享平台,尊重原创,欢迎感兴趣的博友查看原文。 符号定义 这里定义《深入浅出ML》系列中涉及到的公式符号,如无特殊 ...
分类:
系统相关 时间:
2016-05-15 12:20:34
阅读次数:
487
本文练习的是最简单的二元线性回归。题目本题给出的是5050个数据样本点,其中xx为这5050个小朋友到的年龄,年龄为22岁到88岁,年龄可有小数形式呈现。YY为这5050个小朋友对应的身高,当然也是小数形式表示的。现在的问题是要根据这5050个训练样本,估计出3.53.5岁和77岁时小孩子的身高。通过画出训练样本点的分布凭直觉可以发现这是一个典型的线性回归问题。matlab函数介绍legend:比如...
分类:
其他好文 时间:
2016-05-13 00:53:55
阅读次数:
372
文章主要讲了用logistic做分类的问题,以及实验检验分类效果...
分类:
其他好文 时间:
2016-05-12 18:55:26
阅读次数:
157
逻辑回归(Logistic regression)
逻辑回归是统计学习中的经典分类方法。其多用在二分类{0,1}问题上。
定义1:
设X是连续随机变量,X服从逻辑回归分布是指X具有下列分布函数与密度函数:
分布函数属于逻辑斯谛函数,其图形是一条S形曲线。
定义2:
二项逻辑斯谛回归模型是如下条件概率分布:
从上式可以看出,逻辑回归对线性回归经行了归一化...
分类:
编程语言 时间:
2016-05-12 15:23:00
阅读次数:
346
本文主要是来练习多变量线性回归问题(3个变量)。那个时候用梯度下降法求解时,给出的学习率是固定的0.70.7。而本次实验中学习率需要自己来选择,因此我们应该从小到大(比如从0.0010.001到1010)来选择,通过观察损失值与迭代次数之间的函数曲线来决定使用哪个学习速率。当有了学习速率α\alpha后,则本问问题求解方法和上面的没差别。本文要解决的问题是给出了4747个训练样本,训练样本的yy值为...
分类:
其他好文 时间:
2016-05-12 15:07:55
阅读次数:
167