Mapreduce+Hive+Spark+Scala平台搭建 说明 平台搭建成功后,使用Java语言进行算法设计和应用的开发。文末有使用java设计的逻辑回归(Logistics Regression)做小数据集的二分类问题。 一、搭建准备 VMWare Workstation Ubuntu 14. ...
分类:
其他好文 时间:
2018-06-21 15:34:02
阅读次数:
307
把上次建模校赛一个根据三围将女性分为四类(苹果型、梨形、报纸型、沙漏)的问题用逻辑回归实现了,包括从excel读取数据等一系列操作。 Excel的格式如下:假设有r列,则前r-1列为数据,最后一列为类别,类别需要从1开始,1~k类, 如上表所示,前10列是身高、胸围、臀围等数据(以及胸围和腰围、胸围 ...
分类:
其他好文 时间:
2018-06-16 11:55:01
阅读次数:
185
线性回归($linear\ regression$),目标就是用一个(n-1)维的东西,来拟合一些在(n)维图形上的点,并且使得点集与拟合函数间的误差最小。如果自变量的个数只有一个,就称为一元线性回归;如果自变量的个数多于一个,就称为多元线性回归。比如,我们想得到房屋的价格与房间个数、大小、状况等多 ...
分类:
其他好文 时间:
2018-06-11 20:31:22
阅读次数:
177
https://blog.csdn.net/m0_37786651/article/details/61614865 从感知器谈起 对于典型的二分类问题,线性分类器的目的就是找一个超平面把正负两类分开。对于这个超平面,我们可以用下面的式子来表示, ωTx+b=0ωTx+b=0 感知器是最简单的一种线 ...
分类:
其他好文 时间:
2018-06-11 18:59:58
阅读次数:
509
Linear Regression with PyTorch Problem Description 初始化一组数据 $(x,y)$,使其满足这样的线性关系 $y = w x + b$ 。然后基于反向传播法,用均方误差(mean squared error)去拟合这组数据。 Notice 这一行代码 ...
分类:
其他好文 时间:
2018-06-11 00:35:03
阅读次数:
178
0. 本节的主题是:分析下Linear Regression中若干个有趣的问题,特别是有一个【从线性代数变换的角度证明机器学习可行性】的小插曲非常有意思,但一般人可能忽略了 1. 参考我自己的这篇博客:https://www.cnblogs.com/LS1314/p/9159372.html ...
分类:
其他好文 时间:
2018-06-09 14:42:41
阅读次数:
162
适用因变量一般有1和0(是否)两种取值,表示取值为1的概率. 采用随机逻辑回归剔除自变量(剔除false),逻辑回归的本质还是一种线型模型,被筛选掉的变量不一定就跟结果没关系,可能存在非线型相关. ...
分类:
其他好文 时间:
2018-06-07 15:33:05
阅读次数:
560
ridge regression: 在最小二乘的基础上添加一个系数为α的惩罚项,惩罚项为参数向量2范数的平方,可以通过控制α来调节数据集的过拟合问题 拟合方法,参数调用与线性回归相同 岭回归优点:可以应用于高度坏条件矩阵(目标值的轻微改变会造成参数的大方差,数据曲线波动加剧,容易导致过拟合问题,因此 ...
分类:
其他好文 时间:
2018-06-06 15:40:55
阅读次数:
395
一、一些基本概念 最优化:在给定约束之下如何寻求某些因素(的量),以使某一(或某些)指标达到最优。高中学过的线性规划就是一类典型的最优化问题。 凸集:在集合空间中,凸集就是一个向四周凸起的图形。用数学语句描述就是:集合边界任意两点连线上的所有点都在这个集合内部。 超平面:能够用于切割已给集合的点集。 ...
分类:
编程语言 时间:
2018-06-05 11:30:51
阅读次数:
201
Logistic回归虽然名字叫”回归” ,但却是一种分类学习方法。使用场景大概有两个:第一用来预测,第二寻找因变量的影响因素。逻辑回归(Logistic Regression, LR)又称为逻辑回归分析,是分类和预测算法中的一种。通过历史数据的表现对未来结果发生的概率进行预测。例如,我们可以将购买的 ...
分类:
编程语言 时间:
2018-05-30 22:50:22
阅读次数:
343