Mapreduce+Hive+Spark+Scala平台搭建 说明 平台搭建成功后,使用Java语言进行算法设计和应用的开发。文末有使用java设计的逻辑回归(Logistics Regression)做小数据集的二分类问题。 一、搭建准备 VMWare Workstation Ubuntu 14. ...
分类:
其他好文 时间:
2018-06-21 15:34:02
阅读次数:
307
奥地利符号计算研究所(Research Institute for Symbolic Computation,简称RISC)的Christoph Koutschan博士在自己的页面上发布了一篇文章,提到他做了一个调查,参与者大多数是计算机科学家,他请这些科学家投票选出最重要的算法,以下是这次调查的结 ...
分类:
编程语言 时间:
2018-06-14 23:57:51
阅读次数:
308
线性回归($linear\ regression$),目标就是用一个(n-1)维的东西,来拟合一些在(n)维图形上的点,并且使得点集与拟合函数间的误差最小。如果自变量的个数只有一个,就称为一元线性回归;如果自变量的个数多于一个,就称为多元线性回归。比如,我们想得到房屋的价格与房间个数、大小、状况等多 ...
分类:
其他好文 时间:
2018-06-11 20:31:22
阅读次数:
177
来自:InfoQ(微信号: infoqchina) 链接:http://www.infoq.com/cn/news/2012/08/32-most-important-algorithms 奥地利符号计算研究所(Research Institute for Symbolic Computation, ...
分类:
编程语言 时间:
2018-06-11 02:05:17
阅读次数:
239
Linear Regression with PyTorch Problem Description 初始化一组数据 $(x,y)$,使其满足这样的线性关系 $y = w x + b$ 。然后基于反向传播法,用均方误差(mean squared error)去拟合这组数据。 Notice 这一行代码 ...
分类:
其他好文 时间:
2018-06-11 00:35:03
阅读次数:
178
0. 本节的主题是:分析下Linear Regression中若干个有趣的问题,特别是有一个【从线性代数变换的角度证明机器学习可行性】的小插曲非常有意思,但一般人可能忽略了 1. 参考我自己的这篇博客:https://www.cnblogs.com/LS1314/p/9159372.html ...
分类:
其他好文 时间:
2018-06-09 14:42:41
阅读次数:
162
ridge regression: 在最小二乘的基础上添加一个系数为α的惩罚项,惩罚项为参数向量2范数的平方,可以通过控制α来调节数据集的过拟合问题 拟合方法,参数调用与线性回归相同 岭回归优点:可以应用于高度坏条件矩阵(目标值的轻微改变会造成参数的大方差,数据曲线波动加剧,容易导致过拟合问题,因此 ...
分类:
其他好文 时间:
2018-06-06 15:40:55
阅读次数:
395
Logistic回归虽然名字叫”回归” ,但却是一种分类学习方法。使用场景大概有两个:第一用来预测,第二寻找因变量的影响因素。逻辑回归(Logistic Regression, LR)又称为逻辑回归分析,是分类和预测算法中的一种。通过历史数据的表现对未来结果发生的概率进行预测。例如,我们可以将购买的 ...
分类:
编程语言 时间:
2018-05-30 22:50:22
阅读次数:
343
Softmax Regression算法实践 有了上篇博客的理论知识,我们可以利用实现好的函数,来构建Softmax Regression分类器,在训练分类器的过程中,我们使用多分类数据作为训练数据:如图 1、利用训练数据对模型进行训练: 完整代码为: 1 # -*- coding: UTF-8 - ...
分类:
编程语言 时间:
2018-05-29 19:02:57
阅读次数:
308
1.1、Logistics Regression算法实践 有了上篇博客的理论准备后,接下来,我们用以及完成的函数,构建Logistics Regression分类器。我们利用线性可分的数据作为训练样本来训练。在构建模型的过程中,主要有两个步骤:(1)利用训练样本训练模型,(2)利用训练好的模型对新样 ...
分类:
编程语言 时间:
2018-05-28 15:03:09
阅读次数:
117