虽然名字里带回归,但实际上是一种分类方法,主要用于两分类问题,即只有两种分类 优点:计算代价不高,易于理解和实现 缺点:容易欠拟合,分类精度可能不高 原理 线性回归函数 $\small z = f(X) = XW$ 其中 X 是特征值 W 是回归系数 X 和 W 都是向量,可展开为 $\small ...
分类:
其他好文 时间:
2020-02-19 00:49:46
阅读次数:
89
ROC曲线 ROC曲线是二元分类器中常用的工具,它的全称是 Receiver Operating Characteristic,接收者操作特征曲线。它与precision/recall 曲线特别相似,但是它画出的是true positive rate(recall的另一种叫法)对应false pos ...
分类:
其他好文 时间:
2020-02-18 20:11:29
阅读次数:
280
1.线性回归不适用于分类问题。 原因:1.单个样本对于线性回归可能会造成很大的影响。 2.函数的输出值可能非常大,非常离谱。 2.逻辑回归(logistic regression):一种分类算法。是广义线性回归,$h(x)=g(\theta^{T}x)$,其中 $g(x)=\frac{1}{1+e^ ...
分类:
其他好文 时间:
2020-02-16 20:58:28
阅读次数:
86
分类问题 在机器学习中,主要有两大类问题,分别是分类和回归。下面我们先主讲分类问题。 MINST 这里我们会用MINST数据集,也就是众所周知的手写数字集,机器学习中的 Hello World。sk-learn 提供了用于直接下载此数据集的方法: from sklearn.datasets impo ...
分类:
其他好文 时间:
2020-02-16 14:49:56
阅读次数:
91
输入 鸢尾花卉数据集,数据集包含150个数据样本,分为3类,每类50个数据,每个数据包含4个属性。 输出 根据手动实现的逻辑回归模型对鸢尾花卉数据集分类的预测结果。 原理 逻辑回归处理的是分类问题,线性回归处理的是回归问题,这是两者最本质的区别。逻辑回归算法是一种分类算法,适用于标签取值离散的情况。 ...
分类:
编程语言 时间:
2020-02-16 00:57:31
阅读次数:
91
softmax和分类模型 softmax的基本概念 分类问题 一个简单的图像分类问题,输入图像的高和宽均为2像素,色彩为灰度。 图像中的4像素分别记为 $x_1, x_2, x_3, x_4$ 假设真实标签为狗、猫或者鸡,这些标签对应的离散值为 $y_1, y_2, y_3$ 。 我们通常使用离散的 ...
分类:
其他好文 时间:
2020-02-14 22:32:45
阅读次数:
79
理论部分: softmax的基本概念 分类问题一个简单的图像分类问题,输入图像的高和宽均为2像素,色彩为灰度。图像中的4像素分别记为x1,x2,x3,x4。假设真实标签为狗、猫或者鸡,这些标签对应的离散值为y1,y2,y3。我们通常使用离散的数值来表示类别,例如y1=1,y2=2,y3=3。 权重矢 ...
分类:
其他好文 时间:
2020-02-14 20:30:48
阅读次数:
62
逻辑回归可以用于处理二元分类问题,将输出值控制在[0,1]区间内,为确保输出值时钟若在0到1之间,采用sigmoid函数,其具有该特性,将线性回归训练得到的模型输出数据作z = x1*w1+x2*w2+...+xn*wn+b代入得到y,保证了y在0~1之间 逻辑回归中用到sigmoid函数,若用均方 ...
分类:
其他好文 时间:
2020-02-10 18:28:05
阅读次数:
343
数字识别是计算机从纸质文档、照片或其他来源接收、理解并识别可读的数字的能力,目前比较受关注的是手写数字识别。手写数字识别是一个典型的图像分类问题,已经被广泛应用于汇款单号识别、手写邮政编码识别,大大缩短了业务处理时间,提升了工作效率和质量。 手写数字识别是每个深度学习者的必经之路,正如学习编程时,我 ...
分类:
其他好文 时间:
2020-02-08 15:22:13
阅读次数:
58
1.无监督学习 无监督学习和监督学习是机器学习的两个方向,监督学习主要适用于已经标注好的数据集(如mnist分类问题),无监督学习则是希望计算机完成复杂的标注任务,简单的解释就是——教机器自己学习,它常见的应用场景有:从庞大的样本集合中选出一些具有代表性的加以标注用于分类器的训练、将所有样本自动分为 ...
分类:
Web程序 时间:
2020-02-06 23:21:48
阅读次数:
151