机器学习分类 按照数据集是否有标记(label)来进行分类: 监督学习(supervised learning):训练数据中均有label,在模型训练的过程中,计算模型预测的结果与实际的label之间的差异,以此为目标对模型进行不断地优化,直至模型预测模型的准确率达到要求或者优化的次数达到设定的次数 ...
分类:
其他好文 时间:
2019-03-02 20:01:23
阅读次数:
219
在机器学习中,我们获取的数据往往存在一个问题,就是样本不均匀。比如你有一个样本集合,正例有9900个,负例100个,训练的结果往往是很差的,因为这个模型总趋近于是正例的。 就算全是正那么,也有99%的准确率,看起来挺不错的,但是我们要预测的负样本很可能一个都预测不出来。 这种情况,在机器学习中有三个 ...
分类:
其他好文 时间:
2019-02-27 19:02:51
阅读次数:
201
#MNIST数据集 # coding: utf-8 # In[2]: import tensorflow as tf from tensorflow.examples.tutorials.mnist import input_data # In[3]: #载入数据集 mnist = input_da... ...
分类:
其他好文 时间:
2019-02-25 20:18:21
阅读次数:
210
TP与TN都是分对了情况,TP是正类,TN是负类。则推断出,FP是把错的分成了对的,而FN则是把对的分成了错的。 【举例】一个班里有男女生,我们来进行分类,把女生看成正类,男生看成是负类。我们可以用混淆矩阵来描述TP、TN、FP、FN。 准确率:accuracy_score 所有的预测正确(正类负类 ...
分类:
其他好文 时间:
2019-02-23 19:29:11
阅读次数:
209
一般对于算法模型的评估量有很多,常用到的是精确率和真正率(召回率)以及ROC曲线和PR曲线,之前也有提到,今天查找了一些资料对着四个评估量进行一个小总结。 1、首先是对一些概念的理解 TP 真正 是指预测为正样本,实际也是正样本的特征数 FP 假正 是预测为为正样本,实际为负样本的特征数 TN 真负 ...
分类:
编程语言 时间:
2019-02-23 01:22:18
阅读次数:
173
分类问题的评价指标是准确率,那么回归算法的评价指标就是MSE,RMSE,MAE、R-Squared。下面一一介绍 1、MSE(Mean Squared Error)均方误差 这里的y是测试集上的。 用 真实值-预测值 然后平方之后求和平均。 猛着看一下这个公式是不是觉得眼熟,这不就是线性回归的损失函 ...
分类:
其他好文 时间:
2019-02-21 23:17:30
阅读次数:
1112
PMP考试4小时,200道题,100多页的试卷,还要涂答题卡……如果平时没有强加训练,时间还是非常紧张的!而且,PMP考试情景题居多,提干又巨长,心脏不好的人,一般都会吓着,我也曾见过考完试手不停哆嗦的人,太紧张导致。但是,只要掌握住方法,做题的速度和准确率会大大提升。在这里我个人强烈建议大家做题直接找关键词,不要纠结,很多题目,你越纠结,越搞不清选哪个,这也是为什么很多人答案一改就错的原因。以下
分类:
其他好文 时间:
2019-02-19 11:49:06
阅读次数:
193
机器学习中如何处理不平衡数据? 机器之心 百家号02-1713:06 机器之心 百家号02-1713:06 机器之心 百家号02-1713:06 选自TowardsDataScience 作者:Baptiste Rocca 参与:贾伟、路 准确率高达 96.2% 的模型跑在真实数据上却可能完全无法使 ...
分类:
其他好文 时间:
2019-02-18 23:18:50
阅读次数:
203
MNIST手写数据集的识别算得上是深度学习的”hello world“了,所以想要入门必须得掌握。新手入门可以考虑使用Keras框架达到快速实现的目的。 完整代码如下: 运行结果如下: 可以看出准确率达到了99%,说明神经网络在图像识别上具有巨大的优势。 ...
分类:
其他好文 时间:
2019-02-15 19:45:05
阅读次数:
186
前面我们用全量mnist数据集测试的准确率大概在75%左右,当然是没有经过改进之前的测试。 而我们用少量mnist数据集测试的准确率只有60%左右。两个的区别在于mnist训练数据集的大小,如果我们在全量数据集的基础上在增加新的图片会不会提高准确率呢。下面我们试下通过旋转已知图片的方法看准确率是否有 ...
分类:
其他好文 时间:
2019-02-11 12:23:39
阅读次数:
163