神经网络中,我们通过最小化神经网络来训练网络,所以在训练时最后一层是损失函数层(LOSS), 在测试时我们通过准确率来评价该网络的优劣,因此最后一层是准确率层(ACCURACY)。 但是当我们真正要使用训练好的数据时,我们需要的是网络给我们输入结果,对于分类问题,我们需要获得分类结果,如下右图最后一 ...
分类:
其他好文 时间:
2016-07-04 17:02:14
阅读次数:
1259
前面的文章已经介绍过了2种经典的机器学习算法:线性回归和logistic回归,并且在后面的练习中也能够感觉到这2种方法在一些问题的求解中能够取得很好的效果。现在开始来看看另一种机器学习算法——神经网络。线性回归或者logistic回归问题理论上不是可以解决所有的回归和分类问题么,那么为什么还有其它各... ...
分类:
其他好文 时间:
2016-07-04 11:34:28
阅读次数:
108
分类问题损失函数的信息论解释 分类问题的优化过程是一个损失函数最小化的过程,对应的损失函数一般称为logloss,对于一个多分类问题,其在N个样本上的logloss损失函数具有以下形式: 其中,yi(n)代表第n个样本是否属于第i个类别,取值为0或1,f(x(n))i代表分类模型对于第n个样本属于第 ...
分类:
其他好文 时间:
2016-07-01 21:27:32
阅读次数:
466
1,统计词出现的次数
1/计算类别的先验概率
*输入格式:类别+文档id+文档词(切分成A,b,c)
*输出格式:类别+文档出现次数+文档出现的词的总数
2/计算每个词的条件概率
*输入格式:类别+文档id+文档词(切分成A,b,c)
*输出格式:类别+词+词的总数
3/假设二分类问题-计算概率值
* 1类别+文档出现次数+文档出现的词的总数
* 2类别+...
分类:
其他好文 时间:
2016-06-29 11:21:45
阅读次数:
195
C4.5是一系列用在机器学习和数据挖掘的分类问题中的算法。它的目标是监督学习:给定一个数据集,其中的每一个元组都能用一组属性值来描述,每一个元组属于一个互斥的类别中的某一类。C4.5的目标是通过学习,找到一个从属性值到类别的映射关系,并且这个映射能用于对新的类别未知的实体进行分类。 C4.5由J.R ...
分类:
编程语言 时间:
2016-06-23 15:52:13
阅读次数:
272
概念AdaBoost是一种级联算法模型,即把几个弱分类器级联到一起去处理同一个分类问题。也就是“三个臭皮匠顶一个诸葛亮”的道理。例如一个专家作出的判定往往没有几个专家一起作出的判定更准确。一种情况:如果每个专家都仅有一票的权利,采用投票机制的方法属于...
分类:
编程语言 时间:
2016-06-21 06:44:21
阅读次数:
294
http://www.cnblogs.com/lafengdatascientist/p/5567038.html 逻辑回归模型预测股票涨跌 逻辑回归是一个分类器,其基本思想可以概括为:对于一个二分类(0~1)问题,若P(Y=1/X)>0.5则归为1类,若P(Y=1/X)<0.5,则归为0类。 一、 ...
分类:
其他好文 时间:
2016-06-18 06:47:22
阅读次数:
403
1.数值特征与非数值特征
学习分类这么久,不知道大家有没有注意一个问题,那就是我们的输入样本数据都是基于数值计算的,因此在近邻法中才可以计算距离这一说,这种可以用数值来描述的对象特征,我们称之为数值特征,但是在我们生活中所涉及的分类问题并非都是用数值特征来描述某个研究对象的,因此与数值特征对应的就是非数值特征,比如男生和女生比较喜欢什么样的颜色等等。
关于非数值特征,主要有以下几种:
1)名...
分类:
其他好文 时间:
2016-06-16 13:24:09
阅读次数:
317
http://blog.sina.com.cn/s/blog_6646924501018fqc.html 主要就是讲解利用libsvm-mat工具箱建立分类(回归模型)后,得到的模型model里面参数的意义都是神马?以及如果通过model得到相应模型的表达式,这里主要以分类问题为例子。测试数据使用的 ...
分类:
其他好文 时间:
2016-06-11 17:12:09
阅读次数:
170
模型预测流程(Predictive Modelling Process): 评估矩阵:对于不均衡样本,我们选用F1值而非准确性(accuracy score)来评估,精确度和召回率也可用于本分类问题。 ...
分类:
其他好文 时间:
2016-06-07 20:50:31
阅读次数:
290