恢复内容开始 统计决策方法 看一个简单的例子。 假设我手里握着一枚硬币,让你猜是多少钱的硬币,这可以看做一个分类决策的问题:你需要从各种可能的硬币中做出一个决策,如果我告诉你这枚硬币只可能是一角或者五角,这就是一个两类的分类问题。 在没有任何关于这枚硬币任何信息的情况下,有人可能猜这是一枚一脚的硬币 ...
分类:
其他好文 时间:
2019-07-12 12:55:40
阅读次数:
94
分类问题就像披着羊皮的狼,看起来天真无害用起来天雷滚滚。比如在建模前你思考过下面的问题么? 你的分类模型输出的概率只是用来做样本间的相对排序,还是概率本身? 你的训练数据本身分布如何是否存在Imbalanced Sample? 要是您都想到了拜拜??。要是有1各您感兴趣的问题,那就接着往下看吧。本来 ...
分类:
其他好文 时间:
2019-07-03 00:40:35
阅读次数:
99
一、Voting 模型融合其实也没有想象的那么高大上,从最简单的Voting说起,这也可以说是一种模型融合。假设对于一个二分类问题,有3个基础模型,那么就采取投票制的方法,投票多者确定为最终的分类。 二、Averaging 对于回归问题,一个简单直接的思路是取平均。稍稍改进的方法是进行加权平均。权值 ...
分类:
其他好文 时间:
2019-07-01 17:06:26
阅读次数:
157
在解决分类问题的时候,可以选择的评价指标简直不要太多。但基本可以分成两2大类,我们今分别来说道说道 基于一个概率阈值判断在该阈值下预测的准确率 衡量模型整体表现(在各个阈值下)的评价指标 在说指标之前,咱先把分类问题中会遇到的所有情况简单过一遍。36度的北京让我们举个凉快一点的例子 我们预测会不会下 ...
分类:
其他好文 时间:
2019-07-01 10:42:29
阅读次数:
98
1.新后台有一、二级分类之分,老后台创建的分类默认是二级分类,一体机上显示商品不显示分类,首先查看后台商品是否绑定的是一级分类 2.一体机默认展示的是二级分类 最后同步数据,就能看到了 ...
分类:
其他好文 时间:
2019-06-29 14:24:42
阅读次数:
175
在《机器学习 逻辑回归(一)(Machine Learning Logistic Regression I)》一文中,我们讨论了如何用逻辑回归解决二分类问题以及逻辑回归算法的本质。现在来看一下多分类的情况。 现实中相对于二分类问题,我们更常遇到的是多分类问题。多分类问题如何求解呢?有两种方式。一种是 ...
分类:
系统相关 时间:
2019-06-23 20:48:12
阅读次数:
170
在Logistic regression二分类问题中,我们可以使用sigmoid函数将输入Wx+b映射到(0,1)区间中,从而得到属于某个类别的概率。将这个问题进行泛化,推广到多分类问题中,我们可以使用softmax函数,对输出的值归一化为概率值 这里假设在进入softmax函数之前,已经有模型输出 ...
分类:
其他好文 时间:
2019-06-22 22:28:22
阅读次数:
139
CNN用于文本分类本就是一个不完美的解决方案,因为CNN要求输入都是一定长度的,而对于文本分类问题,文本序列是不定长的,RNN可以完美解决序列不定长问题, 因为RNN不要求输入是一定长度的。那么对于CNN用于解决文本分类问题而言,可以判断文本的长度范围,例如如果大多数文本长度在100以下,极少数在1 ...
分类:
其他好文 时间:
2019-06-19 16:26:11
阅读次数:
125
一、简介 这个方法主要涉及到2个权重集合: 样本的权重集合每个样本都对应一个权重。 在构建第一个弱模型之前,所有的训练样本的权重是一样的。第一个模型完成后,要加大那些被这个模型错误分类(分类问题)、或者说预测真实差值较大(回归问题)的样本的权重。依次迭代,最终构建多个弱模型。每个弱模型所对应的训练数 ...
分类:
其他好文 时间:
2019-06-14 18:26:15
阅读次数:
90
最近在看清华大学数据挖掘导论,图个自己复习省事,把学的东西整理在这里,也希望本菜鸡的整理对一些童鞋有帮助吧。 分类问题: 定义:给定训练集:{(x1,y1),...,(xn,yn)},生成将任何未知对象xi映射到其类标签yi的分类器(函数)。 图示: 其经典算法: 决策树 KNN 神经网络 支持向量 ...
分类:
其他好文 时间:
2019-06-08 15:00:20
阅读次数:
96