无感知营销 1,训练集、测试集 机器学习中训练集、验证集和测试集的作用 2,过拟合、欠拟合 大白话给你说清楚什么是过拟合、欠拟合以及对应措施 ...
分类:
其他好文 时间:
2018-07-08 11:16:12
阅读次数:
160
17.1大型数据集的学习 首先通过学习曲线判断是否增大数据集有效: 高方差时(交叉验证集误差减去训练集误差大时)增加数据集可以提高系统。下图中左图增加数据集有效,右图无效。 17.2随机梯度下降法 随机梯度下降法是只使用一个样本来迭代,其损失函数为: 迭代过程为: 特点: (1)计算量小,迭代速度快 ...
分类:
其他好文 时间:
2018-07-07 17:45:50
阅读次数:
201
https://www.bilibili.com/video/av9770302/?p=15 前面说了auto-encoder,VAE可以用于生成 VAE的问题, AE的训练是让输入输出尽可能的接近,所以生成出来图片只是在模仿训练集,而无法生成他完全没有见过的,或新的图片 由于VAE并没有真正的理解 ...
分类:
Web程序 时间:
2018-07-06 23:31:05
阅读次数:
258
原理 KNN算法,又叫K近邻算法。就是在训练集中数据和标签已知的情况下,输入测试数据,将测试数据的特征与训练集中对应的特征进行相互比较,找到训练集中与之最为相似的前K个数据,则该测试数据对应的类别就是K个数据中出现次数最多的那个分类,其算法的描述为: 1)计算测试数据与各个训练数据之间的距离; 2) ...
分类:
编程语言 时间:
2018-07-06 23:29:00
阅读次数:
208
7.1过拟合的问题 训练集表现良好,测试集表现差。鲁棒性差。以下是两个例子(一个是回归问题,一个是分类问题) 解决办法: (1)丢弃一些不能帮助我们正确预测的特征。可以使用工选择保留哪些特征,或者使用一些模型选择的算法来帮忙(PCA); (2)正则化。保留素有的特征,但是减少参数的大小。 7.2代价 ...
分类:
其他好文 时间:
2018-07-02 00:03:49
阅读次数:
105
上面我们说了神经网络的基础知识,根据上章的基础尝试搭建一个标准的3层神经网络 1.框架代码 1.>初始化函数 — 设定输入层节点、隐藏层节点、输出层节点的数量,设置学习率和各层的权重 2.>训练 — 学习给定训练集样本后,优化权重 3.>查询 — 给定输入,从输出节点给出答案 2.初始化网络 在in ...
分类:
其他好文 时间:
2018-06-30 19:54:36
阅读次数:
512
2.1模型表示 (1)监督学习中的回归问题案例房价预测 (2)监督算法的工作方式 案例中:m表示训练集的数量,x代表特征/输入变量,y代表目标变量/输出变量,(x,y)代表实例,(x(i),y(i))代表第i个观察实例,h代表假设/函数/输入到输出的映射。 (3)房价预测的一种表达方式:h(Θ)=Θ ...
分类:
其他好文 时间:
2018-06-26 00:44:13
阅读次数:
150
训练集(traning set/data):用来训练,产生模型的算法的数据集测试集(testing set/data):用来训练,产生模型的算法的数据集):用来专门进行测试已经学习好的模型或者算法的数据集。特征向量(feature/feature vector):属性集合,通常用一个向量来表示,附属 ...
分类:
其他好文 时间:
2018-06-24 23:45:42
阅读次数:
203
一.基本概述 用交叉验证的目的是为了得到可靠稳定的模型。 消除测试集与训练集选择的不好,导致训练的模型不好。 二.k折交叉验证 K折交叉验证,初始采样分割成K个子样本,一个单独的子样本被保留作为验证模型的数据,其他K-1个样本用来训练。交叉验证重复K次,每个子样本验证一次,平均K次的结果或者使用其它 ...
分类:
其他好文 时间:
2018-06-23 19:18:49
阅读次数:
285
首先random_state和random seed是一样的,都是设置随机种子 在许多模型中都有random_state,例如SVC, ShuffleSplit()等,在模型中设置random_state作用就是可以使每次用相同的训练集相同参数可以得到相同的结果。不然的话,每训练一次,结果就会有波动 ...
分类:
其他好文 时间:
2018-06-21 19:40:41
阅读次数:
1123