第一周 机器学习策略 1.1 什么是机器学习策略 1.2 正交化 功能点之间相互独立 1.3 单一数字评估指标 调和平均数 1.4 满足和优化指标 N个指标,满足N 1个指标的前提下优化那一个指标 1.5 训练,开发,测试数据集划分 训练集,开发集,测试集分开 ...
分类:
其他好文 时间:
2020-02-16 16:11:59
阅读次数:
67
选择并训练模型 至此,我们已明确了问题,并对数据进行了预处理。现在我们选择并训练一个机器学习模型。 在训练集上训练模型 这个过程相对来说较为简单,我们首先训练一个线性回归模型: from sklearn.linear_model import LinearRegression lin_reg = L ...
分类:
其他好文 时间:
2020-02-15 15:04:10
阅读次数:
135
softmax和分类模型 内容包含: 1. softmax回归的基本概念 2. 如何获取Fashion MNIST数据集和读取数据 3. softmax回归模型的从零开始实现,实现一个对Fashion MNIST训练集中的图像数据进行分类的模型 4. 使用pytorch重新实现softmax回归模型 ...
分类:
其他好文 时间:
2020-02-14 20:37:12
阅读次数:
69
softmax和分类模型 内容包含: softmax回归的基本概念 如何获取Fashion-MNIST数据集和读取数据 softmax回归模型的从零开始实现,实现一个对Fashion-MNIST训练集中的图像数据进行分类的模型 使用pytorch重新实现softmax回归模型 softmax的基本概 ...
分类:
其他好文 时间:
2020-02-13 17:26:49
阅读次数:
77
tensorflow识别Mnist时,训练集与验证集精度acc高,但是测试集精度低的比较隐蔽的原因除了网上说的主要原因https://blog.csdn.net/wangdong2017/article/details/90176323 之外,还有一种是比较隐蔽的原因(可能对于大多数人不会犯这种低级 ...
分类:
其他好文 时间:
2020-02-13 17:20:18
阅读次数:
811
关于样本测试集和训练集数量上,一般是选择训练集数量不小于测试集,也就是说训练集选取6k可能还不够,大家可以多尝试得到更好的效果; 2.有人提出归一化方面可能有问题,大家可以查查其他的归一化方法,但是归一化环境是不可少的; 3.将部分代码传到了**github** 4.听说阿里又改赛制了,哈哈。最近好... ...
分类:
其他好文 时间:
2020-02-08 11:48:18
阅读次数:
60
【机器学习】算法原理详细推导与实现(五):支持向量机(下) 上一章节介绍了支持向量机的生成和求解方式,能够根据训练集依次得出$\omega$、$b$的计算方式,但是如何求解需要用到核函数,将在这一章详细推导实现。 核函数 在讲核函数之前,要对上一章节得到的结果列举出来。之前需要优化的凸函数为: $$ ...
分类:
编程语言 时间:
2020-02-07 13:10:32
阅读次数:
80
原博客:https://blog.csdn.net/huplion/article/details/79069365 (在此仅作学习记录作用) 一、前言 在前几篇文章中,我们学习到如何在训练集上设置权重,并由此计算出损失(loss),其中loss是有两部分组成,分别是数据损失项和正则化项目。我们最终 ...
分类:
编程语言 时间:
2020-02-02 13:57:38
阅读次数:
57
StandardScaler和scale均为Z-score标准化,即减去均值µ除以标准差σ 而在进行数据标准化的时候,通常有两种方式: 1)将训练集和测试集统一进行标准化处理,此时均值和方差为整个数据的均值和方差 2)得到训练集的均值和标准差,用测试集的数据减去训练集的均值除以训练集的标准差。 在结 ...
分类:
编程语言 时间:
2020-02-01 19:43:14
阅读次数:
151
sklearn.model_selection.train_test_split随机划分训练集和测试集 一般形式: train_test_split是交叉验证中常用的函数,功能是从样本中随机的按比例选取train data和testdata,形式为: X_train,X_test, y_train, ...
分类:
其他好文 时间:
2020-02-01 12:49:55
阅读次数:
148