码迷,mamicode.com
首页 >  
搜索关键字:训练集    ( 799个结果
validation_data作用
validation_data用来在每个epoch之后,或者每几个epoch,验证一次验证集,用来及早发现问题,比如过拟合,或者超参数设置有问题。 这样可以方便我们及时调整参数 针对超参的选择我们是根据验证集上的效果来进行调整的,因此验证集可以看做参与到“人工调参”的训练过程; 2)注意训练集、验证 ...
分类:其他好文   时间:2019-06-14 11:02:45    阅读次数:123
数据挖掘导论学习---1
最近在看清华大学数据挖掘导论,图个自己复习省事,把学的东西整理在这里,也希望本菜鸡的整理对一些童鞋有帮助吧。 分类问题: 定义:给定训练集:{(x1,y1),...,(xn,yn)},生成将任何未知对象xi映射到其类标签yi的分类器(函数)。 图示: 其经典算法: 决策树 KNN 神经网络 支持向量 ...
分类:其他好文   时间:2019-06-08 15:00:20    阅读次数:96
基于Numpy的神经网络+手写数字识别
基于Numpy的神经网络+手写数字识别 本文代码来自Tariq Rashid所著《Python神经网络编程》 代码分为三个部分,框架如下所示: 这是一个坚实的框架,可以在这个框架之上,充实神经网络工作的详细细节。 使用以上定义的神经网络类: 以上训练中所用到的数据集: "训练集" "测试集" ...
分类:其他好文   时间:2019-06-04 13:22:24    阅读次数:102
模型融合和提升的算法------算法面试题
● bagging和boosting的区别 参考回答: Bagging是从训练集中进行子抽样组成每个基模型所需要的子训练集,然后对所有基模型预测的结果进行综合操作产生最终的预测结果。 Boosting中基模型按次序进行训练,而基模型的训练集按照某种策略每次都进行一定的转化,最后以一定的方式将基分类器 ...
分类:编程语言   时间:2019-06-03 21:52:50    阅读次数:156
K折交叉验证
交叉验证的思想 交叉验证主要用于防止模型过于复杂而引起的过拟合,是一种评价训练数据的数据集泛化能力的统计方法。其基本思想是将原始数据进行划分,分成训练集和测试集,训练集用来对模型进行训练,测试集用来测试训练得到的模型,以此来作为模型的评价指标。 简单的交叉验证 将原始数据D按比例划分,比如7:3,从 ...
分类:其他好文   时间:2019-06-01 21:07:15    阅读次数:199
特征缩放 | 归一化和标准化(上)
什么是特征缩放: 就是将所有数据映射到同一尺度。如: 某训练集 x_train 为: (x_trian) 将其进行某种特征缩放之后,得到新的值: 显然经过特征缩放之后,特征值变小了 为什么要进行特征缩放呢? 有些特征的值是有区间界限的,如年龄,体重。而有些特征的值是可以无限制增加,如计数值。 所以特 ...
分类:其他好文   时间:2019-05-31 18:05:59    阅读次数:534
kesci---2019大数据挑战赛预选赛---情感分析
一、预选赛题 文本情感分类模型 本预选赛要求选手建立文本情感分类模型,选手用训练好的模型对测试集中的文本情感进行预测,判断其情感为「Negative」或者「Positive」。所提交的结果按照指定的评价指标使用在线评测数据进行评测,达到或超过规定的分数线即通过预选赛。 二、比赛数据 训练集数据:(6 ...
分类:其他好文   时间:2019-05-26 19:54:49    阅读次数:220
机器学习之样本不均衡
以下内容是个人通过查阅网上相关资料总结出的内容 具体说明数据不均衡会带来的问题: 1)在一个二分类问题中,训练集中class 1的样本数比class 2的样本数是60:1。使用逻辑回归进行分类,最后训练出的模型可能会忽略了class 2,即模型可能会将所有的训练样本都分类为class 1。 2)在分 ...
分类:其他好文   时间:2019-05-26 11:13:10    阅读次数:336
机器学习实战-降维
降维 降维的动力来自于维度魔咒,动辄几万个甚至更多的特征会导致训练变慢,而且,维数越高越难找到合适的解决方案。特征的维数对应着相同维度的一个高维空间,高维空间中点与点的距离很容易变得很大,也就是实例之间的距离很大,训练集的特征空间很稀疏,这容易导致过拟合,当然,通过添加足够多的训练实例,在理论上可以 ...
分类:其他好文   时间:2019-05-25 00:04:30    阅读次数:123
集成学习_Bagging 和随机森林(rf)
集成学习方式总共有3种:bagging-(RF)、boosting-(GBDT/Adaboost/XGBOOST)、stacking 下面将对Bagging 进行介绍:(如下图所示) 用Bagging的方法抽取训练集时,大约有1/3 的数据没有被抽到。 从训练集进行一系列的子抽样,得到子训练集,训练 ...
分类:其他好文   时间:2019-05-22 11:06:06    阅读次数:118
799条   上一页 1 ... 21 22 23 24 25 ... 80 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!