码迷,mamicode.com
首页 >  
搜索关键字:训练集    ( 799个结果
机器学习中的交叉验证(cross-validation)
交叉验证(Cross validation),交叉验证用于防止模型过于复杂而引起的过拟合.有时亦称循环估计, 是一种统计学上将数据样本切割成较小子集的实用方法。于是可以先在一个子集上做分析, 而其它子集则用来做后续对此分析的确认及验证。 一开始的子集被称为训练集。而其它的子集则被称为验证集或测试集。 ...
分类:其他好文   时间:2020-04-02 18:22:19    阅读次数:88
机器学习中的参数:随机种子(random_state)
random_state是一个随机种子,是在任意带有随机性的类或函数里作为参数来控制随机模式。当random_state取某一个值时,也就确定了一种规则。 random_state可以用于很多函数,我比较熟悉的是用于以下三个地方:1、训练集测试集的划分 2、构建决策树 3、构建随机森林 1、划分训练 ...
分类:其他好文   时间:2020-03-31 01:25:49    阅读次数:523
TensorFlow中loss与val_loss、accuracy和val_accuracy分别是什么含义
loss:训练集损失值 accuracy:训练集准确率 val_loss:测试集损失值 val_accruacy:测试集准确率 以下5种情况可供参考: train loss 不断下降,test loss不断下降,说明网络仍在学习;(最好的) train loss 不断下降,test loss趋于不变 ...
分类:其他好文   时间:2020-03-29 12:24:26    阅读次数:452
《统计学习方法》:第三章 K 近邻算法
k NN k NN 是一种基本分类和回归方法。对新实例进行分类时,通过已经训练的数据求出 k 个最近实例,通过多数表决进行分类。故 k 邻近算法具有不显式的学习过程。 三个基本要素:k 值选择,距离度量,分类决策规则。 1. k 近邻算法 原理:给定一个训练集,对于新输入的实例,在训练集中找到与其相 ...
分类:编程语言   时间:2020-03-28 10:33:21    阅读次数:85
第五节 算法的分类介绍和数据集的划分
""" 机器学习算法分类: 监督学习(有目标值) 分类(目标值是离散型数据):K-近邻算法、贝叶斯分类、决策树与随机森林、逻辑回归、神经网络 回归(目标值是连续型数据):线性回归、岭回归 无监督学习(无目标值):聚类 K-means 机器学习一般会把数据集划分为训练集(3/4)和测试集(1/4),可 ...
分类:编程语言   时间:2020-03-26 01:37:29    阅读次数:103
数据挖掘
1.2.1 赛题概况 比赛要求参赛选手根据给定的数据集,建立模型,二手汽车的交易价格。 赛题以预测二手车的交易价格为任务,数据集报名后可见并可下载,该数据来自某交易平台的二手车交易记录,总数据量超过40w,包含31列变量信息,其中15列为匿名变量。为了保证比赛的公平性,将会从中抽取15万条作为训练集 ...
分类:其他好文   时间:2020-03-25 09:16:08    阅读次数:81
鸢尾花数据集可视化
数据集描述:其包含120条训练集和30条测试集 对鸢尾花的属性和标签之间的可视化操作: 1 import tensorflow as tf 2 import pandas as pd 3 import numpy as np 4 import matplotlib.pyplot as plt 5 6 ...
分类:其他好文   时间:2020-03-24 18:34:23    阅读次数:218
事件预测 -- 解决分类问题
event.txt 解决分类问题: 数据处理:训练集测试集划分,交叉验证,验证曲线,学习曲线,网格搜索。。 分类模型:逻辑回归,朴素贝叶斯,树模型,svm 模型评估:混淆矩阵,分类报告;查找率,召回率,f1得分 ...
分类:其他好文   时间:2020-03-24 15:49:02    阅读次数:60
[转][python sklearn模型中random_state参数的意义]
来自简书“owolf”:python sklearn模型中random_state参数的意义 “如果你在需要设置随机数种子的地方都设置好,那么当别人重新运行你的代码的时候就能得到完全一样的结果,复现和你一样的过程。” “ 这里的random_state就是为了保证程序每次运行都分割一样的训练集和测试 ...
分类:编程语言   时间:2020-03-21 13:11:55    阅读次数:70
k折交叉验证KFold()函数的使用
KFold(n_split, shuffle, random_state) 参数:n_splits:要划分的折数 shuffle: 每次都进行shuffle,测试集中折数的总和就是训练集的个数 random_state:随机状态 from sklearn.model_selection import ...
分类:其他好文   时间:2020-03-18 22:01:32    阅读次数:113
799条   上一页 1 ... 9 10 11 12 13 ... 80 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!