码迷,mamicode.com
首页 >  
搜索关键字:样本    ( 4292个结果
基于边缘一致性的条码定位算法
1. 方案简介 1.1 图像增强算法 1.2 Scharr滤波 1.3边缘梯度幅值及方向角度 1.4 分块统计边缘一致性 1.5 条码区域定位 2. 样本测试 ...
分类:编程语言   时间:2020-08-17 17:09:08    阅读次数:67
线性判别分析浅析及推导
原文地址:https://zhuanlan.zhihu.com/p/84660707 线性判别分析(Linear Discriminant Analysis, LDA),LDA是一种监督学习的降维技术,其具体的原理用一个栗子来说明。首先,从一个简单的分类开始,如下图所示 尝试找一个向量,并将各个样本 ...
分类:其他好文   时间:2020-08-10 18:35:42    阅读次数:79
【小白学AI】八种应对样本不均衡的策略
文章来自:微信公众号【机器学习炼丹术】 1 什么是非均衡 分类(classification)问题是数据挖掘领域中非常重要的一类问题,目前有琳琅满目的方法来完成分类。然而在真实的应用环境中,分类器(classifier)扮演的角色通常是识别数据中的“少数派”,比如: 银行识别信用卡异常交易记录 垃圾 ...
分类:其他好文   时间:2020-08-03 00:52:13    阅读次数:123
偏差(Bias)和方差(Variance)——机器学习中的模型选择
模型性能的度量 在监督学习中,已知样本 ,要求拟合出一个模型(函数),其预测值与样本实际值的误差最小。 考虑到样本数据其实是采样,并不是真实值本身,假设真实模型(函数)是,则采样值,其中代表噪音,其均值为0,方差为。 拟合函数的主要目的是希望它能对新的样本进行预测,所以,拟合出函数后,需要在测试集( ...
分类:其他好文   时间:2020-07-29 15:11:56    阅读次数:68
背诵概念
0、万恶之源版本号 tensorflow,pytorch,显卡版本,conda版本 1、什么是GBDT? 2、xgboost在GBDT上做了哪些优化? 3、随机森林核心思想有几个,分别是什么? 1、gradient boosting decision tree 一种基于boosting增强策略的加法 ...
分类:其他好文   时间:2020-07-29 10:18:11    阅读次数:78
关于使用sklearn进行数据预处理 —— 归一化/标准化/正则化
转自:https://www.cnblogs.com/chaosimple/p/4153167.html 一、标准化(Z-Score),或者去除均值和方差缩放 公式为:(X-mean)/std 计算时对每个属性/每列分别进行。 将数据按期属性(按列进行)减去其均值,并处以其方差。得到的结果是,对于每 ...
分类:其他好文   时间:2020-07-28 17:09:32    阅读次数:72
Hive函数大全-完整版
Hive函数大全–完整版 现在虽然有很多SQL ON Hadoop的解决方案,像Spark SQL、Impala、Presto等等,但就目前来看,在基于Hadoop的大数据分析平台、数据仓库中,Hive仍然是不可替代的角色。尽管它的相应延迟大,尽管它启动MapReduce的时间相当长,但是它太方便、 ...
分类:其他好文   时间:2020-07-28 14:21:17    阅读次数:191
6-机器学习-样本类别分布不均衡处理之过抽样和欠抽样
总结 样本类别分布不均衡处理(处理过拟合和欠拟合问题) 过抽样(上采样):通过增加分类中少数类样本的数量来实现样本均衡 from imblearn.over_sampling import SMOTE 欠抽样(下采样):通过减少分类中多数类样本的数量来实现样本均衡 (可能造成样本数据大量丢失) fr ...
分类:其他好文   时间:2020-07-28 00:04:11    阅读次数:85
5-Pandas之常用的描述性统计函数、汇总函数
一、常用的描述性统计函数 函数 作用 函数 作用 count 非缺失样本的数量 sum 求和 mean 均值 mad 平均绝对偏差(Mean absolute deviation) median 中位数 min 最小值 max 最大值 mode 众数 abs 绝对值 prod 乘积 std 标准差 ...
分类:其他好文   时间:2020-07-26 22:59:53    阅读次数:122
GBDT
一、简介 GBDT为梯度提升树,是提升树的一种改进形式。 二、算法原理 (1)初始化弱模型 $$f_{0}(x_{i})=arg\min_{c}\sum_{i=1}^{N}L(y_{i},c)$$ (2)在第m轮模型的计算中 (a)对每个样本i,计算负梯度 $$r_{im}=-\frac{\part ...
分类:其他好文   时间:2020-07-26 15:34:37    阅读次数:80
4292条   上一页 1 ... 9 10 11 12 13 ... 430 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!