码迷,mamicode.com
首页 >  
搜索关键字:样本    ( 4043个结果
PCA主成分分析
PCA主成分分析 所谓主成分分析是要找到一组对原特征进行线性变换的变换向量。通过变换之后得到的新的变量,应该具有尽可能大的方差,这里的方差是在总体样本上计算的。 这里的变换向量的作用实际上就是线性组合的问题。 这种变换向量可能有多个,多种变换之间应该尽可能线性无关,实际上就是这些变换向量之间线性无关 ...
分类:其他好文   时间:2020-03-29 17:55:00    阅读次数:10
tensorflow1.0 队列FIFOQueue管理实现异步读取训练
import tensorflow as tf #模拟异步子线程 存入样本, 主线程 读取样本 # 1. 定义一个队列,1000 Q = tf.FIFOQueue(1000,tf.float32) #2.定义要做的事情 循环 值,+1 放入队列当中 var = tf.Variable(0.0) #实 ...
分类:其他好文   时间:2020-03-28 23:38:23    阅读次数:14
PU Learning简介:对无标签数据进行半监督分类
当只有几个正样本,你如何分类无标签数据 假设您有一个交易业务数据集。有些交易被标记为欺诈,其余交易被标记为真实交易,因此您需要设计一个模型来区分欺诈交易和真实交易。 假设您有足够的数据和良好的特征,这似乎是一项简单的分类任务。 但是,假设数据集中只有15%的数据被标记,并且标记的样本仅属于一类,即训 ...
分类:其他好文   时间:2020-03-28 20:01:45    阅读次数:15
概率论和数理统计_02_概论基础
16世纪,扔骰子赌博游戏。 随机试验 1)相同的条件,可以重复进行。(公平) 2)实施在执行前,其所有可能的结果是确定的。 3)出现哪种结果,在实验之前是不知道的。(公平,不然就是作弊,出老千) 样本空间:所有可能的结果的集合。例如骰子游戏的样本空间{1,2,3,4,5,6} 样本点:单个结果 随机 ...
分类:其他好文   时间:2020-03-28 16:08:57    阅读次数:14
西瓜书第四章--决策树
4.1基本流程 决策树的结构 一个决策树包含一个根结点、若干个内部结点和若干个叶结点; 叶结点对应于决策结果,其他每个结点则对应于一个属性测试; 每个结点包含的样本集合根据属性测试的结果被划分到子结点中; 根结点包含样本全集,从根结点到每个叶结点的路径对应了一个判定测试序列。 仅有一层划分的决策树, ...
分类:其他好文   时间:2020-03-28 13:12:57    阅读次数:20
机器学习:sk-learn
安装 sklearn.datasets 这个包提供一些函数用于读取样本数据(数据存在 .csv 或 .csv.gz 文件),比如 酒数据集(用于分类) 13 个特征包括各种成分的含量、酒的颜色等 3 个分类简单的标记为 class_0、class_1、class_2 参数 return_X_y 表示 ...
分类:其他好文   时间:2020-03-27 01:01:09    阅读次数:12
KNN算法(K近邻算法)实现与剖析
KNN(K-Nearest Neighbors)算法,又称K近邻算法,单从字面意思我们就能知道,这个算法肯定是和距离有关的。 KNN算法的核心思想: 在一个特征空间中,如果某个样本身边和他最相邻的K个样本大多都属于一个类别,那么这个样本在很大程度上也属于这个类别,且该样本同样具有这个类别的特性。 其 ...
分类:编程语言   时间:2020-03-26 21:18:36    阅读次数:10
深度学习中的数据增强技术
1. 数据增强Data Augmentation 数据增强让有限的数据产生更多的数据,增加训练样本的数量以及多样性(噪声数据),提升模型鲁棒性。神经网络需要大量的参数,许许多多的神经网路的参数都是数以百万计,而使得这些参数可以正确工作则需要大量的数据进行训练,但在很多实际的项目中,我们难以找到充足的 ...
分类:其他好文   时间:2020-03-26 17:43:26    阅读次数:17
一个挖矿样本分析
0x00 概述 本来是想分析一下Sodinokibi病毒的新的变种,但是分析了一部分,被他的混淆和循环弄得有点头疼,东西还都是压在内存里。偶然翻到几年前的一个样本分析,又重新看了一下,发现自己在逆向这块几年了,也没实质性的提升,真是光阴喂了狗。这个样本是一个挖矿样本,那时候的样本挖矿还是直接CUP干... ...
分类:其他好文   时间:2020-03-26 01:26:40    阅读次数:20
第六节 k-近邻算法介绍和简单案列
""" K-近邻算法(KNN):如果一个样本在特征空间中的K个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别) K取值问题:取小容易受异常值影响,取太大预测准确率不好 性能问题:时间复杂度很高,计算量太大,适用小数据场景,于几千~几万样本 """ from skl ...
分类:编程语言   时间:2020-03-26 01:13:03    阅读次数:17
4043条   1 2 3 4 ... 405 下一页
© 2014 mamicode.com 版权所有 京ICP备13008772号-2
迷上了代码!