柯尔莫哥洛夫于1933年给出了概率的公理化定义,如下: 设E是随机试验,S是它的样本空间。对于E的每一事件A赋于一个实数,记为P(A),称为事件A的概率。这里P(A)是一个集合函数,P(A)要满足下列条件: (1)非负性:对于每一个事件A,有P(A)≥0; (2)规范性:对于必然事件,有P(Ω)=1 ...
分类:
其他好文 时间:
2020-04-28 09:44:22
阅读次数:
89
一、用自己的话描述出其本身的含义: 1、特征选择 将高维空间的样本通过映射或者是变换的方式转换到低维空间,达到降维的目的,然后通过特征选取删选掉冗余和不相关的特征来进一步降维。 2、PCA 找出数据里最主要的方面,用数据里最主要的方面来代替原始数据 二、并用自己的话阐述出两者的主要区别 PCA是用于 ...
分类:
其他好文 时间:
2020-04-27 22:44:45
阅读次数:
56
数据不平衡又称样本比例失衡,比如二分类问题,如果标签为1的样本占总数的99%,标签为0的样本占比1%则会导致判断「失误严重」,准确率虚高。 常见的解决不平衡问题的方法如下。 「数据采样」 数据采样分为上采样和下采样,上采样是将少量的数据通过重复复制使得各类别比例均衡,不过很容易导致过拟合问题,所以需 ...
分类:
其他好文 时间:
2020-04-27 22:14:26
阅读次数:
68
在很多应用场景中, 马尔可夫决策过程 的状态转移概率 $p(s^ {\prime}|s,a)$ 和奖励函数 $r\left( {s,a,s^{\prime}} \right)$ 都是未知的。这种情况一般需要智能体与环境交互,然后收集一些样本,然后再根据这些样本来求解最优策略,这种基于采样的学习方法称 ...
分类:
其他好文 时间:
2020-04-27 17:53:23
阅读次数:
80
表达矩阵 要做两两样本的相关性散点图,并计算标明相关系数。 编写函数要点: 直接在aes中传参是不行的 线性回归表达式 函数 方法1:用!!ensym myplot Ref: "https://stackoverflow.com/questions/15323269/addressing x and ...
分类:
其他好文 时间:
2020-04-27 17:36:05
阅读次数:
100
Prometheus提供了其它大量的内置函数,可以对时序数据进行丰富的处理。某些函数有默认的参数,例如:year(v=vector(time())instant-vector)。其中参数v是一个瞬时向量,如果不提供该参数,将使用默认值vector(time())。instant-vector表示参数类型。abs()abs(vinstant-vector)返回输入向量的所有样本的绝对值。absent
分类:
其他好文 时间:
2020-04-27 15:27:23
阅读次数:
60
机器学习不是科幻电影。 机器学习目的是解放生产力。 机器学习原理 机器学习: 机器自主获取事物的规律。 要让机器可以 “学习”,必须将生活中的数据(包括但不限于图像、文字、语音)数值化,将不同事物的变化和关联转化为运算。 机器学习可以成立的原因是:概念和数值、关系和运算可以相互映射。 机器学习的种类 ...
分类:
其他好文 时间:
2020-04-27 13:17:49
阅读次数:
181
很容易理解的一篇博客[http://blog.codinglabs.org/articles/pca tutorial.html] 在高维情形下出现的数据样本稀疏、距离计算困难等问题,称为“维数灾难”。 缓解维数灾难的一个重要途径是降维。将原始高维属性空间转变成一个低维子空间,子空间样本密度大幅提高 ...
分类:
其他好文 时间:
2020-04-27 09:27:36
阅读次数:
163
1.用自己的话描述一下,什么是逻辑回归,与线性回归对比,有什么不同? 逻辑回归本质上是一个线性回归模型,是一种用来解决二分类问题的机器学习方法,用于估计某种事物的可能性。 2.自述一下什么是过拟合和欠拟合? (1)过拟合:其实就是所建的机器学习模型或者是深度学习模型在训练样本中表现得过于优越,太过贴 ...
分类:
编程语言 时间:
2020-04-26 01:26:29
阅读次数:
91
6.逻辑归回 1.用自己的话描述一下,什么是逻辑回归,与线性回归对比,有什么不同? 首先逻辑回归处理的是分类问题,线性回归处理的是回归问题,这是两者最本质的区别。 ①性质不同 逻辑回归:是一种广义的线性回归分析模型。 线性回归:利用数理统计中回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一 ...
分类:
其他好文 时间:
2020-04-24 19:56:59
阅读次数:
89