特征函数和 cdf(cumulative distribution function,也叫分布函数)一样提供了另外一种描述随机变量的方法:https://blog.csdn.net/lanchunhui/article/details/54618901 ...
分类:
其他好文 时间:
2018-08-16 23:44:28
阅读次数:
185
一、基础理解 1)公式 2)实例计算基尼系数 3 种情况计算基尼系数: 基尼系数的性质与信息熵一样:度量随机变量的不确定度的大小; 3)只有两种类别的数据集 二、使用基尼系数划分节点数据集 1)格式 from sklearn.tree import DecisionTreeClassifier dt ...
分类:
其他好文 时间:
2018-08-14 22:49:50
阅读次数:
16223
在概率论中,对两个随机变量X和Y,其联合分布是同时对于X和Y的概率分布(关于概率分布的理论请参考:点这里)。 乍一看:“同时对于X和Y的概率分布”,感觉很懵,不懂是啥意思。没关系,我们带着这个疑问,继续往下看: 联合分布可以划分为两种,一种是关于离散随机变量的联合分布,另一种是关于连续随机变量的。 ...
分类:
其他好文 时间:
2018-08-10 19:38:57
阅读次数:
116
3. 随机变量 1. 随机变量及分布函数 函数的概念可以推广到自变量不是实数的情形。如:两点间的距离可作为以一对点 为自变量的函数;三角形的周长为定义在三角形集合上的函数。随机变量是一个从 样本空间Ω到实数集合 R 的函数。 对于我们所关心的随机现象,其样本点的形式多种多样,除了公司的员工,还 可能 ...
分类:
其他好文 时间:
2018-08-04 15:49:34
阅读次数:
123
数据挖掘所挖掘的结果是面向全部的数据,而机器学习则是预测测试样本的检测结果。 1.挖掘知识类型:1.特征化2.数据区分3.关联分析4.分类5.聚类、孤立点分析、演变分析 2.互信息值:是信息论中一个有用的信息度量。它可以看出是一个信息量里包含另一个随机变量的信息量。 互信息值越大,就代表2个属性关联 ...
分类:
其他好文 时间:
2018-07-26 18:36:23
阅读次数:
546
四种收敛的形式: **distribution convergence**:$$X_n \overset{d}{\to} X \\ F_n(x) \to F(x)$$ 一个随机变量的分布函数收敛于另外一个函数,也就是只关心两个随机变量/函数的分布,而不关心他们在具体值上面的关系,两个实验进行一次得到 ...
分类:
其他好文 时间:
2018-07-13 12:16:42
阅读次数:
158
Part1. 随机事件 1 1.随机试验 随机试验 :可以在相同条件下重复进行,每次试验的结果不止一个,事先知道所有可能的结果但不确定是哪一个的试验。 举例:重复的抛出一枚均匀的硬币就是一个随机试验,事先知道它的结果,但是不知道究竟是正面还是反面。 1 2.随机事件 定义1:随机试验可能的结果,称为 ...
分类:
其他好文 时间:
2018-07-11 22:57:01
阅读次数:
242
概率图模型是一类用图来表达变量相关关系的概率模型。它以图为表示工具,最常见的是用一个结点表示一个或一组随机变量,结点之间的变表是变量间的概率相关关系。根据边的性质不同,可以将概率图模型分为两类:一类是使用有向无环图表示变量间的依赖关系,称为有向图模型或贝叶斯网;另一类是使用无向图表示变量间的相关关系 ...
分类:
编程语言 时间:
2018-07-08 19:07:47
阅读次数:
274
现实生活中有许多需要提前预防一些异常问题出现的情况,例如在飞机起飞前,对飞机各部分进行评估,看发动机等各个零件是否性能正常,若有潜在的问题(可能出现异常情况),则需要及时检修或更换。 那么我们如何去评估异常是否存在呢? 利用联合概率分布~ [TOC] 联合概率分布 $X表示一系列随机变量\{X_1, ...
分类:
编程语言 时间:
2018-07-07 15:43:16
阅读次数:
187
title:批量创建用户与批量文件重命名tags:批量,用户,创建,重命名批量创建用户与批量文件重命名1.批量创建用户如果需要批量创建用户,且用户名为stu01-stu10,用户密码为随机的10位密码。1.1分析解答如果用户名为stu01的话,我们可以采用for循环,直接变量范围为01-10,密码随机的话我们可以采用系统默认的随机变量RANDOM,因为默认的RANDOM只有5位数字,因此我们可以给
分类:
其他好文 时间:
2018-07-03 18:22:02
阅读次数:
194