数据挖掘主要有以下知识点 1.统计分析 主要包括回归/逻辑回归分析,主成分分析/因子分析 等 其中主成分/因子分析:对多维变量进行降维,以选择合适建模变量的方法 回归逻辑/回归分析:基于一组相关数据建立自变量与因变量的确定关系,并以此研究统计意义与随机变量的不确定性关系的方法 2.聚类分析 根据对象 ...
分类:
其他好文 时间:
2017-06-28 21:40:28
阅读次数:
129
第1章 随机事件与概率§1.1 随机事件§1.2 随机事件的概率§1.3 古典概型与几何概型§1.4 条件概率§1.5 事件的独立性 第2章 随机变量的分布与数字特征§2.1 随机变量及其分布§2.2 随机变量的数字特征§2.3 常用的离散型分布§2.4 常用的连续型分布§2.5 随机变量函数的分布 ...
分类:
其他好文 时间:
2017-06-22 11:06:58
阅读次数:
99
12.样本和总体:sample and population Sample mean: χ (N) Population mean:μ (n) 总体方差: 样本方差: 标准差: 诸方差公式: 随机变量: ...
分类:
其他好文 时间:
2017-06-17 16:05:41
阅读次数:
161
概率无向图模型 又称马尔可夫随机场(Markov random field)或马尔可夫网络,是一个由无向图表示的联合概率分布。 图是由结点和边组成,无向图中的边没有方向。概率无向图中结点表示随机变量,边表示结点之间的概率依赖关系。 成对马尔可夫性: 设u和v是无向图G中任意两个没有连接边的结点,对应 ...
分类:
其他好文 时间:
2017-06-13 11:29:01
阅读次数:
258
原来一直不太清楚随机过程是怎么回事,它和随机信号和随机变量又有哪些关联?今天就来介绍一下, 随机过程的基本特征主要体下载以下两个方面: 1、它是一个时间的函数 2、在某一个固定的观察时刻,全部样本在t时刻的取值是一个不含时间t变化的随机变量。 用通俗的话来讲,随机过程是指整个过程在时间上是随机的,是 ...
分类:
其他好文 时间:
2017-06-04 23:02:32
阅读次数:
233
本文的目的是利用(0,1)上的均匀分布随机数生成器生成区间为(imin,imax),斜率为slope的任意归一化线性随机数生成器。 借助(0,1)上的均匀随机数生成器,可以通过反函数法生成任意分布的随机数生成器。 对于C++,生成(imin,imax)上随机数生成器的代码为 其中imin为随机变量最 ...
分类:
其他好文 时间:
2017-06-04 21:26:13
阅读次数:
288
1、什么是数学期望? 数学期望亦称期望、期望值等。在概率论和统计学中,一个离散型随机变量的期望值是试验中每一次可能出现的结果的概率乘以其结果的总和。 这是什么意思呢?假如我们来玩一个游戏,一共52张牌,其中有4个A。我们1元钱赌一把,如果你抽中了A,那么我给你10元钱,否则你的1元钱就输给我了。在这 ...
分类:
其他好文 时间:
2017-05-30 23:16:47
阅读次数:
270
1. 相关分析 1.1 相关系数 在一堆变量中,找到并分析它们之间的关系,是复杂环境和模型中的重要任务。由于线性关系的特殊、常见和简单,数学上往往采用线性关系来逼近实际关系。上篇的线性回归以及概率论中的线性回归,更关注的是线性函数的参数估计。如果想单纯地度量随机变量的线性关系,直接讨论相关系数即可, ...
分类:
其他好文 时间:
2017-05-24 09:54:52
阅读次数:
204
参数估计和假设检验是数理统计的两个基础问题,它们不光运用于常见的分布,还会出现在各种问题的讨论中。本篇开始研究另一大类问题,就是讨论多个随机变量之间的关系。现实生活中的数据杂乱无章,够挖掘出各种变量之间的关系非常有用,它可以预估变量的走势,能帮助分析状态的根源。关系分析的着手点可以有很多,我们从最简 ...
分类:
其他好文 时间:
2017-05-22 23:13:47
阅读次数:
242
算法导论课程中,老师在介绍随机算法的时候提到指示器随机变量(indicator random variable),感觉很有用的一个东东。 先介绍一下指示器随机变量。 给定一个样本空间S和 事件A,那么事件A对应的指示器随机变量I{A}=1(如果A发生),0(如果A不发生); 显而易见,事件A对应的指 ...
分类:
其他好文 时间:
2017-05-09 11:26:17
阅读次数:
365