逻辑斯蒂回归(logistic regression) 是经典的分类方法。虽然名字中包含回归,但它被用来 分类 。 逻辑斯蒂分布 设 $X$ 是随机变量,$X$ 服从逻辑斯蒂分布是指 $X$ 的概率分布函数 $F(x)$ 和概率密度函数 $f(x)$ 为: $$F(x) = P(X \le x) = ...
分类:
其他好文 时间:
2018-11-04 22:54:34
阅读次数:
218
1. 信息熵 1.1 信息熵的数学本质 一个随机变量或系统所包含信息量的数学期望 1.2 信息熵的物理意义(信息论解释) 对随机变量的所有取值进行编码所需的最短编码长度 消除随机变量的不确定性所需的最短编码长度即为信息熵 1.3 随机变量X的熵: $H(X) = \sum_{i=1}^{n} P(x ...
分类:
其他好文 时间:
2018-10-27 23:32:28
阅读次数:
236
相关分析是数据分析的一个基本方法,可以用于发现不同变量之间的关联性,关联是指数据之间变化的相似性,这可以通过相关系数来描述。发现相关性可以帮助你预测未来,而发现因果关系意味着你可以改变世界。 一,协方差和相关系数 如果随机变量X和Y是相互独立的,那么协方差 Cov(X,Y) = E{ [X-E(X) ...
分类:
其他好文 时间:
2018-10-23 11:56:33
阅读次数:
255
定义:如果我们的随机变量是标准正态分布(详见以前博客的高斯分布),那么多个随机变量的平方和服从的分布即为卡方分布。 X=Y12+Y22+?+Yn2 其中,Y1,Y2,?,Yn均为服从标准正态分布的随机变量,那么XX服从卡方分布,值得注意的是其中的nn即随机变量的个数成为卡方分布的自由度。概率密度函数 ...
分类:
其他好文 时间:
2018-10-13 12:58:12
阅读次数:
693
导入类库 小知识 获取波士顿房价数据 多变量图 热点图 回归方法是一种对数值型连续随机变量进行预测和建模的监督学习算法。使用案例一般包括房价预测、股票走势或测试成绩等连续变化的案例; 回归任务的特点是标注的数据集具有数值型的目标变量。也就是说,每一个观察样本都有一个数值型的标注真值以监督算法。 线性 ...
分类:
其他好文 时间:
2018-10-06 12:02:50
阅读次数:
220
知识点:伯努利分布、二项式分布、多项式分布、先验概率,后验概率,共轭分布、贝塔分布、贝塔-二项分布、负二项分布、狄里克雷分布,伽马函数、分布 一,伯努利分布(bernouli distribution) 又叫做0-1分布,指一次随机试验,结果只有两种。也就是一个随机变量的取值只有0和1。 记为:0- ...
分类:
其他好文 时间:
2018-10-05 22:38:56
阅读次数:
191
有$n$个互相独立的$0$至$1$之间等概率生成的随机变量,求从小到大排序后第$i$个数的数值期望 ...
分类:
其他好文 时间:
2018-10-04 20:53:19
阅读次数:
273
定义 t分布 设X ~ N(0,1),Y ~ χ2(n),且X,Y相互独立,则称随机变量 服从自由度为n的t分布(学生氏分布) 记为 t~t(n),其概率密度为 由于tn(x)是偶函数,其图形关于y轴对称。当n趋于无穷大时,t分布以标准正态分布N(0,1)为极限分布。也就是说t分布当n~∞时,tn( ...
分类:
其他好文 时间:
2018-09-29 23:58:55
阅读次数:
632
1. 矩的概念 图像识别的一个核心问题是图像的特征提取,简单描述即为用一组简单的数据(图像描述量)来描述整个图像,这组数据越简单越有代表性越好。良好的特征不受光线、噪点、几何形变的干扰。图像识别发展几十年,不断有新的特征提出,而图像不变矩就是其中一个。 矩是概率与统计中的一个概念,是随机变量的一种数 ...
分类:
其他好文 时间:
2018-09-29 20:31:44
阅读次数:
218
a. 基本随机数 Matlab中有两个最基本生成随机数的函数。 1.rand() 生成(0,1)区间上均匀分布的随机变量。基本语法: rand([M,N,P ...]) rand([M,N,P ...]) 生成排列成M*N*P... 多维向量的随机数。如果只写M,则生成M*M矩阵;如果参数为[M,N ...
分类:
其他好文 时间:
2018-09-28 19:09:18
阅读次数:
136