需要对数据进行函数拟合,首先画一下二维散点图,目测一下大概的分布, 所谓正态分布,就是高斯分布,正态曲线是一种特殊的高斯曲线。 python的scipy.optimize包里的curve_fit函数来拟合曲线,当然还可以拟合很多类型的曲线。scipy.optimize提供了函数最小值(标量或多维)、 ...
分类:
编程语言 时间:
2019-06-02 15:49:12
阅读次数:
221
Regression Shrinkage and Selection via the lasso 众所周知,Robert Tibshirani是统计领域的大佬,这篇文章在1996年提出了LASSO,之后风靡整个高维领域,并延伸出许多种模型。这篇文章截止2019.5.16已经获得了27991的引用量( ...
分类:
其他好文 时间:
2019-05-16 12:34:14
阅读次数:
133
高斯函数与正态分布 高斯函数或者说正态分布函数在很多场合都得到广泛应用,其是概率论和统计学的核心,在最大似然估计、贝叶斯估计中必不可少。其也是稀疏贝叶斯估计的重要基础。下面对高斯函数的一些基本知识点进行归纳和总结,不当之处,欢迎批评指正。 (1) 高斯函数高斯函数定义如下\begin{equatio ...
分类:
其他好文 时间:
2019-05-13 09:17:03
阅读次数:
185
分布图通过将数据的经验分布与指定分布预期的理论值进行比较,直观地评估样本数据的分布。除了更正式的假设检验之外,还使用分布图来确定样本数据是否来自指定的分布。要了解假设检验,请参阅假设检验。 统计和机器学习工具箱?提供了几种分布图选项: 正态概率图 - normplot用于评估样本数据是否来自正态分布 ...
分类:
其他好文 时间:
2019-05-10 15:02:27
阅读次数:
258
正太分布:也叫(高斯分布Gaussian distribution),是一种随机概率分布 机器学习中numpy.random如何生成这样的正态分布数据,本篇博客记录这样的用法 import numpy as np# a = np.random.randint(1,10,size=2) # 最小值,最 ...
分类:
编程语言 时间:
2019-05-07 19:41:46
阅读次数:
335
对于原始数据分布倾斜 利用统计或数学变换来减轻数据分布倾斜的影响。使原本密集的区间的值尽可能的分散, 原本分散的区间的值尽量的聚合。 Log变换通常用来创建单调的数据变换。它的主要作用在于帮助稳定方差,始终保持分布 接近于正态分布并使得数据与分布的平均值无关。 y=logc(1+λx) λ通常设置为 ...
分类:
其他好文 时间:
2019-04-29 12:58:32
阅读次数:
164
三维配准中经常被提及的配准算法是ICP迭代的方法,这种方法一般般需要提供一个较好的初值,也就是需要粗配准,同时由于算法本身缺陷,最终迭代结果可能会陷入局部最优,导致配准失败,往往达不到我们想要的效果。本文介绍的是另一种比较好的配准算法,NDT配准。所谓NDT就是正态分布变换,作用与ICP一样用来估计 ...
分类:
其他好文 时间:
2019-04-14 16:15:23
阅读次数:
710
标准化方法 Z score Normalization Z score normalization 又叫 standardization (规范化),将特征进行缩放使得其具有均值为0,方差为1的标准正态分布的特性。 $$ z = \frac{x \mu}{\sigma} $$ 其中均值$\mu = ...
分类:
其他好文 时间:
2019-04-13 00:46:57
阅读次数:
420
问题提出 正态分布检验一次只能检验一个分组,如果有多组数据需要检验,则需要运行多次 解决思路 使用循环命令可以实现按一定规则计算。 如果以后也经常需要使用,写成脚本调用更方便些,需要使用的时候直接调用即可。 脚本针对的场景相对直接使用循环命令更广泛写,如果仅使用循环命令,很多参数与类型定义直接使用数 ...
分类:
其他好文 时间:
2019-03-17 15:45:26
阅读次数:
172