1统计学 对于正态分布,这个关系很重要! (x-u)/ 参数估计类的题目: 无偏估计量: 置信区间 假设类的题目:这个考的概率比较大 线性回归的计算题不会考到吧? ...
分类:
其他好文 时间:
2019-03-16 16:43:45
阅读次数:
159
统计学中最常见的几种概率分布分别是正态分布(normal distribution),t分布(t distribution),F分布(F distribution)和卡方分布(χ2 distribution,chi-square distribution),其中后三种属于抽样分布。 为什么要研究概率 ...
分类:
其他好文 时间:
2019-02-15 15:50:54
阅读次数:
630
Description 快要到七夕了,又到了交(nue)往(gou)的季节。恶梦坐在教室里,作为一个纯屌丝的他当然不会关心要送什么礼物给女生,然而他的前桌yves却在忙碌着各种各样的的短信。恶梦注意到yves发短信给的电话号码似乎都满足着特别的性质,难道yves的"好朋友"是满足正态分布的?由于yv ...
分类:
其他好文 时间:
2019-01-29 23:10:29
阅读次数:
215
Description 快要到七夕了,又到了交(nue)往(gou)的季节。恶梦坐在教室里,作为一个纯屌丝的他当然不会关心要送什么礼物给女生,然而他的前桌yves却在忙碌着各种各样的的短信。恶梦注意到yves发短信给的电话号码似乎都满足着特别的性质,难道yves的"好朋友"是满足正态分布的?由于yv ...
分类:
其他好文 时间:
2019-01-29 23:06:37
阅读次数:
168
比特币一直暴跌,为什么还有那么多矿工加入?比特币价格在八个月之内从最高点的20000美元下降到了6500美元,(译注:今天已经跌至3500万美元左右),跌幅超过80%。但在此期间,哈希率却从15EH/s上升到45EH/s,高达三倍的增长。(译注:价格从6500美元跌落至3500美元时,哈希率跌幅还是... ...
分类:
其他好文 时间:
2019-01-29 18:32:31
阅读次数:
215
数据预处理主要包括数据清洗、数据集成、数据变换和数据规约,处理过程如图所示。 一、数据清洗 1.缺失值处理:删除、插补、不处理 ## 拉格朗日插值代码(使用缺失值前后各5个未缺失的数据建模) 2.异常值处理 3.数据变换 1)函数变换:将不具有正态分布的数据变换成正态分布的数据 2)规范化/归一化: ...
分类:
编程语言 时间:
2019-01-22 21:51:21
阅读次数:
293
对于已经得到的样本集,核密度估计是一种可以求得样本的分布的概率密度函数的方法: 通过选取核函数和合适的带宽,可以得到样本的distribution probability,在这里核函数选取标准正态分布函数,bandwidth通过AMISE规则选取 具体原理及定义:传送门 https://en.wik ...
分类:
其他好文 时间:
2019-01-20 20:03:25
阅读次数:
258
多分类问题优先选择SVM,随机森林,其次是逻辑回归。 朴素贝叶斯和线性回归都是比较简单的模型,对于数据的要求比较高,功能不是特别强大。 1、决策树 不需要对数据做任何预处理, 2、随机森林 3、数据预处理与特征工程 (1)数据预处理:只需要X 数据无量钢化:标准化(转化为正态分布)、归一化(不改变数 ...
分类:
编程语言 时间:
2019-01-13 16:08:38
阅读次数:
312
1、线性回归 y=θx+ε,其中y=[y1,y2,y3,...,yn]T,θ=[θ1,θ2,...],x=[x1,x2,x3,...,xn]T,ε(残差)符合正态分布 那么对于该模型,就是在损失函数最小的前提条件下,寻找θ取值的过程。其中,损失函数采用最小二乘的方法。 2、对于求θ,有三种方法: 1 ...
分类:
其他好文 时间:
2019-01-10 22:20:07
阅读次数:
165
由R生成的随机数实际上伪随机数,也就是说,随机数是由某种算法而不是真正的随机过程产生的,随机数生成器需要一个初始值来生成数字,该初始值叫做种子。通过把种子设置为特定的值,可以保证每次运行同一段代码时都能生成相同的随机数。 R使用set.seed(n)函数来设置种子值,n是一个正整数,不同的种子会生成 ...
分类:
其他好文 时间:
2019-01-05 18:13:11
阅读次数:
329