隐马尔可夫模型(Hidden Markov Model,HMM) 最初由 L. E. Baum 和其它一些学者发表在一系列的统计学论文中,随后在语言识别,自然语言处理以及生物信息等领域体现了很大的价值。平时,经常能接触到涉及HMM的相关文章,一直没有仔细研究过,都是蜻蜓点水,因此,想花一点时间梳理下...
分类:
其他好文 时间:
2015-01-09 12:05:06
阅读次数:
193
正态分布神说,要有正态分布,就有了正态分布。 神看正态分布是好的,就让随机误差服从了正态分布。 创世纪—数理统计1. 正态分布,熟悉的陌生人学过基础统计学的同学大都对正态分布非常熟悉。这个钟形的分布曲线不但形状优雅,它对应的密度函数写成数学表达式f(x)=12π??√σe?(x?μ)22σ2也非常具...
分类:
其他好文 时间:
2015-01-09 10:30:02
阅读次数:
330
数学大神、统计学大神和数据挖掘推荐大神请关注。一、数学期望的理解 早些时候,法国有两个大数学家,一个叫做布莱士·帕斯卡,一个叫做费马。帕斯卡认识两个赌徒,这两个赌徒向他提出了一个问题。他们说,他俩下赌金之后,约定谁先赢满5局,谁就获得全部赌金。赌了半天,A赢了4局,B赢了3局,时间很晚了,他们都不....
分类:
编程语言 时间:
2015-01-08 21:34:42
阅读次数:
288
在科学研究中最重要的两种思维范式是“简化”和“还原”,所谓“简化”是指人依据不太复杂的,可理解的规律认识世界;所谓“还原”是指任何复杂的现象归根结底可以由若干简单的机制解释。各种统计分布族就是统计学中“简化”思维抽象的结果,统计学家用特定的统计分布和统计分布的组合近似地解释现实中复杂的随机现象。.....
分类:
其他好文 时间:
2015-01-08 12:56:32
阅读次数:
178
数据变异性变异性(散布或许离散度)可被看着是对不同数值之间的差异性测量,如果把变异性看着是每个数值与特定值的差异程度会更准确,一般情况下,这个"特定值"就指均值!7,6,3,3,1 3,4,4,5,4 4,4,4,4,4均值都是4,但是变异性依次降低,最后一组数据根本没有变异性.变异性的三种量数极差...
分类:
其他好文 时间:
2015-01-07 16:19:58
阅读次数:
110
众数众数就是出现次数最多的数值,没有众数:如果数据分布中每一个数值出现的次数都相同多峰分布:如果多个数值出现的频度相同,那么这个数据分布就是多峰分布双峰分布:如果数据集是有两个众数,如果众数相当接近但是不玩全相同,比如某数据集中有1000个黑人和999个白人,则众数为黑人和白人,数据呈双峰分布.问题...
分类:
其他好文 时间:
2015-01-07 12:29:10
阅读次数:
142
1. 什么是统计学,统计学是收集、分析、表述和解释数据的科学1.1 描述统计常用于整理,描述所搜集数据的特征(如,根据一个班的学生成绩表,得出班级的平均成绩)1.2 推论统计通常是数据收集汇总后的下一步,推论统计常利用较小群体的数据(如一部分学生)来推论较大的群体(如艺术类所有学生)的特征.2. 均...
分类:
其他好文 时间:
2015-01-06 19:45:37
阅读次数:
144
第二章引入了两个重要问题,随机变量的期望和随机变量的变换。期望又引申出“矩”的概念,矩是统计学理论分析的一个重要关键词,而随机变量的变换是研究复杂统计现象的重要工具。下面是这一章的思维导图
分类:
其他好文 时间:
2015-01-06 11:25:30
阅读次数:
279
现在Mayuyu会以一个例子来说明R语言在统计学中的应用。模拟一个高中学生语数外三科的成绩单。
首先认识两个重要的函数,source()和print(),source()函数是用来运行R脚本的,一个R脚本保存为test.R,
在R交互式环境下通过source("test.R")来运行,print()函数打印结果。
首先每一个学生有一个学号,通过如下方式生成...
分类:
编程语言 时间:
2014-12-29 15:25:03
阅读次数:
284
从今天开始,Mayuyu将要学习一门新的语言,这门语言叫做Julia,为什么要学习它呢? 因为它比较优秀啊!
Julia语言设计的目的就是让高性能科学计算为人人所用,它集合很多语言的优点于一身,有C的快速,有Ruby的动态,有Python的通用,有R的在统计学上的得心应手,有Perl的字符串处理,有MatLab的线性代数运算,总之有很多优点,更多了解参考:http://www.csdn.n...
分类:
编程语言 时间:
2014-12-27 20:31:23
阅读次数:
323