深度学习(NLP) LTR(Learn to Rank) 机器学习 boostting与随机森林 EM算法 LDA算法 协同过滤算法 聚类算法简述 ...
分类:
其他好文 时间:
2017-09-03 16:38:06
阅读次数:
125
模型聚类 mclust::Mclust RWeka::Cobweb mclust::Mclust EM算法也称为期望最大化算法,在是使用该算法聚类时,将数据集看作一个有隐形变量的概率模型,并实现模型最优化,即获取与数据本身性质最契合的聚类方式为目的,通过‘反复估计’模型参数找出最优解,同时给出相应的 ...
分类:
编程语言 时间:
2017-08-18 00:05:55
阅读次数:
421
最近学习基础算法《统计学习方法》,看到利用EM算法估计高斯混合模型(GMM)的时候,发现利用贝叶斯的来理解高斯混合模型的应用其实非常合适。 首先,假设我们对于贝叶斯比较熟悉,对高斯分布也熟悉。本文将GMM用于聚类来举例。 除了简单的高斯分布,理论上通过组合多个不同的高斯分布可以构成任意复杂的分布函数 ...
分类:
其他好文 时间:
2017-08-09 16:49:39
阅读次数:
221
#coding:utf-8 import math import copy import numpy as np import matplotlib.pyplot as plt isdebug = True #指定k个高斯分布參数,这里指定k=2。 #注意2个高斯分布具有同样方差Sigma。均值分别 ...
分类:
编程语言 时间:
2017-08-05 14:55:06
阅读次数:
210
I. 牛顿迭代法给定一个复杂的非线性函数f(x),希望求它的最小值,我们一般可以这样做,假定它足够光滑,那么它的最小值也就是它的极小值点,满足f′(x0)=0,然后可以转化为求方程f′(x)=0的根了。非线性方程的根我们有个牛顿法,所以 然而,这种做法脱离了几何意义,不能让我们窥探到更多的秘密。我们 ...
分类:
编程语言 时间:
2017-08-02 19:05:04
阅读次数:
469
名称 bwa – Burrows-Wheeler Alignment Tool 内容摘要描述命令行与选项SAM 比对格式短序列比对注意事项 比对精确性 估计插入大小分布 内存需求 速度Bwa-0.6中的改变其他作者引用与授权历史 摘要 b w a i n d e x r e f . f ab w a ...
分类:
其他好文 时间:
2017-07-09 12:37:48
阅读次数:
934
EM算法的简明实现 当然是教学用的简明实现了,这份实现是针对双硬币模型的。 双硬币模型 假设有两枚硬币A、B,以相同的概率随机选择一个硬币,进行如下的抛硬币实验:共做5次实验,每次实验独立的抛十次,结果如图中a所示,例如某次实验产生了H、T、T、T、H、H、T、H、T、H,H代表正面朝上。 假设试验 ...
分类:
其他好文 时间:
2017-07-04 21:39:05
阅读次数:
262
摘自:https://www.zhihu.com/question/27976634 简单说一下为什么要用EM算法 现在一个班里有50个男生,50个女生,且男生站左,女生站右。我们假定男生的身高服从正态分布 ,女生的身高则服从另一个正态分布: 。这时候我们可以用极大似然法(MLE),分别通过这50个 ...
分类:
编程语言 时间:
2017-06-20 18:02:46
阅读次数:
130
初始目的 将样本分成K个类,其实说白了就是求一个样本例的隐含类别y,然后利用隐含类别将x归类。由于我们事先不知道类别y,那么我们首先可以对每个样例假定一个y吧,但是怎么知道假定的对不对呢?怎样评价假定的好不好呢? 我们使用样本的极大似然估计来度量,这里就是x和y的联合分布P(x,y)了。如果找到的y ...
分类:
编程语言 时间:
2017-06-19 22:15:35
阅读次数:
239
情感分析,我研究了也有半年有余了,号称看遍ACL上关于情感分析的论文,但是到目前还没有什么成就的。以下是我为一位同学毕业设计写的情感分析方面的综述,引用的论文基本上是ACL和COLING还有EMNLP上历年关于情感分析的论文. ...
分类:
其他好文 时间:
2017-06-12 19:43:26
阅读次数:
208