自然语言从产生开始,逐渐演变为一种基于上下文相关的信息表达和传递方式,在计算机处理自然语言时,一个最基本的问题就是为自然语言上下文相关的特性建立数学模型,叫做统计语言模型(Statistical Language Model),它是自然语言处理的基础,广泛应用于机器翻译、语音识别、印刷体或手写体识别、拼音纠错、汉字输入和文献查询等。
对于一句通顺的话,如果改变一些词的顺序,或替换掉一些词,它的意...
分类:
编程语言 时间:
2015-08-06 22:26:55
阅读次数:
282
贝叶斯分类是一类分类算法的总称,这类算法均以贝叶斯定理为基础,故统称为贝叶斯分类,而朴素贝叶斯分类可谓是里面最简单、入门的一种。首先关于贝叶斯定理,感觉简单而伟大,前些天一直在看吴军的数学之美(没看过的极力推荐)系列文章,看到自然语言处理从规则模型到统计模型转变的时候,语言的识别准确率上升好几个等级,以至于今天的语言识别到达很强大的地步,同时对于搜索引擎,网页搜索的准确率,也上升好多。这其中的最最重...
分类:
编程语言 时间:
2015-08-05 12:51:53
阅读次数:
250
入门书单《数学之美》PDF作者吴军大家都很熟悉。以极为通俗的语言讲述了数学在机器学习和自然语言处理等领域的应用。《Programming Collective Intelligence》(《集体智慧编程》)PDF作者Toby Segaran也是《BeautifulData : The Stories...
分类:
其他好文 时间:
2015-08-04 09:18:36
阅读次数:
118
原文Example1:给出下面的一个图:(来自Mackey的书)问:大树背后有多少个箱子?其实,答案肯定是有很多的,一个,两个,乃至N箱子都是有可能的(比如说后面有一连排的箱子,排成一条直线),我们只能看到第一个:但是,最正确,也是最合理的解释,就是一个箱子,因为如果大树背后有两个乃至多个箱子,为什...
分类:
其他好文 时间:
2015-07-23 15:21:08
阅读次数:
89
一直听闻Logistic Regression逻辑回归的大名,比如吴军博士在《数学之美》中提到,Google是利用逻辑回归预测搜索广告的点击率。因为自己一直对个性化广告感兴趣,于是疯狂google过逻辑回归的资料,但没有一个网页资料能很好地讲清到底逻辑回归是什么。幸好,在CS229第三节课介绍了逻辑...
分类:
其他好文 时间:
2015-07-16 16:22:02
阅读次数:
268
数学之美--上对人工神经网络的通俗解释很形象:0. 分类神经网络最重要的用途是分类,为了让大家对分类有个直观的认识,咱们先看几个例子:垃圾邮件识别:现在有一封电子邮件,把出现在里面的所有词汇提取出来,送进一个机器里,机器需要判断这封邮件是否是垃圾邮件。疾病判断:病人到医院去做了一大堆肝功、尿检测验,...
分类:
其他好文 时间:
2015-07-12 17:14:38
阅读次数:
118
吴军的这本数学之美从google黑板报到实体书出版应该说一直都是比较火的,吴军博士作为早期加入google的那帮人,一直在搞搜索引擎的方向,除了本身是大牛还跟很多大牛一起共事过,眼界、见识、思维高度也不是一般人能比的。下面是一些凌乱的总结。 1.整个信息论的基础就是数学。如果往更远看,我们自然...
分类:
其他好文 时间:
2015-06-28 06:23:50
阅读次数:
138
http://www.zhihu.com/question/19895141stanford NLP课程网址https://class.coursera.org/nlp/lecture14 个回答赞同337反对,不会显示你的姓名吴俣,自然语言处理民工杨泽、林斌、王汪汪等人赞同推荐《数学之美》,这个书...
分类:
编程语言 时间:
2015-06-22 22:13:44
阅读次数:
289
入门书单《数学之美》PDF作者吴军大家都很熟悉。以极为通俗的语言讲述了数学在机器学习和自然语言处理等领域的应用。《Programming Collective Intelligence》(《集体智慧编程》)PDF作者Toby Segaran也是《BeautifulData : The Stories...
分类:
其他好文 时间:
2015-06-17 20:05:03
阅读次数:
167
入门书单《数学之美》PDF作者吴军大家都很熟悉。以极为通俗的语言讲述了数学在机器学习和自然语言处理等领域的应用。《Programming Collective Intelligence》(《集体智慧编程》)PDF作者Toby Segaran也是《BeautifulData : The Stories...
分类:
其他好文 时间:
2015-06-17 11:12:14
阅读次数:
153