码迷,mamicode.com
首页 >  
搜索关键字:语言模型    ( 216个结果
[转] N-Gram模型
原文链接:http://www.cnblogs.com/chaosimple/p/3376438.htmlN-Gram模型时大词汇连续语音识别中常用的一种语言模型,对中文而言,我们称之为汉语语言模型(CLM, Chinese Language Model)。汉语语言模型利用上下文中相邻词间的搭配信息...
分类:其他好文   时间:2016-01-13 19:37:36    阅读次数:135
CSC321 神经网络语言模型 RNN-LSTM
主要两个方面 Probabilistic modeling 概率建模,神经网络模型尝试去预测一个概率分布 Cross-entropy作为误差函数使得我们可以对于观测到的数据 给予较高的概率值 同时可以解决saturation的问题 前面提到的线性隐层的降维作用(减少训练参数) 这是一个最初版的神经网...
分类:编程语言   时间:2015-12-16 21:16:45    阅读次数:1080
基于并行化的神经网络和复旦中文语料库,构建中文概率语言模型
本文旨在基于复旦中文语料库和神经网络模型构建中文的概率语言模型。 统计语言模型的一个目标是找到句子中不同词汇的联合分布,也就是找到一个单词序列出现的概率,一个训练好的统计语言模型可以被应用于语音识别、中文输入法、机器翻译等领域。在神经网络方法被提出之前,一个非常成功的构建语言模型的方法是 n-...
分类:编程语言   时间:2015-12-04 00:42:27    阅读次数:983
N-gram统计语言模型(总结)
N-gram统计语言模型1.统计语言模型自然语言从它产生開始,逐渐演变成一种上下文相关的信息表达和传递的方式。因此让计算机处理自然语言。一个主要的问题就是为自然语言这样的上下文相关特性建立数学模型。这个数学模型就是自然语言处理中常说的统计语言模型,它是今天全部自然语言处理的基础,而且广泛应用与机器翻...
分类:编程语言   时间:2015-10-26 10:25:21    阅读次数:6175
[IR课程笔记]统计语言模型
Basic idea 1.一个文档(document)只有一个主题(topic) 2.主题指的是这个主题下文档中词语是如何出现的 3.在某一主题下文档中经常出现的词语,这个词语在这个主题中也是经常出现的。 4.在某一主题下文档中不经常出现的词语,这个词语在这个主题中也是不经常出现的。 5.由...
分类:编程语言   时间:2015-10-18 14:08:15    阅读次数:328
主题模型之潜在语义分析(Latent Semantic Analysis)
主题模型(Topic Models)是一套试图在大量文档中发现潜在主题结构的机器学习模型,主题模型通过分析文本中的词来发现文档中的主题、主题之间的联系方式和主题的发展。通过主题模型可以使我们组织和总结无法人工标注的海量电子文档。较早的主题模型有混合语言模型(Mixture of Unigram),潜...
分类:其他好文   时间:2015-09-17 09:57:44    阅读次数:462
[sphinx]中文语言模型训练
一,不用分词的短词组语言模型训练参考资源:http://cmusphinx.sourceforge.net/wiki/tutoriallm sphinx官方教程 1)文本准备 生成文本文件,内含一行一个的单词。头尾有 标记,如下所示,其中单词前后都有空格。文件为utf-8格式,文件名为test.t....
分类:编程语言   时间:2015-09-15 18:12:38    阅读次数:827
Sparql语言模型(一)
在进行RDF数据查询或描述的时候,Sparql无论从出身、标准抑或操作习惯上都是一个不错的选择,然而对于一个初学者来说多多少少有些“禁忌”的意味,操作起来也有点畏首畏尾,所以正好利用这段时间进行语言的总结与学习,顺道对语言特性进行一一破解。 简单查询 1、总决式(基本要诀) select  ?o  where {       s p ?o } 破法:类SQL讲究选择映射,同时spa...
分类:编程语言   时间:2015-08-09 15:38:47    阅读次数:126
读《数学之美》第三章 统计语言模型
自然语言从产生开始,逐渐演变为一种基于上下文相关的信息表达和传递方式,在计算机处理自然语言时,一个最基本的问题就是为自然语言上下文相关的特性建立数学模型,叫做统计语言模型(Statistical Language Model),它是自然语言处理的基础,广泛应用于机器翻译、语音识别、印刷体或手写体识别、拼音纠错、汉字输入和文献查询等。 对于一句通顺的话,如果改变一些词的顺序,或替换掉一些词,它的意...
分类:编程语言   时间:2015-08-06 22:26:55    阅读次数:282
Deep Learning for Nature Language Processing --- 第八讲
Current statistical machine translation systems源语言:法语目标语言:英语概率公式(利用贝叶斯定理):在平行语料库(parallel corpora)上训练翻译模型p(f|e)在英语语料库上训练语言模型p(e)Step1: Alignment目标:将源语言中的单词或者短语匹配到正确的目标语言中的单词或者短语假如匹配好了单词和短语,那么又如何给这些单词和短...
分类:其他好文   时间:2015-08-01 22:04:49    阅读次数:157
216条   上一页 1 ... 14 15 16 17 18 ... 22 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!