码迷,mamicode.com
首页 >  
搜索关键字:语言模型    ( 216个结果
BERT 预训练模型及文本分类
BERT 预训练模型及文本分类 介绍 如果你关注自然语言处理技术的发展,那你一定听说过 BERT,它的诞生对自然语言处理领域具有着里程碑式的意义。本次试验将介绍 BERT 的模型结构,以及将其应用于文本分类实践。 知识点 语言模型和词向量 BERT 结构详解 BERT 文本分类 "BERT" 全称为 ...
分类:其他好文   时间:2020-02-08 17:37:21    阅读次数:96
《How to Fine-Tune BERT for Text Classification》-阅读心得
文章名《How to Fine-Tune BERT for Text Classification》,2019,复旦大学 如何在文本分类中微调BERT模型? 摘要:预训练语言模型已经被证明在学习通用语言表示方面有显著效果,作为一种最先进的预训练语言模型,BERT在多项理解任务中取得了惊人的成果。在本 ...
分类:其他好文   时间:2020-02-08 15:20:25    阅读次数:228
Knowledge-Augmented Language Model and its Application to Unsupervised Named-Entity Recognition(Facebook AI 2019) 文献综述
Knowledge-Augmented Language Model and its Application to Unsupervised Named-Entity Recognition(Facebook AI 2019) 文献综述 1.摘要: 传统的语言模型无法为文本中的实体名称进行有效建模, ...
分类:移动开发   时间:2020-02-08 12:07:04    阅读次数:93
统计语言模型
概念 统计语言模型是NLP的基础,是描述自然语言内在的规律的数学模型。广泛应用于各种自然语言处理问题,如语音识别、机器翻译、分词、词性标注等。 简单地说,统计语言模型就是给定一个句子W(由多个单词w1,w2,w3...组成),计算该句子可信(合理)的概率的模型,即$P(W)=P(w_1,w_2,w_ ...
分类:编程语言   时间:2020-02-07 16:29:54    阅读次数:63
《Deepening Hidden Representations from Pre-trained Language Models for Natural Language Understanding》-阅读心得
文章名《Deepening Hidden Representations from Pre-trained Language Models for Natural Language Understanding》,2019,单位:上海交大 从预训练语言模型中深化语言表示 摘要:基于Transforme ...
分类:其他好文   时间:2020-02-07 01:29:46    阅读次数:163
《DistilBERT,adistilledversionofBERT:smaller, faster,cheaperandlighter》阅读心得
该文主要采用“知识蒸馏”方法对BERT(预训练语言模型)精简、优化,将较大模型压缩成较小的模型,最终目的是:提高模型推理的效率,让运行在智能手机等硬件设备上的深度学习模型具有轻量级、响应快及能源利用率高等特性。 在2019年的NLP领域预训练+微调的模型训练思路百家争鸣,ElMo、GPT、BERT、 ...
分类:其他好文   时间:2020-02-03 20:58:10    阅读次数:155
NLP之中文分词cppjieba
jieba简介 jieba库是一个简单实用的中文自然语言处理分词库。 jieba分词属于概率语言模型分词。概率语言模型分词的任务是:在全切分所得的所有结果中求某个切分方案S,使得P(S)最大。 jieba支持三种分词模式: 全模式,把句子中所有的可以成词的词语都扫描出来, 速度非常快,但是不能解决歧 ...
分类:其他好文   时间:2020-02-02 19:31:12    阅读次数:108
PyTorch基础——词向量(Word Vector)技术
一、介绍 内容 将接触现代 NLP 技术的基础:词向量技术。 第一个是构建一个简单的 N Gram 语言模型,它可以根据 N 个历史词汇预测下一个单词,从而得到每一个单词的向量表示。 第二个将接触到现代词向量技术常用的模型 Word2Vec。在实验中将以小说《三体》为例,展示了小语料在 Word2V ...
分类:其他好文   时间:2020-01-21 18:33:23    阅读次数:133
算法:N-gram语法
一、N-gram介绍 n元语法(英语:N-gram)指文本中连续出现的n个语词。n元语法模型是基于(n - 1)阶马尔可夫链的一种概率语言模型,通过n个语词出现的概率来推断语句的结构。这一模型被广泛应用于概率论、通信理论、计算语言学(如基于统计的自然语言处理NLP)、计算生物学(如序列分析)、数据压 ...
分类:编程语言   时间:2020-01-11 22:41:14    阅读次数:173
常见统计模型
统计语言模型 抽取概率 :在一个文档DOC中随机抽取了一个词Word,被抽中的概率。 用户搜索W1、W2,W1在Doc1中的抽取概率为1%,W2的抽取概率为2%,则本次搜索中,Doc1的相关性的分为1% 2%,依次可以计算出所有文档的相关性得分,并按相关性对搜索结果进行排序。 特点 :与BM25效果 ...
分类:其他好文   时间:2020-01-08 14:32:19    阅读次数:110
216条   上一页 1 2 3 4 5 6 ... 22 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!