搜索关键字：语言模型，搜索到216个结果！码迷,mamicode.com！

BERT 预训练模型及文本分类

BERT 预训练模型及文本分类介绍如果你关注自然语言处理技术的发展，那你一定听说过 BERT，它的诞生对自然语言处理领域具有着里程碑式的意义。本次试验将介绍 BERT 的模型结构，以及将其应用于文本分类实践。知识点语言模型和词向量 BERT 结构详解 BERT 文本分类 "BERT" 全称为 ...

分类：其他好文时间：2020-02-08 17:37:21 阅读次数：96

《How to Fine-Tune BERT for Text Classification》-阅读心得

文章名《How to Fine-Tune BERT for Text Classification》，2019，复旦大学如何在文本分类中微调BERT模型？摘要：预训练语言模型已经被证明在学习通用语言表示方面有显著效果，作为一种最先进的预训练语言模型，BERT在多项理解任务中取得了惊人的成果。在本 ...

分类：其他好文时间：2020-02-08 15:20:25 阅读次数：228

Knowledge-Augmented Language Model and its Application to Unsupervised Named-Entity Recognition（Facebook AI 2019）文献综述

Knowledge-Augmented Language Model and its Application to Unsupervised Named-Entity Recognition（Facebook AI 2019）文献综述 1.摘要：传统的语言模型无法为文本中的实体名称进行有效建模， ...

分类：移动开发时间：2020-02-08 12:07:04 阅读次数：93

统计语言模型

概念统计语言模型是NLP的基础，是描述自然语言内在的规律的数学模型。广泛应用于各种自然语言处理问题，如语音识别、机器翻译、分词、词性标注等。简单地说，统计语言模型就是给定一个句子W(由多个单词w1,w2,w3...组成)，计算该句子可信(合理)的概率的模型，即$P(W)=P(w_1,w_2,w_ ...

分类：编程语言时间：2020-02-07 16:29:54 阅读次数：63

《Deepening Hidden Representations from Pre-trained Language Models for Natural Language Understanding》-阅读心得

文章名《Deepening Hidden Representations from Pre-trained Language Models for Natural Language Understanding》，2019，单位：上海交大从预训练语言模型中深化语言表示摘要：基于Transforme ...

分类：其他好文时间：2020-02-07 01:29:46 阅读次数：163

《DistilBERT,adistilledversionofBERT:smaller, faster,cheaperandlighter》阅读心得

该文主要采用“知识蒸馏”方法对BERT（预训练语言模型）精简、优化，将较大模型压缩成较小的模型，最终目的是：提高模型推理的效率，让运行在智能手机等硬件设备上的深度学习模型具有轻量级、响应快及能源利用率高等特性。在2019年的NLP领域预训练+微调的模型训练思路百家争鸣，ElMo、GPT、BERT、 ...

分类：其他好文时间：2020-02-03 20:58:10 阅读次数：155

NLP之中文分词cppjieba

jieba简介 jieba库是一个简单实用的中文自然语言处理分词库。 jieba分词属于概率语言模型分词。概率语言模型分词的任务是：在全切分所得的所有结果中求某个切分方案S，使得P(S)最大。 jieba支持三种分词模式：全模式，把句子中所有的可以成词的词语都扫描出来, 速度非常快，但是不能解决歧 ...

分类：其他好文时间：2020-02-02 19:31:12 阅读次数：108

PyTorch基础——词向量（Word Vector）技术

一、介绍内容将接触现代 NLP 技术的基础：词向量技术。第一个是构建一个简单的 N Gram 语言模型，它可以根据 N 个历史词汇预测下一个单词，从而得到每一个单词的向量表示。第二个将接触到现代词向量技术常用的模型 Word2Vec。在实验中将以小说《三体》为例，展示了小语料在 Word2V ...

分类：其他好文时间：2020-01-21 18:33:23 阅读次数：133

算法：N-gram语法

一、N-gram介绍 n元语法（英语：N-gram）指文本中连续出现的n个语词。n元语法模型是基于(n - 1)阶马尔可夫链的一种概率语言模型，通过n个语词出现的概率来推断语句的结构。这一模型被广泛应用于概率论、通信理论、计算语言学（如基于统计的自然语言处理NLP）、计算生物学（如序列分析）、数据压 ...

分类：编程语言时间：2020-01-11 22:41:14 阅读次数：173

常见统计模型

统计语言模型抽取概率：在一个文档DOC中随机抽取了一个词Word，被抽中的概率。用户搜索W1、W2，W1在Doc1中的抽取概率为1%，W2的抽取概率为2%，则本次搜索中，Doc1的相关性的分为1% 2%，依次可以计算出所有文档的相关性得分，并按相关性对搜索结果进行排序。特点：与BM25效果 ...

分类：其他好文时间：2020-01-08 14:32:19 阅读次数：110

共216条上一页 1 2 3 4 5 6 ... 22 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)