码迷,mamicode.com
首页 >  
搜索关键字:词向量    ( 222个结果
BERT
首先使用bert获取词向量bert-as-service 1.安装Bert-as-Service pip install bert-serving-server # server pip install bert-serving-client # client, independent of `be ...
分类:其他好文   时间:2021-06-02 16:44:56    阅读次数:0
使用微调后的Bert模型做编码器进行文本特征向量抽取
通常,我们使用bert做文本分类,泛化性好、表现优秀。在进行文本相似性计算任务时,往往是对语料训练词向量,再聚合文本向量embedding数据,计算相似度;但是,word2vec是静态词向量,表征能力有限,此时,可以用已进行特定环境下训练的bert模型,抽取出cls向量作为整个句子的表征向量以供下游 ...
分类:其他好文   时间:2021-04-15 12:20:10    阅读次数:0
简介GloVe词向量:推导、实现、应用
零、Introduction类似于word2vec,GloVe也是一种词向量训练方法,改进如下:能够更好的利用全局统计量,训练速度更快仍然保留了局部窗口共现信息,语义效果略好于word2vec接下来,我会简要介绍GloVe模型的推导、PyTorch实现、使用方法一、推导原文提到了两种推导思路:一是【用词向量点积去拟合共现概率比】,二是【逐步改良SkipGram】;分别介绍如下直接拟合概率比首先定义
分类:其他好文   时间:2020-12-19 12:27:01    阅读次数:1
Fasttext模型总结
Fasttext模型结构 左图是Fasttext,右图是CBOW,可以看出Fasttext模型与CBOW的模型结构有点像,都有输入层、隐藏层、输出层,但二者还是有挺大区别的,二者的区别如下: 输入层: CBOW:输入的是每个词的One-hot向量; Fasttext:输入的是每个词的词嵌入向量。 隐 ...
分类:其他好文   时间:2020-11-30 15:26:24    阅读次数:2
【TF-IDF】传统方法TF-IDF解决短文本相似度问题
机器学习算法与自然语言处理出品@公众号原创专栏作者刘聪NLP学校|中国药科大学药学信息学硕士知乎专栏|自然语言处理相关论文前几天写了一篇短文本相似度算法研究的文章,不过里面介绍的方法基本上都是基于词向量生成句子向量的方法。今天在这里就介绍一下传统算法TF-IDF是如何计算短文本相似度的。TF-IDF是英文TermFrequency–InverseDocumentFrequency的缩写,中文叫做词
分类:其他好文   时间:2020-11-25 12:59:04    阅读次数:10
【目录】NLP相关理论及应用
工业界nlp相关的实际应用和框架 目录: Word2Vec词向量简述 word2vec模型训练简单案例 tf-idf、朴素贝叶斯的短文本分类简述 tensorflow文本分类实战——卷积神经网络CNN word2vec+textcnn文本分类简述及代码(包含中文文本分类实战) 使用inception ...
分类:其他好文   时间:2020-11-08 17:02:05    阅读次数:20
多线程提速
对于请求反馈使用线程来提速 """ Function: get similarity query Author: dengyx DateTime: 20201019 """ import jieba import time import tqdm import threading import qu ...
分类:编程语言   时间:2020-10-22 22:46:19    阅读次数:27
NLP——天池新闻文本分类 Task4:fasttext深度学习
NLP——新闻文本分类:TASK3 深度学习Fasttext Fasttext是一种深度学习词向量的表示方法,它是一种三层神经网络,包含输入层,隐含层和输出层。 模型架构:fastText 模型输入一个词的序列(一段文本或者一句话),输出这个词序列属于不同类别的概率。序列中的词和词组组成特征向量,特 ...
分类:其他好文   时间:2020-07-28 00:21:27    阅读次数:93
PyTorch在NLP任务中使用预训练词向量
1. 例子 import numpy as np import torch from torch import nn, optim from torchtext import data, datasets import numpy as np import torch from torch impo ...
分类:其他好文   时间:2020-07-25 09:23:34    阅读次数:111
【文本分类-04】BiLSTM
目录 大纲概述 数据集合 数据处理 预训练word2vec模型 一、大纲概述 文本分类这个系列将会有8篇左右文章,从github直接下载代码,从百度云下载训练数据,在pycharm上导入即可使用,包括基于word2vec预训练的文本分类,与及基于近几年的预训练模型(ELMo,BERT等)的文本分类。... ...
分类:其他好文   时间:2020-07-22 23:29:32    阅读次数:73
222条   1 2 3 4 ... 23 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!