搜索关键字：nlp，搜索到935个结果！码迷,mamicode.com！

【机器学习】word2vec

在NLP中，对于把词转为向量的操作，最朴素的想法是one-hot独热编码形式，即一个词占一维向量。但这样有两个缺点： 1）不考虑词与词之间的顺序（文本中词的顺序也很重要） 2）假设词是独立的。例如猫和狗、床和沙发，词之间原本是有不同的亲疏远近关系的 3）得到的特征是稀疏的。如果所有的词各占一维，那么 ...

分类：其他好文时间：2020-06-18 19:26:08 阅读次数：59

【NLP-08】textRNN

目录 textRNN简介 textRNN网络结构总结一句话简介：textRNN指的是利用RNN循环神经网络解决文本分类问题，通常使用LSTM和GRU这种变形的RNN，而且使用双向，两层架构居多。一、textRNN简介这里的文本可以一个句子，文档(短文本，若干句子)或篇章(长文本)，因此每段文... ...

分类：其他好文时间：2020-06-17 01:58:03 阅读次数：72

【NLP-09】textCNN

目录传统的自然语言处理模型 NLP的卷积神经网络（textCNN）卷积层的最大池化问题 testCNN的应用一句话简介：借鉴视觉的CNN用于自然语言处理中，通过不同高度（词数量）的卷积核提取特征，合并池化压缩至分类，优势是速度提升很多。一、传统的自然语言处理模型 1）传统的词袋模型或者连续词... ...

分类：其他好文时间：2020-06-17 01:30:01 阅读次数：70

Docker 安装 Jenkins 的方式

本文实验环境：操作系统：Centos 7.5Docker Version：18.09.6 下载镜像打开终端，输入docker search命令搜索 Docker Hub 上可用的 Jenkins 镜像： $ docker search jenkins NAME DESCRIPTION STARS ...

分类：其他好文时间：2020-06-16 23:44:04 阅读次数：69

【NLP-03】Word2Vec

目录 word2vec 简介 CBOW与Skip-Gram模型优化方法优点 word2vec API讲解三个最常见的应用一句话简述：2013年Google发明，使用跳字节模型（skip-gram）或连续词袋模型（continuous bag of words ，CBOW）训练词向量（初始位o... ...

分类：其他好文时间：2020-06-16 20:35:06 阅读次数：50

【NLP-04】隐含狄利克雷分布(LDA)

目录 LDA概述基础知识 LDA主题模型总结一句话简述：2003年提出的，LDA是一种无监督的词袋式隐含主题模型，LDA给出文档属于每个主题的概率分布，同时给出每个主题上词的概率分布。在文本主题识别、文本分类、文本相似度计算和文章相似推荐等方面都有应用。一、LDA概述在机器学习领域，LDA... ...

分类：其他好文时间：2020-06-16 20:19:05 阅读次数：50

【NLP-06】fastText文本分类算法

目录 fastText概述基础知识 LDA主题模型总结一句话简述：fastText提出了子词嵌入(subword embedding)的方法。是一种监督学习方法。和word2vec 中的CBOW结构很相似。运行速度较快。一、fastText概述 1.1 背景在word2vec中，我们并没有... ...

分类：编程语言时间：2020-06-16 20:14:28 阅读次数：76

【NLP-05】Doc2vec

目录 Doc2vec简介 Doc2vec模型总结一句话简介：doc2vec（又叫Paragraph Vector）是google的两位大牛Quoc Le和Tomas Mikolov在2014年提出的，是一种非监督式算法，可以获得 sentences/paragraphs/documents 的向... ...

分类：其他好文时间：2020-06-16 19:58:41 阅读次数：61

一周论文阅读20200614

Don’t Stop Pretraining: Adapt Language Models to Domains and Tasks 这篇文章研究nlp 的pretrain模型用任务相关的数据进一步预训练效果会更好。结论比较符合直觉，甚至感觉不用研究都能得出这个结论。方法上作者用robert做实验， ...

分类：其他好文时间：2020-06-15 00:02:51 阅读次数：310

使用NLP检测和对抗AI生成的假新闻

作者|MOHD SANAD ZAKI RIZVI 编译|VK 来源|Analytics Vidhya 概述由AI生成的假新闻(神经假新闻)对于我们的社会可能是一个巨大的问题本文讨论了不同的自然语言处理方法，以开发出对神经假新闻的强大防御，包括使用GPT-2检测器模型和Grover（AllenNL ...

分类：其他好文时间：2020-06-14 12:58:59 阅读次数：129

共935条上一页 1 ... 8 9 10 11 12 ... 94 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)