码迷,mamicode.com
首页 >  
搜索关键字:nlp    ( 935个结果
【机器学习】word2vec
在NLP中,对于把词转为向量的操作,最朴素的想法是one-hot独热编码形式,即一个词占一维向量。但这样有两个缺点: 1)不考虑词与词之间的顺序(文本中词的顺序也很重要) 2)假设词是独立的。例如猫和狗、床和沙发,词之间原本是有不同的亲疏远近关系的 3)得到的特征是稀疏的。如果所有的词各占一维,那么 ...
分类:其他好文   时间:2020-06-18 19:26:08    阅读次数:59
【NLP-08】textRNN
目录 textRNN简介 textRNN网络结构 总结 一句话简介:textRNN指的是利用RNN循环神经网络解决文本分类问题,通常使用LSTM和GRU这种变形的RNN,而且使用双向,两层架构居多。 一、textRNN简介 这里的文本可以一个句子,文档(短文本,若干句子)或篇章(长文本),因此每段文... ...
分类:其他好文   时间:2020-06-17 01:58:03    阅读次数:72
【NLP-09】textCNN
目录 传统的自然语言处理模型 NLP的卷积神经网络(textCNN) 卷积层的最大池化问题 testCNN的应用 一句话简介:借鉴视觉的CNN用于自然语言处理中,通过不同高度(词数量)的卷积核提取特征,合并池化压缩至分类,优势是速度提升很多。 一、传统的自然语言处理模型 1)传统的词袋模型或者连续词... ...
分类:其他好文   时间:2020-06-17 01:30:01    阅读次数:70
Docker 安装 Jenkins 的方式
本文实验环境: 操作系统:Centos 7.5Docker Version:18.09.6 下载镜像 打开终端,输入docker search命令搜索 Docker Hub 上可用的 Jenkins 镜像: $ docker search jenkins NAME DESCRIPTION STARS ...
分类:其他好文   时间:2020-06-16 23:44:04    阅读次数:69
【NLP-03】Word2Vec
目录 word2vec 简介 CBOW与Skip-Gram模型 优化方法 优点 word2vec API讲解 三个最常见的应用 一句话简述:2013年Google发明,使用跳字节模型(skip-gram)或连续词袋模型(continuous bag of words ,CBOW)训练词向量(初始位o... ...
分类:其他好文   时间:2020-06-16 20:35:06    阅读次数:50
【NLP-04】隐含狄利克雷分布(LDA)
目录 LDA概述 基础知识 LDA主题模型 总结 一句话简述:2003年提出的,LDA是一种无监督的词袋式隐含主题模型,LDA给出文档属于每个主题的概率分布,同时给出每个主题上词的概率分布。在文本主题识别、文本分类、文本相似度计算和文章相似推荐等方面都有应用。 一、LDA概述 在机器学习领域,LDA... ...
分类:其他好文   时间:2020-06-16 20:19:05    阅读次数:50
【NLP-06】fastText文本分类算法
目录 fastText概述 基础知识 LDA主题模型 总结 一句话简述:fastText提出了子词嵌入(subword embedding)的方法。是一种监督学习方法。和word2vec 中的CBOW结构很相似。运行速度较快。 一、fastText概述 1.1 背景 在word2vec中,我们并没有... ...
分类:编程语言   时间:2020-06-16 20:14:28    阅读次数:76
【NLP-05】Doc2vec
目录 Doc2vec简介 Doc2vec模型 总结 一句话简介:doc2vec(又叫Paragraph Vector)是google的两位大牛Quoc Le和Tomas Mikolov在2014年提出的,是一种非监督式算法,可以获得 sentences/paragraphs/documents 的向... ...
分类:其他好文   时间:2020-06-16 19:58:41    阅读次数:61
一周论文阅读20200614
Don’t Stop Pretraining: Adapt Language Models to Domains and Tasks 这篇文章研究nlp 的pretrain模型用任务相关的数据进一步预训练效果会更好。结论比较符合直觉,甚至感觉不用研究都能得出这个结论。方法上作者用robert做实验, ...
分类:其他好文   时间:2020-06-15 00:02:51    阅读次数:310
使用NLP检测和对抗AI生成的假新闻
作者|MOHD SANAD ZAKI RIZVI 编译|VK 来源|Analytics Vidhya 概述 由AI生成的假新闻(神经假新闻)对于我们的社会可能是一个巨大的问题 本文讨论了不同的自然语言处理方法,以开发出对神经假新闻的强大防御,包括使用GPT-2检测器模型和Grover(AllenNL ...
分类:其他好文   时间:2020-06-14 12:58:59    阅读次数:129
935条   上一页 1 ... 8 9 10 11 12 ... 94 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!