ENSEMBLE: ensemble methods(组合方法)机器学习里面指几种算法的组合在一起的方法。也叫融合学习,集合方法等。 WORD2VEL:word embeddings“词向量”,将自然语言中的字词转为计算机可以理解的稠密向量(Dense Vector)。 RESCALING:再缩放, ...
分类:
其他好文 时间:
2018-09-22 21:54:38
阅读次数:
234
文章1 Generative and Discriminative Text Classification with Recurrent Neural Networks 时间:2017 机构:Google DeepMind 生成模型:generative 判别模型:discrimination 作者 ...
分类:
其他好文 时间:
2018-09-08 17:40:43
阅读次数:
337
Word2Vec 词向量的稠密表达形式(无标签语料库训练) Word2vec中要到两个重要的模型,CBOW连续词袋模型和Skip-gram模型。两个模型都包含三层:输入层,投影层,输出层。 1.Skip-Gram神经网络模型(跳过一些词) skip-gram模型的输入是一个单词wI,它的输出是wI的 ...
分类:
其他好文 时间:
2018-09-06 23:06:01
阅读次数:
315
参考论文: GloVe: Global Vectors forWord Representation 参考博客:https://blog.csdn.net/coderTC/article/details/73864097 理解GloVe模型: glove 模型类似于word2vec模型,都是一种词的 ...
分类:
其他好文 时间:
2018-09-06 23:01:54
阅读次数:
242
特征分类 对特征进行分类,对于不同的特征应该有不同的处理方法。 根据不同的分类方法,可以将特征分为 (1)Low level特征和High level特征。 Low level特征——较低级别的特征,主要是原始特征,不需要或者需要非常少的人工处理和干预。 例如文本特征中的词向量特征,图像特征中的像素 ...
分类:
其他好文 时间:
2018-09-05 21:46:36
阅读次数:
228
word2vec的学习 python的几个扩展工具: 1. numpy 2. scipy 3. gensim word2vec的学习 python的几个扩展工具: 1. numpy 2. scipy 3. gensim 如何对新闻的关键词进行聚类?比如说,给你一个关键词“苍井空”,你怎么把“女优”, ...
分类:
其他好文 时间:
2018-08-21 10:55:00
阅读次数:
117
导读 最近在做中文词向量相关工作,其中看了一些中文词向量的相关论文,在这篇文章,将把近几年的中文词向量进展及其模型结构加以简述,大概要写3 4篇综述,每篇包含2 3篇论文。续 "中文词向量论文综述(二)" 。 一、Learning Chinese Word Representations From ...
分类:
其他好文 时间:
2018-08-16 10:34:35
阅读次数:
327
在word2vec之前所有的词汇表示都是用onehot表示类似man这个单词如下表示他把每个词语孤立起来,该网络如果想在下面一个句子中填入一个单词,就不会根据apple联想到orange所以就希望能够使用向量化的方式来表示单词:这样Apple和Orange就会有相似的地方,在这个特征空间内会距离比较近。而且还有这样的特性:如何学习到这个词嵌入矩阵:我们建立一个神经网络像上图那样用前面几个词预测后面
分类:
其他好文 时间:
2018-08-14 11:20:38
阅读次数:
106
一、概述 在上一篇中,我们介绍了Word2Vec即词向量,对于Word Embeddings即词嵌入有了些基础,同时也阐述了Word2Vec算法的两个常见模型 :Skip-Gram模型和CBOW模型,本篇会对两种算法做出比较分析并给出其扩展模型-GloVe模型。 首先,我们将比较下原Skip-gra ...
分类:
编程语言 时间:
2018-08-11 21:54:04
阅读次数:
302
写在前面的话(可略过): 一直想写下、整理下利用Tensorflow或Keras工具进行自然语言处理(NLP)方面的文章,对比和纠结了一段时间,发现博众家之长不如静下心来一步一个脚印地去看一本书来得更实在,虽然慢但是心里相对踏实些。近期刚把Thushan Ganegedara写的《Natural L ...
分类:
编程语言 时间:
2018-08-08 19:29:08
阅读次数:
221