这里的num_units参数并不是指这一层油多少个相互独立的时序lstm,而是lstm单元内部的几个门的参数,这几个门其实内部是一个神经网络,答案来自知乎: ...
分类:
其他好文 时间:
2018-11-04 00:44:27
阅读次数:
498
"github博客传送门" "csdn博客传送门" 本章所需知识: 0. "没有基础的请观看深度学习系列视频" 1. tensorflow 2. Python基础 资料下载链接: "深度学习基础网络模型(mnist手写体识别数据集)" MNIST数据集手写体识别(CNN实现) 最后附上训练截图: ...
分类:
其他好文 时间:
2018-11-03 01:49:00
阅读次数:
242
卷积神经网络(CNN)在语音识别中的应用作者:侯艺馨前言总结目前语音识别的发展现状,dnn、rnn/lstm和cnn算是语音识别中几个比较主流的方向。2012年,微软邓力和俞栋老师将前馈神经网络FFDNN(Feed Forward Deep Neural Network)引入到声学模型建模中,将FF... ...
分类:
其他好文 时间:
2018-11-02 17:18:20
阅读次数:
228
介绍 前几天,某个公众号发文质疑马蜂窝网站,认为它搬运其它网站的旅游点评,对此,马蜂窝网站迅速地做出了回应。相信大多数关注时事的群众已经了解了整个事情的经过,在这里,我们且不论这件事的是是非非,也不关心它是否是通过爬虫等其他技术手段实现的。本文将会展示一种自动生成旅游点评的技 ...
分类:
其他好文 时间:
2018-10-27 23:37:28
阅读次数:
431
循环神经网络与LSTM网络 循环神经网络RNN 循环神经网络广泛地应用在序列数据上面,如自然语言,语音和其他的序列数据上。序列数据是有很强的次序关系,比如自然语言。通过深度学习关于序列数据的算法要比两年前的算法有了很大的提升。由此诞生了很多有趣的应用,比如语音识别,音乐合成,聊天机器人,机器翻译,自 ...
分类:
其他好文 时间:
2018-10-26 22:15:30
阅读次数:
271
摘自https://mp.weixin.qq.com/s?__biz=MzIwMTc4ODE0Mw==&mid=2247486960&idx=1&sn=1b4b9d7ec7a9f40fa8a9df6b6f53bbfb&chksm=96e9d270a19e5b668875392da1d1aaa28ff ...
分类:
其他好文 时间:
2018-10-25 16:26:57
阅读次数:
117
前言 本系列教程为pytorch官网文档翻译。本文对应官网地址: "https://pytorch.org/tutorials/intermediate/char_rnn_generation_tutorial.html" 系列教程总目录传送门: "我是一个传送门" 本系列教程对应的 jupyter ...
分类:
其他好文 时间:
2018-10-24 22:24:33
阅读次数:
225
模型结构 首先是模型图: 传统的注意力机制无法保存多层原始的特征,根据DenseNet的启发,作者将循环网络的隐层的输出与最后一层连接。 另外加入注意力机制,代替原来的卷积。由于最后的特征维度过大,加入AE降维。 Word Representation Layer 层 自然语言的任务首先就是输入层, ...
分类:
其他好文 时间:
2018-10-24 17:46:43
阅读次数:
174
torch.nn.utils.rnn.pack_padded_sequence() 这里的pack,理解成压紧比较好。 将一个 填充过的变长序列 压紧。(填充时候,会有冗余,所以压紧一下) 其中pack的过程为:(注意pack的形式,不是按行压,而是按列压) (下面方框内为PackedSequenc ...
分类:
其他好文 时间:
2018-10-23 00:43:42
阅读次数:
3346
1.seq2seq:分为encoder和decoder a.在decoder中,第一时刻输入的是上encoder最后一时刻的状态,如果用了双向的rnn,那么一般使用逆序的最后一个时刻的输出(网上说实验结果比较好) b.每一时刻都有一个输出,即:[batch_size, decoder_output_ ...
分类:
其他好文 时间:
2018-10-22 01:20:10
阅读次数:
193