课程引用自伯禹平台:https://www.boyuai.com/elites/course/cZu18YmweLv10OeV 《动手学深度学习》官方网址:http://zh.gluon.ai/ ——面向中文读者的能运行、可讨论的深度学习教科书。 task2:文本预处理;语言模型;循环神经网络基础 ...
分类:
编程语言 时间:
2020-02-14 20:48:41
阅读次数:
77
循环神经网络的构造 假设$\boldsymbol{X}_t \in \mathbb{R}^{n \times d}$是时间步$t$的小批量输入,$\boldsymbol{H}_t \in \mathbb{R}^{n \times h}$是该时间步的隐藏变量,则: $$ \boldsymbol{H}_ ...
分类:
其他好文 时间:
2020-02-13 18:59:06
阅读次数:
73
1.语言模型 假设序列$w_1, w_2, \ldots, w_T$中的每个词是依次生成的,我们有 $$ \begin{align } P(w_1, w_2, \ldots, w_T) &= \prod_{t=1}^T P(w_t \mid w_1, \ldots, w_{t 1})\\ &= P( ...
分类:
编程语言 时间:
2020-02-13 11:23:03
阅读次数:
133
一、什么是softmax? 有一个数组S,其元素为Si ,那么vi 的softmax值,就是该元素的指数与所有元素指数和的比值。具体公式表示为: softmax回归本质上也是一种对数据的估计 二、交叉熵损失函数 在估计损失时,尤其是概率上的损失,交叉熵损失函数更加常用。下面是交叉熵 当我们预测单个物 ...
分类:
其他好文 时间:
2020-02-13 00:30:19
阅读次数:
115
多层感知机(multi perceptron,MLP)。对于普通的含隐藏层的感知机,由于其全连接层只是对数据做了仿射变换,而多个仿射变换的叠加仍然是一个仿射变换,即使添加更多的隐藏层,这种设计也只能与仅含输出层的单层神经网络等价。解决问题的一个方法是引入非线性变换,对隐藏变量使用非线性变化,然后作为 ...
分类:
其他好文 时间:
2020-02-13 00:28:31
阅读次数:
113
设计一个框架 大部分时候,我们需要实现一个 Web 应用,第一反应是应该使用哪个框架。不同的框架设计理念和提供的功能有很大的差别。比如 Python 语言的 和`flask Beego Gin Iris`等。那为什么不直接使用标准库,而必须使用框架呢?在设计一个框架之前,我们需要回答框架核心为我们解 ...
分类:
Web程序 时间:
2020-02-12 23:50:02
阅读次数:
100
你会写代码吗你会写高质量代码吗你知道怎么写高质量代码吗不要一上来就开始写代码想清楚,再动手今天,分享10个写代码的小技巧教你写出高质量代码↓↓↓1、重构思维模式不要一上来就开始写代码,要掌握尽量多的重构方法,重构思维方式,掌握重构并不一定是要对原来代码的重构,而是让自己在操作之前就想好该怎么去进行。2、搞清需求再动手看到需求之后,肯定多多少少会有一些问题,或是理解上的错误,或是功能实现上的问题,这
分类:
其他好文 时间:
2020-02-10 16:30:32
阅读次数:
79
4. deep learning computaion 4.1 模型构造 4.1.1 继承 来构造模型 类是 模块里提供的一个模型构造类,我们可以继承它来定义我们想要的模型也可以继承它来构造层。 事实上, 类继承自 类。当模型的前向计算为简单串联各个层的计算时,可以通过更加简单的方式定义模型。这正是 ...
分类:
其他好文 时间:
2020-02-10 09:44:49
阅读次数:
68
动态博客: 自己动手: SpringBoot+Thymeleaf+MySQL 成熟框架: wordpress:https://wordpress.org/ 静态博客 hexo:https://hexo.io/zh cn/index.html jekyllrb:https://jekyllrb.com ...
分类:
其他好文 时间:
2020-02-09 18:35:20
阅读次数:
76
经、典,注解大多浩瀚,但若未入门就直接学习原本又所得甚少,殊为矛盾。 这两天看到有公众号在推关于道德经的付费课程,便想起17年春节背熟了的心经,心经268字阐明了佛的核心理论,相比之下道德经5100多字就显得不够精炼,所以为什么不能有一个类似的精简版便于记诵呢? 自己就动手做了个尝试,本来纯粹是文字 ...
分类:
其他好文 时间:
2020-02-07 12:29:19
阅读次数:
157