码迷,mamicode.com
首页 > Web开发 > 详细

《Attention Augmented Convolutional Networks》注意力的神经网络

时间:2019-04-25 11:42:18      阅读:2109      评论:0      收藏:0      [点我收藏+]

标签:关系   hive   tensor   net   ima   org   ORC   研究   rsa   

paper: 《Attention Augmented Convolutional Networks》 https://arxiv.org/pdf/1904.09925.pdf

这篇文章是google brain的,应该有分量。上来就说:卷积神经网络有一个重要的弱点就是 它仅仅操作于于一个领域,对于没有考虑到全局信息有损失。

(这就是全局和局部的辨证关系。)

注意力机制,以一种能够把握长距离作用的手段,在序列模型和生成模型里使用。这篇文章使用注意力机制到判别模型中来,作为替代卷积的手段。(非常具有ambition)

这篇文章由于使用的是tensorflow 所以表述和 pytorch不同 (tensorfow 是 w*h*c pytorch 是 c*w*h)

在论文的self-attention over image 部分里使用了《Attention is All You Need》的方法介绍有人已经研究过了 在这里 :https://kexue.fm/archives/4765    (苏同学的博客里有不少干货)

总之和上一篇里Self-Attention Generative Adversarial Networks介绍的方法几乎一致。所以就直接参考上边博客的内容。

 

《Attention Augmented Convolutional Networks》注意力的神经网络

标签:关系   hive   tensor   net   ima   org   ORC   研究   rsa   

原文地址:https://www.cnblogs.com/yjphhw/p/10767348.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!