码迷,mamicode.com
首页 > Web开发 > 详细

【论文笔记】Spatial Temporal Graph Convolutional Networks for Skeleton-Based Action Recognition

时间:2018-01-28 18:19:57      阅读:1364      评论:0      收藏:0      [点我收藏+]

标签:enc   sig   ase   就是   rabl   ges   temp   模式   网格   

Spatial Temporal Graph Convolutional Networks for Skeleton-Based Action Recognition

2018-01-28  15:45:13 

 

研究背景和动机:

  行人动作识别(Human Action Recognition)主要从多个模态的角度来进行研究,即:appearance,depth,optical-flow,以及 body skeletons。这其中,动态的人类骨骼点 通常是最具有信息量的,且能够和其他模态进行互补。但是最近研究这个东西的工作,却很少,我们系统的分析了这个模态,目标就是想开发一种 principle and effective 的方法来建模动态的骨骼点,并且将其用于行为识别。  

  动态的骨骼模态,可以自然地表达为时间序列的 human joint locations,行人的动作,就可以看做是分析这些运动模式就可以了。当前的方法主要是简单的将 the joint coordinates 构成特征向量,然后应用 temporal analysis thereon。这些方法的能力是有限的,因为他们并没有显示的探索这些 joints 之间的空间关系,然而这对于理解 human actions 来说,是非常重要的。最近也有些方法将这些连接考虑到他们的模型中,但是,这些方法严重的依赖于手工设计的 parts 或者 rules。这就使得他们的方法很难应用到其他问题上。

  为了克服这些困难,我们需要一种新的方法可以自动的捕获 the patterns embedded in the spatial configuration of the joints, 以及 their temporal dynamics。这是深度神经网络的优势,但是,骨骼点的数据是一种 graph 的结构,而不是 2D 或者 3D 的网格,所以,很难利用当前的 CNN 来直接处理这些数据。最近,graph convolutional networks(GCNs),将 CNN 拓展到了 任意结构的 graphs 上来,已经得到了很大的关注,并且得到了广泛的应用,如:image classification, document classification, and semi-supervised learning. 但是,这些方法都是基于一种 fixed  graph 作为输入。将 GCNs 在大型数据集上来建模 dynamic graphs,如:human skeleton sequence,还没有被研究。

  技术分享图片

  本文通过将 GCN 拓展到 spatial-temporal graph model,称为:ST-GCN。如上图所示,这个模型是在 一个骨骼图的序列上 构建的,每个节点对应了 a joint of the human body。有两种 edges,即:spatial edgestemporal edges。 

   本文的创新点:

  1) We propose ST-GCN, a generic graph-based formulation for modeling dynamic skeletons, which is the first that applies graph-based neural networks for this task. 

  2) We propose several principles in designing convolution kernels in ST-GCN to meet the specific demands in skeleton modeling. 

  3) On two large scale datasets for skeleton-based action recognition, the proposed model achieves superior performance as compared to previous methods using hand-crafted parts or traversal rules, with considerably less effort in manual design.

  The code and models of ST-GCN are made publicly available https://github.com/yysijie/st-gcn.  

 

 

  

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

【论文笔记】Spatial Temporal Graph Convolutional Networks for Skeleton-Based Action Recognition

标签:enc   sig   ase   就是   rabl   ges   temp   模式   网格   

原文地址:https://www.cnblogs.com/wangxiaocvpr/p/8371660.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!