Home>Schools

  • Complex
  • Title
  • Author
  • Keyword
  • Abstract
  • Scholars
Search

[学位]

基于深度学习的人体行为识别研究

Share
Edit Delete Claim

Author:

李凯 (李凯.)

Indexed by:

学位论文库

Abstract:

人体行为识别是目前计算机视觉领域中的重点研究问题之一,其目标是从视频中提取、分析和识别人体行为运动信息。在行为识别领域,基于人工设计特征的传统行为识别方法存在诸多缺陷,其识别性能严重依赖于提取特征的好坏,计算复杂度高,并且无法有效表征视频的高级语义信息。基于深度学习的行为识别基于生物大脑对视觉信息的处理过程,对图像自主学习从而实现浅层特征到高级特征的提取。本文基于深度学习研究对视频长时时序结构信息进行建模,研究了基于视频分段的空时双通道卷积神经网络行为识别算法。论文主要的工作包括:
针对传统双通道卷积神经网络的行为识别对行为信息提取的局限性,研究了基于
视频分段的空时双通道卷积神经网络行为识别方法。算法首先将视频分成多个等长不重叠的视频分割片段,对每一个分段,用随机采样得到代表视频静态特征的帧图像和代表视频运动特征的堆叠光流图像,分别输入到空域和时域网络通道进行特征学习,在空时两个通道分别将各个分段得到的单帧特征通过不同特征融合方法得到视频层次的行为识别结果,最终通过基于集成学习方法融合时空双通道行为识别结果得到视频的行为识别结果。
针对视频行为识别过程中数据集规模较小以及如何设计有效的网络进行特征提取
及表达等问题,对基于视频分段的空时双通道卷积神经网络进行了细节探讨。在空域通道,分析讨论了密集采样和稀疏采样,讨论了水平翻转、角度旋转、平移变换、错切变换和随机裁剪等多种数据增强策略,比较了不同结构及深度的卷积神经网络模型。为了防止过拟合,讨论了两种迁移学习策略,网络训练阶段采用ImageNet上预训练模型并进行不同层次的网络参数微调,在时域网络通道,采用了跨模态交叉预训练的迁移学习策略,有效的提升了网络学习性能。讨论了多种分段融合方法以及空时通道网络行为识别结果的集成策略。同时,本文对于视频分段数目对长时时序信息行为识别的影响进行了研究。

Keyword:

分段空时双通道 卷积神经网络 人体行为识别 深度学习

Author Community:

  • [ 1 ] 西安交通大学电子与信息工程学院

Reprint Author's Address:

Show more details

Basic Info :

Degree: 硕士

Mentor: 王萍

Year: 2018

Language: Other

Cited Count:

WoS CC Cited Count: 0

30 Days PV: 12

FAQ| About| Online/Total:84/217204215
Address:XI'AN JIAOTONG UNIVERSITY LIBRARY(No.28, Xianning West Road, Xi'an, Shaanxi Post Code:710049) Contact Us:029-82667865
Copyright:XI'AN JIAOTONG UNIVERSITY LIBRARY Technical Support:Beijing Aegean Software Co., Ltd.