IndRNN: 可以看到,简单 RNN 和 LSTM 隐藏层计算公式红色的部分是对递归输入进行权值乘法处理。这使得神经元相互依赖或相互纠缠,因此很难解释每个神经元的活动。而 IndRNN 使用 element-wise(按位相乘)处理循环的输入或以前的隐藏状态,使神经元是相互独立。对于第 n 个神经元,对递归输入的处理是一个标量乘法。 下图展示了 RNN 和 IndRNN 之间的区别。在 RNN 中,由于递归权矩阵的存在,神经元相互纠缠,而在 IndRNN 中,神经元仍然是独立的,然后在下一层进行融合。 ▲ RNN与IndRNN神经元连接方式的对比,左图为RNN,右图为IndRNN,图片来自于S. Li, W. Li and C. Cook and Y. Gao. 2019. Deep Independently Recurrent Neural Network (IndRNN). arXiv.cs.CV1910.06251. 由于我们的模型可以通过 ReLU 进行鲁棒的训练,可以将它们堆叠在一起构建深层结构的网络或者构建残差神经网络(Residual Neural Network)和密集神经网络(Dense Nerual Network)。可以像在 CNN 中同样地使用批量归一化(Batch Normalization)。它还可以扩展为卷积形式,其中使用卷积操作处理输入。 传统上,RNN 被理解为随时间推移的多层神经网络(MLP),其中参数随时间推移而共享。在这里,IndRNN 展示了一个新的视角,即使用输入权值和循环权值随着时间的推移独立地聚合空间模式。
▲ Longer and Deeper RNN - IndRNN,图片来自于S. Li, W. Li, C. Cook and Y. Gao. 2019. Deep Independently Recurrent Neural Network (IndRNN). arXiv.cs.CV1910.06251.
▲ 三名用户的数据标签组成,可以看出有明显差异,图片来自H. Gjoreski, M. Ciliberto, L. Wang, F. J. O. Morales, S. Mekki, S. Valentin, D. Roggen. “The University of Sussex-Huawei Locomotion and Transportation Dataset for Multimodal Analytics with Mobile Devices.” IEEE Access 6 (2018): 42592-42604.
▲ 手机放置的位置及数据收集的界面,图片来自H. Gjoreski, M. Ciliberto, L. Wang, F. J. O. Morales, S. Mekki, S. Valentin, D. Roggen. “The University of Sussex-Huawei Locomotion and Transportation Dataset for Multimodal Analytics with Mobile Devices.” IEEE Access 6 (2018): 42592-42604.
致力于高效视频编码及分析、计算机视觉及人工智能的研究,已发表国际期刊及会议论文30余篇,包括11篇JCR Q1论文。近五年荣获2次国际学术会议最佳论文奖,并荣获IEEE Transactions on Broadcasting最佳论文奖提名。2篇论文入选ESI Highly Cited Paper(高被引论文),2篇论文连续数月入选为IEEE Popular Articles。现为多个IEEE及Elsevier期刊的审稿人及多个国际会议的审稿人。已提交国际及国家视频编码标准技术提案3项并全部被国际和国家标准组织采纳,且被集成到相关视频编码标准的参考软件中。已申请专利17项,其中14项已授权,1项已转让;并获得一项软件著作权。主持一项国家自然科学基金青年科学基金及一项国家重点研发计划(战略性国际科技创新合作重点专项)课题,并参与多项国家自然科学基金。代表性工作独立循环神经网络(IndRNN)获得谷歌及国际多位知名专家引文的肯定,并被集成到多个深度学习软件库中包括TensorFlow。
高艳博,山东大学,软件学院,副研究员。
博士毕业于电子科技大学信号与信息处理专业,目前就职于山东大学软件学院。研究方向包括图像/视频智能编码及分析、三维视频信号处理。已在相关领域发表学术论文17篇,其中1篇SCI 1区,5篇SCI 2区(中科院分区),发表在包括IEEE Transactions on Image Processing(TIP)、IEEE Transactions on Circuits and Systems for Video Technology(TCSVT)等顶级SCI上,11篇EI国际会议论文包括IEEE Conference on Computer Vision and Pattern Recognition(CVPR)、IEEE International Symposium on Circuits and Systems (ISCAS)等国际会议。申请人在视频编码TOP期刊IEEE TCSVT上发表的一作论文入选ESI Highly Cited Papers(高被引论文),荣获国际会议International Symposium on Broadband Multimedia Systems and Broadcasting (BMSB)最佳学生会议论文奖。已采纳(或部分采纳)国际国内视频编码标准提案5项,其中国际IVC提案1项,国内AVS提案4项。已申请专利11项,其中10项已授权、1项已转让。主持一项国家自然科学基金青年科学基金(在研),参与2项国家重点级项目(在研)。
参考文献
[1] B. Zhao, S. Li, and Y. Gao. 2020. IndRNN based long-term temporal recognition in the spatial and frequency domain. In Adjunct Proceedings of the 2020 ACM International Joint Conference on Pervasive and Ubiquitous Computing and Proceedings of the 2020 ACM International Symposium on Wearable Computers (UbiComp-ISWC '20). Association for Computing Machinery, New York, NY, USA, 368–372. [2] S. Li, W. Li, C. Cook, C. Zhu, and Y. Gao. 2018. Independently Recurrent Neural Network (IndRNN): Building a Longer and Deeper Rnn. In Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. 5457–5466. [3] S. Li, W. Li and C. Cook and Y. Gao. 2019. Deep Independently Recurrent Neural Network (IndRNN). arXiv.cs.CV1910.06251. [4] L. Zheng, S. Li, C. Zhu, and Y. Gao. 2019. Application of IndRNN for human activity recognition: the Sussex-Huawei locomotion-transportation challenge. In Adjunct Proceedings of the 2019 ACM International Joint Conference on Pervasive and Ubiquitous Computing and Proceedings of the 2019 ACM International Symposium on Wearable Computers (UbiComp/ISWC '19 Adjunct). Association for Computing Machinery, New York, NY, USA, 869–872. [5] L. Wang, H. Gjoreski, M. Ciliberto, P. Lago, K. Murao, T. Okita,and D. Roggen. “Summary of the Sussex-Huawei locomotion-transportation recognition challenge 2020”, Proceedings of the 2020 ACM International Joint Conference and 2020 International Symposium on Pervasive and Ubiquitous Computing and Wearable Computers, 2020. [6] H. Gjoreski, M. Ciliberto, L. Wang, F. J. O. Morales, S. Mekki, S. Valentin, D. Roggen. “The University of Sussex-Huawei Locomotion and Transportation Dataset for Multimodal Analytics with Mobile Devices.” IEEE Access 6 (2018): 42592-42604.