【会员风采】华中科技大学---王兴刚

2022 年 4 月 20 日 中国图象图形学学会CSIG
读博期间,他凭实力夺得2012年度全亚洲唯一的计算机视觉领域“微软学者”奖; 放弃百度、华为、字节跳动等头部企业的诱人高薪,他选择站上“三尺讲台”,成为深受学生喜爱的青年教师; 他带领团队勇闯“高效率视觉目标识别”研发难关,与世界顶尖人工智能研究团队同台竞技,创造性发明空间稀疏的视觉自注意力模型,为计算机视觉研究领域“解锁”更多可能,收获过万次学术引用,入选国家青年人才计划。

他是华中科技大学青年学者王兴刚,从信心不足到敢于挑战,从建立自信到善于竞争,用“青春无悔、只争朝夕”诠释新时期青年科学家的中国自信。

“解锁”计算机视觉识别巨大潜力
近日,华中科技大学(以下简称“华中大”)与地平线计算机视觉联合研究中心为期四年的合作研究落下帷幕。4月2日,王兴刚团队关于《基于神经结构搜索的高效率人体姿态估计》论文获得了《计算机可视媒体》期刊2021年度最佳论文奖。
计算机视觉作为人工智能领域前沿研究学科,是一门关于如何运用照相机和计算机来获取被拍摄对象的数据与信息的学问,好比给计算机安装上“眼睛”和“大脑”,让计算机能够感知环境。
视觉识别是计算机视觉的基础问题,其研究目的是让计算机、机器人的“眼睛”能在图像视频中精确的定位出感兴趣的目标位置并确定目标类别,在自动驾驶、移动机器人、遥感影像分析、医学影像病灶定位等应用中发挥重要作用。视觉识别作为关键共性技术,被纳入《新一代人工智能发展规划》。
目前,全球计算机视觉识别研究主要存在三大难题,即当前的深度神经网络模型难以准确灵活地刻画复杂的视觉场景特征,视觉识别模型依赖于完美精确的人工标注数据来进行训练和学习,方法需要的计算量大、功耗高,难以在低成本硬件上实时运行。
王兴刚带领团队历经四年研究,提出空间稀疏的视觉自注意力模型,为实现高效率的计算机视觉识别“解锁”巨大潜力,在图像视频语义分割、目标检测等视觉识别问题中被广泛采用。

此外,空间稀疏的视觉自注意力模型的影响力还辐射到生命科学领域,于2021年被《自然》封面文章蛋白质结构预测AI AlphaFold使用,有效解决了人工智能程序AlphaFold的内存爆炸和计算速度慢难题。谷歌DeepMind创始人哈撒比斯博士评价:“该模型的成功启发了采用注意力方法来解译蛋白质序列的探索。”

让世界看到中国科研自信
“一开始不够自信,当时的对手太强了。”王兴刚回忆,刚去微软亚洲学院实习时,与亚太地区一流高校的计算机学科博士生竞争微软学者奖学金。
让他没想到的是,一路过关斩将,最终成为亚洲区十位获奖的微软学者之一,也是唯一一个从事计算机视觉研究方向的获奖者。“这给了我莫大信心——我们华中大出来的学生,完全可以跟业界顶尖选手过招,并争得一席之地。”王兴刚说。
博士毕业,有企业为他开出百万年薪。他却选择了留校,起步阶段薪资仅是企业的十分之一。在王兴刚看来,热爱是他做出这个看似“不划算”选择的原动力。
“国内当时从事这方面基础理论和方法的研究人员较少,它涉及视觉表达的底层问题。而国外研究机构在这个研究问题上具有很强话语权,先发优势明显,且软硬件资源优越。”王兴刚说。
是否需要在这样一个极具挑战的领域与国际顶尖团队“正面刚”?是否能赢?带着这些疑问,王兴刚选择接受挑战。
刚开始,实验设备缺乏、团队经费不足、人手严重不够。王兴刚团队摒弃国外竞争对手做大算力大模型的思路,从数据高效和计算高效的思路实现独辟蹊径。
“从最开始的一穷二白、艰难起步,到站上国际舞台与世界顶尖同行同台竞技,从敢于竞争到善于竞争,我们是华中大精神的践行者。”王兴刚自信满满。
当前,新一轮科技革命和产业革命正在发生变革,这与我国高质量发展形成历史性交汇。
王兴刚认为,加快发展新一代人工智能是“事关我国能否抓住新一轮科技革命和产业变革机遇的战略问题”,是“我们赢得全球科技竞争主动权的重要战略抓手”,作为新时期青年科学家,理应当仁不让、一马争先,立足于“四个面向”,践行科研报国初心。“作为80后青年学者,我们经历了中国科研由弱到强的发展历程、由不自信到自信的心路历程。”在王兴刚看来,科研自信是土生土长的中国学者的自信,是关于中国科研体系的自信,是“四个自信”在科研领域的集中体现。
来源:科技日报





关于开展“2022 年度高等学校科学研究优秀成果奖(科学技术)-青年科学奖” 提名工作的通知
中国图象图形学学会关于开展“决策咨询专家团队”建设工作的通知
《Visual Intelligence》英文刊编辑招聘启事
关于开展2022年“最美科技工作者”学习宣传活动的通知
中国图象图形学学会高校志愿者招募
中国图象图形学学会关于组织开展科技成果鉴定的通知

2022年CSIG图像图形中国行承办方征集中

登录查看更多
0

相关内容

王兴刚,华中科技大学,电子信息与通信学院,副教授,主要研究方向为计算机视觉和深度学习。在业内顶级的期刊和会议上发表论文50余篇,谷歌学术引用次数超过8000次。担任国际顶级会议CVPR领域主席,Pattern Recognition (IF 7.196)、Image and Vision Computing (IF 3.103)、 Electronics (IF 2.412)期刊编委/副编辑,AAAI、IJCAI SPC,IEEE TPAMI、CVPR等期刊会议审稿人。入选中国科协“青年托举人才工程”,获“微软学者”奖(全亚洲10名获奖者)、湖北省自然科学二等奖、华为优秀技术合作项目奖、CCF-腾讯犀牛鸟基金优秀奖等奖励。
【伯克利马毅老师】强化学习与最优控制综述
专知会员服务
74+阅读 · 2022年4月26日
2021—2022中国人工智能计算力发展评估报告,36页pdf
专知会员服务
70+阅读 · 2021年11月6日
专知会员服务
54+阅读 · 2021年7月21日
【CSIG奖励访谈】2021年度CSIG优秀博士学位论文奖获奖者黄子龙
中国图象图形学学会CSIG
0+阅读 · 2022年4月15日
【会员风采】南京理工大学---宫辰
中国图象图形学学会CSIG
1+阅读 · 2022年4月15日
【会员风采】北京交通大学---丛润民
中国图象图形学学会CSIG
0+阅读 · 2022年2月24日
【喜讯】学会推荐4位青年人才入选第六届中国科协青年人才托举工程
中国图象图形学学会CSIG
1+阅读 · 2021年10月27日
【CSIG奖励访谈】2020年度CSIG优秀博士学位论文奖获奖者张平平
中国图象图形学学会CSIG
1+阅读 · 2021年7月30日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
19+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年4月20日
国家自然科学基金
22+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年6月30日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
How Asynchronous Events Encode Video
Arxiv
0+阅读 · 2022年6月9日
Arxiv
103+阅读 · 2021年6月8日
AliCoCo: Alibaba E-commerce Cognitive Concept Net
Arxiv
13+阅读 · 2020年3月30日
VIP会员
相关资讯
【CSIG奖励访谈】2021年度CSIG优秀博士学位论文奖获奖者黄子龙
中国图象图形学学会CSIG
0+阅读 · 2022年4月15日
【会员风采】南京理工大学---宫辰
中国图象图形学学会CSIG
1+阅读 · 2022年4月15日
【会员风采】北京交通大学---丛润民
中国图象图形学学会CSIG
0+阅读 · 2022年2月24日
【喜讯】学会推荐4位青年人才入选第六届中国科协青年人才托举工程
中国图象图形学学会CSIG
1+阅读 · 2021年10月27日
【CSIG奖励访谈】2020年度CSIG优秀博士学位论文奖获奖者张平平
中国图象图形学学会CSIG
1+阅读 · 2021年7月30日
相关基金
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
19+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年4月20日
国家自然科学基金
22+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年6月30日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Top
微信扫码咨询专知VIP会员