成为VIP会员查看完整内容
VIP会员码认证
首页
主题
发现
会员
服务
注册
·
登录
0
AAAI 2020 线上分享 | 加州大学伯克利分校:Hessian矩阵下的神经网络
2020 年 1 月 6 日
机器之心
最新一期机器之心 AAAI 2020 线上分享,我们邀请到了加州大学伯克利分校 Zhewei Yao 博士为我们介绍将二阶方法用于训练深度神经网络的最新成果。这是一期硬核的线上分享。
今年春节后不久,人工智能学术顶会 AAAI 2020 就将于美国纽约开幕。
为向读者们介绍更多 AAAI 2020 优质论文,机器之心组织策划了 AAAI 2020 线上论文分享。
目前,机器之心 AAAI 2020 论文分享进行到了第三期,本期我们邀请到了加州大学伯克利分校 Zhewei Yao 博士,他的论文《Q-BERT: Hessian Based Ultra Low Precision Quantization of BERT》被 AAAI 2020 所接收。
在这期分享中,他将介绍把二阶方法用于训练深度神经网络的最新结果。
讲者简介
:
Zhewei Yao,加州大学伯克利分校 BAIR、RISELab(前 AMPLab)、BDD 和数学系博士。
他的研究兴趣包括计算统计,优化和机器学习。
目前,他对利用随机线性代数中的工具来为大规模优化和学习问题提供有效且可扩展的解决方案感兴趣。
他也在研究于深度学习的理论和应用。
演讲概要
:
在此演讲中,我将介绍把二阶方法用于训练深度神经网络的最新结果。
首先,我会介绍一种使用二阶信息进行模型压缩的新系统性方法,这种方法能够在图像分类、目标检测和自然语言处理等一系列具有挑战性的任务中产生前所未有的小模型,超越所有的行业水平,包括昂贵的、可大规模搜索的 AutoML 方法。
其次,我将介绍一个用于计算 Hessian 信息的全新可扩展框架,以解决二阶信息计算速度很慢的问题。
此外,我还将为大家展示在训练期间也可以使用 Hessian 信息,且开销很少。
与 ImageNet 上基于一阶方法训练 ResNet18 的时间相比,我们的方法可提速 3.58 倍。
论文链接:
https://arxiv.org/pdf/1909.05840.pdf
时间:
北京时间 2020 年 1 月 9 日 20:00-21:00
AAAI 2020 机器之心线上分享
2020 年 2 月 7 日-2 月 12 日,AAAI 2020 将于美国纽约举办。
不久之前,大会官方公布了今年的论文收录信息:
收到 8800 篇提交论文,评审了 7737 篇,接收 1591 篇,接收率 20.6%。
为向读者们分享更多的优质内容、促进学术交流,在 AAAI 2020 开幕之前,机器之心将选出数篇优质论文,邀请论文作者来做线上分享。
整场分享包括两个部分:
论文解读和互动答疑。
线上分享将在「AAAI 2020 交流群」中进行,加群方式:
添加机器之心小助手(syncedai4),备注「AAAI」,邀请入群。
入群后将会公布直播链接。
登录查看更多
点赞并收藏
0
暂时没有读者
0
权益说明
本文档仅做收录索引使用,若发现您的权益受到侵害,请立即联系客服(微信: zhuanzhi02,邮箱:bd@zhuanzhi.ai),我们会尽快为您处理
相关内容
AAAI
关注
457
AAAI是人工智能领域的顶级国际会议,每年吸引世界各国数千名学者共同探讨人工智能发展前沿。 国际人工智能协会,前身为美国人工智能协会,目前是一个非盈利的学术研究组织,致力于推动针对智能行为本质的科学研究。
近期必读的五篇KDD 2020【图神经网络 (GNN) 】相关论文_Part2
专知会员服务
159+阅读 · 2020年6月30日
【伯克利】通过增大模型加速Transformer训练和推理
专知会员服务
44+阅读 · 2020年3月6日
AAAI 2020 | 滴滴&东北大学提出自动结构化剪枝压缩算法框架,性能提升高达120倍
专知会员服务
29+阅读 · 2020年2月26日
AAAI2020接受论文列表,1591篇论文目录全集
专知会员服务
98+阅读 · 2020年1月12日
【NeurIPS2019|杰出新方向论文奖】统一收敛可能无法解释深度学习中的泛化性(Uniform convergence maybe unable to explain generalization in deep learning)
专知会员服务
12+阅读 · 2019年12月9日
【经典】深度学习数学宝典《深度学习所需要的矩阵微积分》
专知会员服务
281+阅读 · 2019年12月2日
斯坦福新书《应用线性代数导论:向量、矩阵和最小二乘法》473页pdf,带你入门学习
专知会员服务
251+阅读 · 2019年11月30日
【清华大学】自动微分蒙特卡洛,理论与应用,Automatic Differentiable Monte Carlo: Theory and Application (附pdf)
专知会员服务
26+阅读 · 2019年11月23日
【BAAI|2019】类脑神经网络技术及其应用,鲁华祥(附pdf)
专知会员服务
29+阅读 · 2019年11月21日
【课程】概率图模型,卡内基梅隆大学邢波
专知会员服务
69+阅读 · 2019年11月4日
今晚,华为诺亚方舟NeurIPS 2019论文分享:基于少量数据的神经网络模型压缩技术
机器之心
11+阅读 · 2019年11月21日
今晚,NeurIPS 2019 Spotlight论文分享:不完备专家演示下的模仿学习
机器之心
8+阅读 · 2019年11月13日
NeurIPS 2019 论文线上分享 | 清华大学Spotlight:不完备专家演示下的模仿学习
机器之心
3+阅读 · 2019年11月8日
数千人顶会的干货,ICML、CVPR2019演讲视频资源在此
机器之心
9+阅读 · 2019年7月8日
AAAI 2019 四个杰出论文奖论文揭晓
算法与数学之美
5+阅读 · 2019年5月11日
已删除
将门创投
4+阅读 · 2018年11月15日
Kaggle 新赛:第二届 YouTube-8M 视频理解挑战赛
AI研习社
10+阅读 · 2018年5月26日
AAAI 2018学术见闻——NLP篇
哈工大SCIR
5+阅读 · 2018年3月26日
学界 | AAAI 2018获奖论文提前揭晓:两大奖项花落阿尔伯塔、牛津
机器之心
3+阅读 · 2018年1月18日
学界 | 从剪枝法到低秩分解,手机端语言模型的神经网络压缩
机器之心
5+阅读 · 2017年9月26日
Towards a Human-like Open-Domain Chatbot
Arxiv
14+阅读 · 2020年1月27日
Language Modeling with Deep Transformers
Arxiv
6+阅读 · 2019年7月11日
Learning to Walk via Deep Reinforcement Learning
Arxiv
7+阅读 · 2018年12月26日
Stochastic Gradient Descent Optimizes Over-parameterized Deep ReLU Networks
Arxiv
8+阅读 · 2018年11月21日
Extracting Sentiment Attitudes From Analytical Texts
Arxiv
6+阅读 · 2018年8月27日
Causal Embeddings for Recommendation
Arxiv
23+阅读 · 2018年8月3日
Meta-Learning with Latent Embedding Optimization
Arxiv
6+阅读 · 2018年7月16日
Asynchronous Byzantine Machine Learning (the case of SGD)
Arxiv
3+阅读 · 2018年7月9日
Diff-DAC: Distributed Actor-Critic for Average Multitask Deep Reinforcement Learning
Arxiv
4+阅读 · 2018年4月22日
Dynamic Weight Alignment for Convolutional Neural Networks
Arxiv
6+阅读 · 2018年1月25日
VIP会员
自助开通(推荐)
客服开通
详情
相关主题
AAAI
二阶方法
加州大学 (University of California)
神经网络
深度神经网络
论文
相关VIP内容
近期必读的五篇KDD 2020【图神经网络 (GNN) 】相关论文_Part2
专知会员服务
159+阅读 · 2020年6月30日
【伯克利】通过增大模型加速Transformer训练和推理
专知会员服务
44+阅读 · 2020年3月6日
AAAI 2020 | 滴滴&东北大学提出自动结构化剪枝压缩算法框架,性能提升高达120倍
专知会员服务
29+阅读 · 2020年2月26日
AAAI2020接受论文列表,1591篇论文目录全集
专知会员服务
98+阅读 · 2020年1月12日
【NeurIPS2019|杰出新方向论文奖】统一收敛可能无法解释深度学习中的泛化性(Uniform convergence maybe unable to explain generalization in deep learning)
专知会员服务
12+阅读 · 2019年12月9日
【经典】深度学习数学宝典《深度学习所需要的矩阵微积分》
专知会员服务
281+阅读 · 2019年12月2日
斯坦福新书《应用线性代数导论:向量、矩阵和最小二乘法》473页pdf,带你入门学习
专知会员服务
251+阅读 · 2019年11月30日
【清华大学】自动微分蒙特卡洛,理论与应用,Automatic Differentiable Monte Carlo: Theory and Application (附pdf)
专知会员服务
26+阅读 · 2019年11月23日
【BAAI|2019】类脑神经网络技术及其应用,鲁华祥(附pdf)
专知会员服务
29+阅读 · 2019年11月21日
【课程】概率图模型,卡内基梅隆大学邢波
专知会员服务
69+阅读 · 2019年11月4日
热门VIP内容
开通专知VIP会员 享更多权益服务
【博士论文】ࣞ动态三维人体的隐式神经表示方法研究
大语言模型训练数据
【新书】动力系统的收缩理论,258页pdf
适应性异常检测在识别网络物理系统攻击中的应用:系统性文献综述
相关资讯
今晚,华为诺亚方舟NeurIPS 2019论文分享:基于少量数据的神经网络模型压缩技术
机器之心
11+阅读 · 2019年11月21日
今晚,NeurIPS 2019 Spotlight论文分享:不完备专家演示下的模仿学习
机器之心
8+阅读 · 2019年11月13日
NeurIPS 2019 论文线上分享 | 清华大学Spotlight:不完备专家演示下的模仿学习
机器之心
3+阅读 · 2019年11月8日
数千人顶会的干货,ICML、CVPR2019演讲视频资源在此
机器之心
9+阅读 · 2019年7月8日
AAAI 2019 四个杰出论文奖论文揭晓
算法与数学之美
5+阅读 · 2019年5月11日
已删除
将门创投
4+阅读 · 2018年11月15日
Kaggle 新赛:第二届 YouTube-8M 视频理解挑战赛
AI研习社
10+阅读 · 2018年5月26日
AAAI 2018学术见闻——NLP篇
哈工大SCIR
5+阅读 · 2018年3月26日
学界 | AAAI 2018获奖论文提前揭晓:两大奖项花落阿尔伯塔、牛津
机器之心
3+阅读 · 2018年1月18日
学界 | 从剪枝法到低秩分解,手机端语言模型的神经网络压缩
机器之心
5+阅读 · 2017年9月26日
相关论文
Towards a Human-like Open-Domain Chatbot
Arxiv
14+阅读 · 2020年1月27日
Language Modeling with Deep Transformers
Arxiv
6+阅读 · 2019年7月11日
Learning to Walk via Deep Reinforcement Learning
Arxiv
7+阅读 · 2018年12月26日
Stochastic Gradient Descent Optimizes Over-parameterized Deep ReLU Networks
Arxiv
8+阅读 · 2018年11月21日
Extracting Sentiment Attitudes From Analytical Texts
Arxiv
6+阅读 · 2018年8月27日
Causal Embeddings for Recommendation
Arxiv
23+阅读 · 2018年8月3日
Meta-Learning with Latent Embedding Optimization
Arxiv
6+阅读 · 2018年7月16日
Asynchronous Byzantine Machine Learning (the case of SGD)
Arxiv
3+阅读 · 2018年7月9日
Diff-DAC: Distributed Actor-Critic for Average Multitask Deep Reinforcement Learning
Arxiv
4+阅读 · 2018年4月22日
Dynamic Weight Alignment for Convolutional Neural Networks
Arxiv
6+阅读 · 2018年1月25日
大家都在搜
大模型
PRML
大型语言模型
时间序列
全面综述
壁画
智能推荐
MoE
无人艇
GANLab 将GA
Top
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top