曝阿里达摩院大模型 M6 带头人杨红霞已离职:个人选择,非行业原因

2022 年 10 月 12 日 新智元



  新智元报道  



作者:李梅(AI科技评论)

编辑: Aeneas David
【新智元导读】阿里 M6 大模型带头人杨红霞,已从阿里巴巴达摩院智能计算实验室离职。
AI科 技评论获悉,阿里 M6 大模型的原带头人杨红霞,已于 9 月初因个人家庭原因从阿里巴巴达摩院智能计算实验室离职。

杨红霞常年深耕在产业化大规模落地的人工智能相关技术,在任资深算法专家期间带领团队探索阿里在下一代人工智能突破性技术-认知智能的技术发展与场景应用落地。

杨红霞 ,2007 年本科毕业于南开大学,获统计学学士学位。其后她去往美国杜克大学统计科学系攻读博士学位,师从 David Dunson 教授。

博士毕业后,杨红霞先入职 IBM 全球研发中心任 Watson 研究员,之后入职雅虎公司,担任首席数据科学家。

2016 年,杨红霞结束她在美国近 10 年的留学及工作生涯回国,去往杭州加入阿里巴巴集团。

杨红霞领导的阿里巴巴达摩院 M6 团队致力于认知智能方向,目前研发了 AliGraph、M6、洛犀等较为有影响力的人工智能开源平台和系统,发表顶级会议、期刊文章超过 100 篇,美国和中国专利超过 30 项。

她曾带领团队获 2019 世界人工智能大会最高奖卓越人工智能引领者(Super AI Leader,简称 SAIL 奖),2020 年国家科学技术进步奖二等奖和 2020 年杭州市创新领军团队。2022年6月,杨红霞入选 2022 福布斯中国科技女性50榜。

大模型 M6 是杨红霞在任期间的最突出成就。据了解,她离职是因为个人家庭原因,而非行业问题。达摩院大模型 M6 团队的后续工作不受影响。

M6 于 2021 年 3 月首次发布,是国内首个千亿参数多模态大模型。当时,OpenAI 前政策主管 Jack Clark 曾赞扬道:这个模型的规模和设计都非常惊人。这看起来像是众多中国的 AI 研究组织逐渐发展壮大的一种表现。

作为通用性 AI 大模型,M6 拥有多模态、多任务能力,尤其擅长设计、写作、问答,在电商、制造业、文学艺术、科学研究等领域都具有广泛应用前景。杨红霞曾在接受采访时表示:“多模态预训练是下一代人工智能的基础,M6 模型实现了训练效率和生成精度等多项突破,是当前众多中文多模态下游任务最优模型。”

6 月份,杨红霞团队又发布万亿参数的 M6,仅使用 480 块GPU,就能实现万亿参数体量的智能运算。相比原来的百亿参数模型,功耗降低 8 成,效率提升 11 倍。

M6 在当年 10 月再次突破极限,杨红霞团队使用 512 GPU,在 10 天内训练出 10 万亿模型。与大模型 GPT-3 具有同等参数规模,但能耗仅为其 1%。

据了解,M6 已经在阿里新制造平台-犀牛制造中得到应用,它服务内部近 50 个部门,并在阿里云对外产品中投入使用,还被收录在 MIT Tech Review 2021 年度中国 AI 突破技术报告。

参考资料:
https://baijiahao.baidu.com/s?id=1746369376161463935&wfr=spider&for=pc
http://www2.stat.duke.edu/~hy35/home.html

本文经授权转载自微信公众号「AI科技评论」(ID:aitechtalk)




登录查看更多
1

相关内容

杨红霞,美国杜克大学博士学位,原IBM全球研发中心Watson研究员,Yahoo!主任数据科学家,现任阿里巴巴资深算法专家,带领团队开发基于计算平台和搜索推荐的智能算法,稳定的支持了阿里巴巴搜索、广告等30几个核心BU和其业务场景。在顶级统计和机器学习国际学术期刊会议发表论文50余篇(包括JASA, ICML, NIPS, ATSTATS, KDD, ICDM,CIKM和WWW等),美国专利9项,任职 Applied Stochastic Models in Business and Industry副主编,International Statistical Institute理事,中国电子学会青年科学家俱乐部理事,浙江省千人计划专家,2019世界人工智能大会最高奖项卓越人工智能引领者(Super AI Leader,简称SAIL奖)获得者。
北大WWW2022最佳学生论文:可扩展的图神经结构搜索系统
创新工场首席科学家周明博士:认知智能的进展和思考
专知会员服务
51+阅读 · 2022年3月24日
专知会员服务
100+阅读 · 2021年8月8日
京东集团副总裁周伯文离职,将投身AI创业
机器之心
0+阅读 · 2021年11月16日
周礼栋博士升任微软亚洲研究院院长
微软研究院AI头条
0+阅读 · 2021年7月27日
国家自然科学基金
0+阅读 · 2015年4月20日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年7月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年4月30日
国家自然科学基金
2+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
Arxiv
27+阅读 · 2021年11月11日
Arxiv
20+阅读 · 2021年9月22日
CSKG: The CommonSense Knowledge Graph
Arxiv
18+阅读 · 2020年12月21日
Arxiv
38+阅读 · 2020年12月2日
Efficiently Embedding Dynamic Knowledge Graphs
Arxiv
14+阅读 · 2019年10月15日
Arxiv
17+阅读 · 2019年3月28日
VIP会员
相关基金
国家自然科学基金
0+阅读 · 2015年4月20日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年7月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年4月30日
国家自然科学基金
2+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
相关论文
Arxiv
27+阅读 · 2021年11月11日
Arxiv
20+阅读 · 2021年9月22日
CSKG: The CommonSense Knowledge Graph
Arxiv
18+阅读 · 2020年12月21日
Arxiv
38+阅读 · 2020年12月2日
Efficiently Embedding Dynamic Knowledge Graphs
Arxiv
14+阅读 · 2019年10月15日
Arxiv
17+阅读 · 2019年3月28日
Top
微信扫码咨询专知VIP会员