机器之心「SOTA!模型」新版来了!高效查找最新、最热、最先进的AI模型及开发资源!

2022 年 8 月 2 日 机器之心

SOTA,全称「state-of-the-art」,用于描述机器学习中取得某个任务上当前最优效果的模型。例如在图像分类任务上,某个模型在常用的数据集(如 ImageNet)上取得了当前最先进的性能表现,我们就可以说这个模型达到了 SOTA。

作为专业的人工智能信息平台,机器之心于2019年9月发布了首版「SOTA 模型」项目。用户可以通过访问该项目网站(https://www.jiqizhixin.com/sota)根据自己的需要寻找机器学习对应领域和任务下 SOTA 模型的引入论文,该模型的网络结构、训练时所使用的数据集及取得SOTA成绩的时间、精度指标,所使用的的数据集和 benchmark 等相关信息。
在首版「SOTA 模型」项目上线之后的这三年内,机器之心一直在思考我们还能做些什么来帮助AI开发者更快、更高效地用上学界、企业开放出来的最新、最先进的AI技术成果,加速先进AI技术在各行各业中的普遍应用。

近几年AI技术持续迅猛发展。一方面,模型越「炼」越大,OpenAI 的 GPT-3 参数量达1,750 亿、华为联合鹏城实验室的盘古(Pangu)则达到2000 亿,更有智源研究院的 WuDao2.0 参数总量高达1.75 万亿。另一方面,模型的应用效率也在逐步被提高。谷歌大脑团队推出业界首个1.6万亿个参数的超级语言模型Switch Transformer,在计算资源相同情况下,比之前由谷歌开发最大的语言模型T5-XXL足足快了4倍,比基本的T5模型快了7倍。

与此同时,全球的AI产业格局也静静地发生了一些变化。随着AI技术逐渐深入产业,越来越多的长尾场景下的模型性能,项目成本问题,乃至供应链安全等问题也逐步被提上议程。
大模型、基础模型的训练成本越来越高,基于论文进行复现训练模型所需的硬件、数据资源已不再是小团队所能承担的,如何才能高效用上先进的AI技术,为产业解决过去解决不了、解决不好的问题?
异构芯片、TPU等计算硬件日益成熟,过往跑在GPU上的模型迁移到新硬件性价比是否划算?在产业应用的现实环境中,如何突破有限的计算设备性能、通信条件的限制?
为了应付日益复杂的外部环境,对AI基础开发资源的开源、国产化的需求也逐步显现。根据机器之心2022年度AI开发者调查结果显示,已有接近四成的受访者表示会优先考虑国产软硬件。

随着新一代的计算机科学专业人才走向社会,企业的算法岗位不再面临招聘难的问题,越来越多的顶尖学者在为工业界培养出一流的算法科学家团队后,也开始回归学界,继续科研之路。Facebook 改名为「Meta」,成为全球第一家将企业核心方向设定为元宇宙的企业,率先启航驶入 AI 科技的下一征途 。
伴随着机器之心对以上变化的观察与思考,新版 「SOTA!模型」(sota.jiqizhixin.com)于2022年第一季度悄悄上线运营了 。
新版的 「SOTA!模型」致力于帮助机器之心的老伙计们搞定下面三件事 ——
第一件事 · 高效追踪 AI学界、业界开放出来的 SOTA 模型及配套资源
在访谈、调研的过程中,我们发现不少 AI应用开发者、算法工程师都是通过追踪论文了解有哪些新的算法可以应用,再分别去Papers with Code」寻找可参考的高质量的实现代码,去Hugging Face及各大AI编程框架、计算平台的模型库找可直接使用的预训练模型或API。这一过程往往十分繁琐,且常常无功而返。
新版 SOTA!模型」在对每日学界、业界最新的SOTA工作进行追踪的同时,汇总了原作团队、社区用户所放出的模型文件、实现代码、数据集等开发资源,帮助老伙计们快速上手尝试新技术。
此外,老伙计们还可以通过「检索模型」功能基于模型已有开发资源所适配的硬件类型、计算平台、框架及模型规模等维度,探索可用于当前开发工作的模型。


第二件事 · 高效找到在工作、学业中所需用到的 AI 开发资源
在新版的「SOTA!模型平台,老伙计们可以 —— 
① 基于要做的任务,挑选模型架构,进一步找到相应代码、实现资源

老伙计们可以从需要着手解决的任务出发,如 图像分类「姿态估计」、视觉问答等,找到平台收录适用于该任务的模型及相应开发资源。

② 基于想要尝试的算法或模型名称,进一步找到相应代码、实现资源
老伙计们还可以从想要尝试开发的模型所采用的关键算法、结构入手,找出你想尝试使用的模型架构,并进一步找到平台收录适用于该模型架构的开发资源。
③ 高效查找性能好、完成度高、文档清晰、部署环境需求适配的优质开发资源

在新版的「SOTA!模型,老伙计们不仅可以一站找到新发布的算法研究工作所配套的开发资源,还可以高效基于文档清晰性能优选原作出品国产等优选场景进行筛选,高效查找优选资源」,并可进一步将心仪的开发资源一键加入 「我的工具箱」 方便日后使用。

第三件事 · 铺平从发现新工作、新项目,到用上相应AI技术的「最后的N公里」
在过去的7年里,机器之心每天都在追踪AI研究界的最新成果,帮助AI从业者从中发现值得关注的新工作、新项目。通过新版的「SOTA!模型」平台,老伙计们现在也可以便捷追踪你所关注的团队的最新工作了(目前该板块部分功能尚处于内测阶段,感兴趣的老伙计们可通过申请加入「内测计划」获得相应使用权限)。
从了解到新的研究成果,到真正地在业务中将技术用起来,其中依然还有很长的一段路。即使论文的原作者已经开源了其所用代码,也放出了模型文件,当我们希望通过复现的形式用上最新的技术时,还要越过千沟万壑。
代码文档不清晰,环境配置不好导致跑不通,数据集需要对齐、格式需要进一步转换,奇怪的BUG、模型文件在不同框架之间转换后无法加载、部署困难等等,这些虽都只是日常的小麻烦,但是被积少成多的小麻烦打乱的工作节奏、耽误的工作时间,哪个一线 AI 开发者没有体验过经历这些情景时的内心崩溃与挫败感?

我们将进一步通过组织社区用户共同完善项目文档、运营「SOTA!开发者技术互助社群」、在机器之心「机动组」视频号举办原作解读交流活动、沉淀FAQ 等形式,构建中国的一线AI开发者与一线算法研究团队之间的桥梁,帮助用户铺平这用上新技术 「最后的N公里」。

新版的「SOTA!模型」将打造一个以开放为基调的第三方平台,携手机器之心的老伙计、新老朋友及业界合作伙伴通过开源代码、开放技术及提供研发资源支持等形式共同帮助用户解决这些难点、问题及需求。

老伙计们,这就开始使用机器之心SOTA!模型吧! 

网页端访问:在浏览器地址栏输入新版站点地址 sota.jiqizhixin.com ,即可前往「SOTA!模型」平台,查看关注的模型是否有新资源收录。

移动端访问:在微信移动端中搜索服务号名称 机器之心SOTA模型 」或 ID  sotaai ,关注 SOTA!模型服务号,即可通过服务号底部菜单栏使用平台功能,更有最新AI技术、开发资源及社区动态定期推送。

……. One More Thing
在新版SOTA!模型悄悄上线运营的几个月里,已有数万用户尝试了新版功能,其中,有超过一千名热心用户提交了内测计划参与申请。参与内测计划的老伙计们通过参与用户访谈、反馈问题等,帮助项目组完成了多轮迭代改善了大量平台功能,在此我们对参与内测计划的用户致以衷心的感谢!
这次升级只是一个开始,我们后续会持续优化平台功能、更新数据、运营社区,同时我们也希望邀请各位机器之心的老伙计们参与进来。在此,我们邀请 ——
① 技术有追求的一线AI开发者、工程师、算法研究员及在校学生
  • 加入社区,认领自己所参与研发的项目,链接项目用户开展原作解读、用户答疑、持续优化等互动工作,进一步帮助社区用户更便捷使用所在团队发布的项目。
  • 加入「SOTA!开发者互助社群」,分享技术开发经验,techies help techies
  • 加入内测计划,参与用户访谈,帮助我们了解您在使用新的AI技术过程中遇到的难点、问题和需求。
② 技术领先,支持生态开放,热心社区公益的AI技术团队、技术厂商 
加入机器之心 「开发者支持计划」,参与社区共建,共同帮助用户解决在使用新技术过程中遇到的难点、问题及需求 —— 
  • 将自身技术能力开放给各行业、各方面的开发者,推动 AI 技术在各行各业的落地。
  • 深度参与SOTA!模型」开放平台共建,合力打造一个专注于服务中国 AI 开发者的公共阵地。
长按下方海报扫描二维码,通过机器之心SOTA!模型 微信服务号菜单栏 ——
  • 提交内测计划、互助社群参与申请。
  • 认领我发布的项目,发布后续工作、完善项目文档、参与分享解读,通过机器之心「SOTA!模型」与项目关注者、社区用户进一步建立链接。
  • 提交机器之心「开发者支持计划」参与申请,深度参与「SOTA!模型」项目共建。


© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:content@jiqizhixin.com

登录查看更多
0

相关内容

《深度学习平台发展报告(2022年)》发布, 26页pdf
专知会员服务
118+阅读 · 2022年7月29日
【CVPR2022】基于知识蒸馏的高效预训练
专知会员服务
31+阅读 · 2022年4月23日
超大规模智能模型产业发展报告(附下载)
专知会员服务
76+阅读 · 2021年9月25日
专知会员服务
49+阅读 · 2021年6月28日
专知会员服务
44+阅读 · 2020年3月6日
如何高效、精准地进行图片搜索?看看轻量化视觉预训练模型
黑箱优化:大规模语言模型的一种落地方式
机器之心
1+阅读 · 2022年1月12日
2021,百度飞桨交出最新成绩单
AI前线
0+阅读 · 2021年12月15日
2021 Google 开发者大会丨构建高效机器学习生态
谷歌开发者
0+阅读 · 2021年11月18日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
2+阅读 · 2011年7月31日
国家自然科学基金
0+阅读 · 2008年12月31日
Arxiv
1+阅读 · 2022年10月3日
Arxiv
0+阅读 · 2022年9月28日
Arxiv
23+阅读 · 2020年9月16日
Arxiv
15+阅读 · 2019年9月11日
Arxiv
21+阅读 · 2019年3月25日
VIP会员
相关基金
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
2+阅读 · 2011年7月31日
国家自然科学基金
0+阅读 · 2008年12月31日
Top
微信扫码咨询专知VIP会员