36位老伙计荣登「春榜」!排名情况, 领奖通知, 答案公示...以及 One More Thing

2022 年 3 月 24 日 机器之心

基于「 AI人必追」的本季度举办的国际顶会及机器之心报道中的热门新工作「炼丹者必备」的基准数据集、AI顶会挑战赛优胜算法及开发基础知识,阿里云天池与机器之心团队共同设计了由60道选择题构成的「虎卷er · 春榜试题」,并编撰了 3 套独家配套技术复习资料,帮助关注前沿AI技术发展的开发者梳理第一季度的重要 AI 技术工作的同时帮助注重实践技能的开发者快速温故知新,巩固知识与技能。




今天,我们来 ——

1、公布「虎卷er · 春榜」排名情况

2、开箱「来一卷er」心意盲盒内容

3、公示 60 道「虎卷er · 春榜试题」的正确答案

以及 One More Thing  ~


「虎卷er · 春榜」排名情况

在阿里云天池与机器之心联合为老伙计们带来的「虎卷 er 行动 · 春卷er」中,我们基于「 AI人必追」的本季度举办的国际顶会及机器之心报道中的社区热议工作,「炼丹者必备」的基准数据集、AI顶会挑战赛优胜算法及开发基础知识,共同设计并发布由60道选择题构成的「虎卷er · 春榜试题」。

每题第一次答对将获得最高得分 3 分,总计满分为 180 分。下面我们统计了最终排名情况,本次共有 36 位老伙计登上「春榜」,其中 TOP 1 卷er 得分为 179 分,并且 TOP 10 卷er 神的老伙计们都达到了165分以上。

我们统计了所有「虎卷er」积分达到 60 分及以上的用户,形成「虎卷er · 春榜」,具体如下 ——


「虎卷er · 春榜」

区位

排名

ID

积分

TOP5 卷er神

1

aliyun5294086220

179

2

polar-bear-lily

177

2

jok1r

177

2

果壳码农

177

5

wawcac

174

5

lincentslz

174

5

aliyun8650707932

174

百分卷er的老伙计

8

Asteriscum

172

9

Seeker98

165

9

苏格拉没有鞋底

165

11

游客6szaraqhesy2c

164

12

wangwlj

163

13

疯游离

159

14

游客3jiexectorj7c

153

15

游客rn3xgwom74mf2

133

16

游客rg46xtn7snfq6

129

17

羽涅zpc

120

18

一个轮子

117

19

aliyun2767092904

108

20

北南西东东

105

20

游客ppzfqx2dnr73o

105

六十分卷er的老伙计

22

喵喵喵喵喵sss

89

23

aliyun7239067483

84

24

老艺人杨

75

25

heidergger

74

26

游客m23ir5qzns2b4

72

26

驽马norman

72

26

池中锦鲤

72

29

1429349039556034

69

29

游客u2eosh5ynsbbs

69

29

RomanUSTC

69

32

aliyun5863415169

68

33

1868524923381147

66

34

Mellon

60

34

mybote

60

34

艾莉西亚urAngelBae

60

本次「虎卷 er 行动 · 春卷er」在排除了异常数据及重复提交后,共有近 4000 次的独立答题提交。


我们对四种试题类型的得分情况进行分析,根据结果显示,老伙计们在虎年热门工作类型下答题正确率最高,为 36.63%,其次 AI 开发者常用的基准数据集总部正确率为 26.74%,AI Foundations 正确率为 24.07%。刷爆顶会挑战赛的算法总部正确率最低仅为 12.56%。


下面我们将对四个试题类型下答题错误率最高的题目进行解析。


在「虎年 HOT AI 工作回顾 · Q1篇」试题类型下,「AAAI 2022 Outstanding Paper Award 是有关哪个方向的研究?」的错误率最高。本道题正确的答案为推荐系统。AAAI 2022 Outstanding Paper Award 的获奖工作为:巴黎第九大学、法国国家科学研究中心、Meta AI 等提出了一种样本高效算法理论上保证推荐系统不会降低用户体验。

在「AI 开发者常用的基准数据集总部」试题类型下,「新基准 SCROLLS 包含 Summarization、QA、NLI 任务,涵盖 Literature、Science 等多个领域。SCROLLS 的发布机构不包含以下哪个?」的错误率最高。不包含的发布机构为 Microsoft Research。新基准SCROLLS由IBM研究院、Meta AI等多家机构发布,包含总结、问题回答和自然语言推理任务,涵盖多个领域,包括文学、科学、商业和娱乐。

在「刷爆顶会挑战赛的算法总部」试题类型下,「CVPR 2021 AliProducts Challenge: Large-scale Product Recognition 中第一名 Joyy AI Research 的解决方案中使用了三个 Backbone,其中不包括下面哪个?」错误率最高。这道题不包括的 Backbone 是 mlp-mixer。Joyy AI Research 使用的三个骨干模型分别是 efficientnet,efficientnetv2 和 nfnet。

在「AI Foundations」试题类型下,「在卷积神经网络(CNN)中,使用 5*5 的卷积核对 500*500 的图片求卷积,那么在输入层和卷积层之间一共有多少个参数需要训练?」这题的错误率最高,同时该题也是本次「春卷er」答题错误率最高的一题,为 74.2%。下面我们来看看这道题的分析思路。

CNN 主要由输入层、卷积层、ReLU 层、池化层和全连接层组成。输入层到卷积层的训练参数分析:使用 1 个 5*5 卷积核对一张 500*500 的图片进行卷积,总共有 5x5 = 25 个权重参数和 1 个偏置参数,一共是 26 个训练参数。


本期 60 道「春榜大题」由「最会追踪 AI 算法的机器之心SOTA!模型」「最会办算法类赛事的阿里云天池」联合打造。

众所周知,阿里云天池以“中国算法类赛事第一品牌”被业界和开发者所熟知,天池主打业务包括天池大赛、天池数据科研、天池AI实训等,为AI爱好者提供了分享、互动、成长的社区阵地,孵化了面向AI教学的实训平台,并发行了国内首本竞赛实战图书《天池大赛赛题解析》,助力300多所高校开展AI实战教学,成功运作400余场高规格算法类竞赛,覆盖全球98个国家和地区的100万数据开发工程师。
天池在AI技术人才的培育方面也极其务实。基于天池2.0数据集开源计划,天池为AI开发者提供了数百个行业大规模开源数据集,其中既有来自工业界的真实数据,也不乏跟产业界、学术界深入合作获得的宝贵科研数据,覆盖零售、文娱、工业、医疗、自然科学等数十个行业。基于这些数据集产出的学术论文,已经超过700篇。


「来一卷er」心意盲盒开箱


「虎卷er · 春榜」上榜的老伙计们,均将获得机器之心「SOTA!模型」、「机动组」及「虎卷er · 春榜」合作伙伴共同准备的「来一卷er」心意盲盒,具体内容如下 ——

「虎卷er ·冬榜」 区位 终身学AI · 专业书籍 机器之心 SOTA!模型
   「小土同学搞 AI 」气氛组套装
T-shirt 贴纸 公仔
TOP5 的卷er神 2本:可选其中1本 2件:可选图案 2包 1只
百分卷er的老伙计 1本:随机 1件:可选图案 1包 1 只
六十分卷er的老伙计
1件:随机图案 1包 1 只


在「来一卷er」心意盲盒之外,「虎卷er · 春榜」 区位为TOP 5的卷er神的 7 位老伙计将获得

  • 「虎卷er · 冬榜 | TOP5 的卷er神」实体奖杯 1 个


所有「虎卷er · 春榜」上榜老伙计均将获得 ——


  • 「虎卷er · 春榜 | 老伙计牛吖!」区位电子证书 1 份 


如何领取?
请以上春榜的用户在2022年4月2日前联系我们机器之心「 SOTA!模型助手 」开启「来一卷er」心意盲盒,过时自动弃领 。 请扫描二维码添加好友 ,小助手核对您的身份,确认为获奖用户后,将协助您完成礼品的领取~


60道「虎卷er · 春榜试题」答案公示


全部60道「虎卷er · 春榜试题」答案已于下方表格中标出,我们也将在机器之心SOTA!模型服务号长期放置复习资料与答案,方便老伙计们在遵循CC-BY-SA 协议的前提下使用。


One More Thing!

没能赶上答题通道开放时间的老伙计们可以通过关注机器之心SOTA!模型服务号查阅复习资料,进行自测!更可第一时间了解「虎卷 er 行动 · 夏卷er」的启动动态~

以下为全部60道「虎卷er · 春榜试题」正确答案:


1
在 CNN 网络中,某图经过核为 3x3,步长为 2 的卷积层,ReLU 激活函数层,BN 层,以及一个步长为 2,核为 2*2 的池化层后,再经过一个 3*3 的的卷积层,步长为 1,此时的感受野是?
13
12
11
10
2
以下是非马尔科夫过程的是?

独立增量过程

泊松过程

维纳过程

自回归过程

3

以下对 k-means 聚类算法解释正确的是?

能自动识别类的个数,随机挑选初始点为中心点计算

能自动识别类的个数,不是随机挑选初始点为中心点计算

不能自动识别类的个数,随机挑选初始点为中心点计算

不能自动识别类的个数,不是随机挑选初始点为中心点计算

4

某个二分类模型,在训练数据上表现很好,但是在验证数据上表现不佳,通常称这种问题为?

欠拟合

过拟合

样本不均衡

样本缺失

5

下列哪一个不是常用于回归建模问题的损失函数?

均方误差(MSE Loss)

交叉熵(Cross Entropy Loss)

均绝对误差(MAE Loss)

Huber Loss

6

下列哪一个不是LSTM(Long Short-Term Memory)的门控单元?

输出门

更新门

输入门

遗忘门

7

在卷积神经网络(CNN)中,使用 5*5 的卷积核对 500*500 的图片求卷积,那么在输入层和卷积层之间一共有多少个参数需要训练?

10000

25
26

250000

8

在机器学习的分类模型中,评估模型预测效果的指标有准确率(Accuracy)、召回率(Recall)、精确率(Precision)、F1指标(F1 measure),下列属于Recall 指标的表达式为?

正确的正例样本数/样本中的正例样本数

提取出的正确样本数/总样本数

正确的正例样本数/预测为正例的样本数

Precision*Recall*2 / (Precision+Recall)

9

进行机器学习的时候,通常需要对数据进行降维处理,关于降维,以下说法错误的是?

降维可以节省存储空间

一般先使用非线性降维的方法,再使用线性降维的方法

降维可以去除冗余特征

降维从一定程度上可以防止模型过拟合

10

对于一个深度学习分类任务,如果权重初始化时所有变量都设置为 0,下面哪一个描述是正确的?

没有问题,深度学习拟合能力很强,可以正常训练得到结果

深度学习不会开始训练,因为没有梯度变化

深度学习可以训练,但所有的类别都会被识别为一类
以上说法都不对
11

下列关于线性回归中的残差说法正确的是?

残差均值总是为零 残差均值总是小于零 残差均值总是大于零 以上说法都不对
12

下面对激活函数描述正确的是?

激活函数引入线性因素,提高了模型的表达能力

随着层深的增加,ReLU 精度降低较小,因此被广泛应用

平滑的激活函数允许更好的信息深入神经网络,从而得到更好的准确性和泛化

Transformer FFN 层用的激活函数是 Tanh,收敛速度快、不会出现梯度消失或梯度爆炸的问题、计算复杂度低

13

下面关于随机森林和 GBDT 说法正确的是?

随机森林的中间树不是相互独立的,而 GBDT 的中间树是相互独立的

两者都使用随机特征子集来创建中间树

无论任何数据,GBDT 总是优于随机森林

无论任何数据,随机森林总是优于 GBDT

14

训练神经网络时,Mini-Batch 最好是 2 的倍数,如 256 或 512,这样做的好处是什么?

使用偶数时梯度下降最优

优化显存使用,提升神经网络的并行性能

使用奇数时损失不稳定

以上都不是

15

下面哪些选项能够缓解模型训练时的过拟合现象?①增加更多数据;②使用数据增强;③采用泛化性能更好的模型;④增加正则;⑤降低模型的复杂度。

①、②、③

①、④、⑤

①、③、④、⑤

以上都是

16

以下不属于深度学习领域的经典网络是?

卷积神经网络

长短期记忆神经网络

残差神经网络

多层神经网络

17

以下哪一项不是机器学习过程中的降维算法?

特征选择法

特征推导法 核平滑法

聚类法

18

下面有关分类算法的准确率,召回率,F1 值的描述,错误的是?

准确率是检索出相关文档数与检索出的文档总数的比率,衡量的是检索系统的查准率

召回率是指检索出的相关文档数和文档库中所有的相关文档数的比率,衡量的是检索系统的查全率

确的正例样本数/预测为正例的样本数

为了解决准确率和召回率冲突问题,引入了 F1 分数

19

Nave Bayes 是一种特殊的 Bayes 分类器,特征变量是 X,类别标签是 C,它的一个假定是?

各类别的先验概率P(C)是相等的

以0为均值,sqr(2)/2为标准差的正态分布

特征变量X的各个维度是类别条件独立随机变量

P(X|C)是高斯分布

20

我们想在大数据集上训练随机森林, 为了使用较少时间, 我们可以?

增加树的深度

减少学习率(Learning Rate)

减少树的深度

增加树的数量

21

具有线性复杂度 (O(N)) 且在长序列任务中速度和显存方面显著优于 Transformer 的计算模型 PoNet 是由下面哪个机构提出的?

阿里巴巴达摩院

Google

字节跳动

微软

22

2022 年 1 月浙大和阿里巴巴达摩院联合提出一个多尺度自适应图神经网络(MAGNN)在四个真实世界的数据集实验中取得 SOTA 表现,请问是哪四类数据集?

太阳能、交通、电力、汇率

太阳能、交通、风力、汇率

太阳能、交通、电力、股市

风力、交通、电力、股市

23

2022 年 1 月,阿里巴巴达摩院提出了一个基于核的神经网络 DURation,该技术主要应用于什么问题?

电商图像描述生成

电商推荐系统

电商文本到图像生成

电商图文检索

24

用于对中文语音进行语音的命名实体识别任务的数据集 AISEHLL-NER 是以下哪个机构发布的?

阿里巴巴达摩院

腾讯

快手

讯飞

25

阿里巴巴达摩院推出十万亿参数超大规模通用性人工智能大模型 M6-10T,该模型使用 512 GPU 在多少天内即训练出具有可用水平的 10 万亿模型?

5天

10天

15天

20天

26

深度语言模型体系 AliceMind 由阿里巴巴达摩院历经三年打造,并于 21 年 6 月开源。请问以下哪一个模型不属于该体系?

StructBERT

VECO

PALM

FILTER

27

MUGE(Multimodal Understanding and Generation Evaluation)是业界首个大规模中文多模态评测基准,由阿里巴巴达摩院联合浙江大学、天池平台联合发布。请问以下哪个任务不属于该基准?

电商图像描述生成

电商视频描述生成

电商文本到图像生成

电商图文检索

28

由天池平台承办的中文医疗信息处理挑战榜 CBLUE(Chinese Biomedical Language Understanding Evaluation),其 2.0 版本相较于 1.0 版本新增了 1 个大类任务,请问是以下选项中的哪一个?

医学对话理解与生成

医学术语标准化

医学文本分类

医学句子语义关系判定

29

由阿里巴巴达摩院决策智能实验室维护,依托于天池平台支持的 RABBO(Real-Aplication Black-Box Optimization benchmark)榜单,不包含以下哪个题目集?

金属冶炼配比优化

火星车路径规划

火星车路径规划

光伏电站微观选

30

中国人工智能学会举办的首届全球人工智能技术创新大赛,是基于哪个竞赛平台举办的?

阿里云天池

Kaggle

DataCastle

DataFountain

31

今年 2 月份使用深度强化学习控制托卡马克装置等离子体的研究登上了《自然》杂志,该项工作是瑞士洛桑联邦理工学院 EPFL 和哪个机构合著的?

OpenAI

NVIDIA

DeepMind

SpaceX

32

今年 2 月份在 GitHub 上名为 Real-CUGAN 的图像超分辨率的项目热度很高,可以把动画图像的质量提升 2 到 4 倍,该项目是来自以下哪个机构的实验室?

字节跳动

腾讯

谷歌

哔哩哔哩

33

在 2022 年 Q1 季度中,DeepMind 发布 AlphaCode,实验结果表明在 Codeforces 挑战中,AlphaCode 超过了多少的参赛者?

20.8%

33.6%

45.7%

79.2%

34

在 2022 年 Q1 季度中,哪个机构开发的神经定理证明器成功解出了两道国际奥数题?

DeepMind

Google

OpenAI

Stanford

35

能够预测蛋白质的功能和作用,让主流数据库 Pfam 中注释的蛋白质序列增加了近 10%,并预测了 360 种人类蛋白质功能的是以下哪种技术?

AlphaFold

AlphaFold 2

ProtCNN

TRFold

36

2022 年 2 月,来自 Google AI 和 Waymo 的研究人员提出了一种神经辐射场的变体 Block-NeRF,请问他们用 280 万张街景图片重建了哪个城市?

纽约

旧金山

硅谷

洛杉矶

37

谷歌发布的接近人类水平的对话 AI 模型 LaMDA 的参数量是多少?

13.7亿

137亿

1370亿

13700亿

38

2022 年 1 月,Meta AI 提出了一种名为 data2vec 的适用于多模态的学习框架,请问该框架是为了以下哪种学习方式打造的?

强化学习

无监督学习

自监督学习

半监督学习

39

2022 年初,英伟达使用一种多分辨率哈希编码技术训练 NeRF,最快只需多长时间?

5秒

5分钟

5小时

5天

40

AAAI 2022 Outstanding Paper Award 是有关哪个方向的研究?

机器学习可解释性

推荐系统

图优化

自然语言生成系统

41

高水平轻量化的两人无限注德州扑克 AI 程序 AlphaHoldem 是 AAAI 2022 Distinguished Papers 之一,请问该工作来自以下哪个机构?

清华大学

北京大学

中国科学院自动化研究所

北京邮电大学

42

AAAI 2022 Distinguished Papers 之一是巴黎-萨克雷大学等提出的新 Metric InfoLM,论文实验结果表明在 Summarization 和 Data2Text Generation 上取得了超过多少点的相关增益?

5
10
15
20
43

NTU RGB+D 是一个用于 RGB-D 人类动作识别的大规模数据集,该数据集包含 60 个 Action Classes,这些 Actions 一般被分为多少个 Category?

1
3
5
7
44

自 2010 年以来,ImageNet 被用于 ImageNet 大规模视觉识别挑战赛(ILSVRC),该数据集可以属于哪个模态 ?

图像

文本

点云

RGB-D

45

CIFAR-10 数据集是 Tiny Images 数据集的一个子集,由 60000 张彩色图像组成,其中这些图像的大小是?

28x28

32x32

64x64

128x128

46

MNIST 数据库是一个大型的手写数字集合,其中包含的训练集和测试集比例是多少?

4:1

5:1

6:1

7:1

47

GLUE(General Language Understanding Evaluation)不包含以下哪类任务?

Single-sentence tasks

Similarity and paraphrase tasks

Inference tasks

Generation taks

48

WikiSQL 数据集属于下面哪个模态?

图像

文本

视频

音频

49

截止 2022 年 2 月,SQuAD 最新的版本是?

SQuAD 1.2

SQuAD 2.0

SQuAD 2.1 SQuAD 3.0
50

CelebFaces Attributes 数据集中,每张图像包含几个 Landmark locations 标注?

1
3
5
7
51

UCF101 数据集中视频片段类别可以分为 5 种类型,其中不包括下面哪个类型?

Body motion

Human-human interactions

Human-object interactions

Dance shows

52

Cityscapes 是一个大规模的数据库,它为 30 个 Classes 提供语义、实例和密集的像素注释,这 30 个 Classes 又被分为几个 Categories?

6
7
8 9
53

新基准 SCROLLS 包含 Summarization、QA、NLI 任务,涵盖 Literature、Science 等多个领域。SCROLLS 的发布机构不包含以下哪个?

Allen Institute for AI

IBM Research

Meta AI

Microsoft Research

54

CLUE 团队发布应用在 NLP 领域的数据为中心的基准 DataCLUE,是在什么思想下实践的?

英文 NLP 任务在以数据为中心的思想下的实践

中文 NLP 任务在以数据为中心的思想下的实践

英文 NLP 任务在以模型为中心的思想下的实践

中文 NLP 任务在以模型为中心的思想下的实践

55

中科院智能交互团队获 ACM Multimedia 2021 多模态情感识别挑战赛三项冠军,其中哪项任务没有获得冠军?

Multimodal Continuous Emotions in-the-Wild Sub-challenge (MuSe-Wilder)

Multimodal Sentiment Sub-challenge (MuSe-Sent)

Multimodal Emotional Stress Sub-challenge (MuSe-Stress)

Multimodal Physiological-Arousal Sub-challenge (MuSe-Physio)

56

巴黎高科路桥学校等组成的团队斩获ICCV2021的UVO(Unidentified Video Objects) Challenge 双赛道冠军,其中在基于图片的开放世界实例分割这个赛道中,训练所用的数据集是?

COCO

MNIST

CIFAR-10

CIFAR-100

57

来自上海交通大学电子工程系的 “IntelligentLight” 团队获 KDD CUP 2021 City Brain Challenge 冠军,比赛方案的核心亮点中基于哪种训练方法对模型进行训练?

自监督

半监督

无监督

强化学习

58

在 ICCV 2021 挑战赛中,深兰科技 DeepBlueAI 团队共参加 2 项比赛 4 个赛道,分别在三个赛道中获得冠军,其中不包括哪个赛道?

VisDrone Object Detection

VisDroneMot

Large-AI-Food.VisDrone

Large-Scale Fine-Grained Food Recognition

49

CVPR 2021 AliProducts Challenge: Large-scale Product Recognition 中第一名 Joyy AI Research 的解决方案中使用了三个 Backbone,其中不包括下面哪个?

efficientnet

efficientnetv2

nfnet

mlp-mixer

60

ACM MM 2021 Watch and Buy: Multimodal Product Identification Challenge 冠军方案在物体检测识别模块中使用了什么模型作为骨干?

ResNet18

ResNet50

ResNet100

VGG


登录查看更多
0

相关内容

国际概念建模会议(ER)是介绍和讨论当前概念建模研究的主要国际论坛。感兴趣的主题内容横跨整个概念建模包括等领域的研究和实践。 官网地址:http://dblp.uni-trier.de/db/conf/er/
ICLR 2022接受论文列表出炉!1095 篇论文都在这了!
专知会员服务
75+阅读 · 2022年1月30日
NeurIPS 2021 Spotlight | 针对有缺失坐标的聚类问题的核心集
专知会员服务
14+阅读 · 2021年11月27日
NeurIPS 20201接收论文列表发布,2334篇论文都在这了!
专知会员服务
37+阅读 · 2021年11月4日
ICML 2021论文收录
专知会员服务
122+阅读 · 2021年5月8日
专知会员服务
54+阅读 · 2021年2月2日
专知会员服务
45+阅读 · 2020年10月5日
ICLR 2022论文列表公布,接收率高达32%
机器之心
1+阅读 · 2022年1月29日
ICLR 2022提前放榜!被拒理由遭吐槽...
CVer
1+阅读 · 2022年1月28日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Verified Compilation of Quantum Oracles
Arxiv
0+阅读 · 2022年4月20日
Arxiv
0+阅读 · 2022年4月20日
Arxiv
0+阅读 · 2022年4月20日
Arxiv
0+阅读 · 2022年4月19日
Arxiv
0+阅读 · 2022年4月18日
VIP会员
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Top
微信扫码咨询专知VIP会员