基于「 AI人必追」的本季度举办的国际顶会及机器之心报道中的热门新工作,「炼丹者必备」的基准数据集、AI顶会挑战赛优胜算法及开发基础知识,阿里云天池与机器之心团队共同设计了由60道选择题构成的「虎卷er · 春榜试题」,并编撰了 3 套独家配套技术复习资料,帮助关注前沿AI技术发展的开发者梳理第一季度的重要 AI 技术工作的同时帮助注重实践技能的开发者快速温故知新,巩固知识与技能。
今天,我们来 ——
1、公布「虎卷er · 春榜」排名情况
2、开箱「来一卷er」心意盲盒内容
3、公示 60 道「虎卷er · 春榜试题」的正确答案
以及 One More Thing ~
我们统计了所有「虎卷er」积分达到 60 分及以上的用户,形成「虎卷er · 春榜」,具体如下 ——
「虎卷er · 春榜」 |
|||
区位 |
排名 |
ID |
积分 |
TOP5 卷er神 |
1 |
aliyun5294086220 |
179 |
2 |
polar-bear-lily |
177 |
|
2 |
jok1r |
177 |
|
2 |
果壳码农 |
177 |
|
5 |
wawcac |
174 |
|
5 |
lincentslz |
174 |
|
5 |
aliyun8650707932 |
174 |
|
百分卷er的老伙计 |
8 |
Asteriscum |
172 |
9 |
Seeker98 |
165 |
|
9 |
苏格拉没有鞋底 |
165 |
|
11 |
游客6szaraqhesy2c |
164 |
|
12 |
wangwlj |
163 |
|
13 |
疯游离 |
159 |
|
14 |
游客3jiexectorj7c |
153 |
|
15 |
游客rn3xgwom74mf2 |
133 |
|
16 |
游客rg46xtn7snfq6 |
129 |
|
17 |
羽涅zpc |
120 |
|
18 |
一个轮子 |
117 |
|
19 |
aliyun2767092904 |
108 |
|
20 |
北南西东东 |
105 |
|
20 |
游客ppzfqx2dnr73o |
105 |
|
六十分卷er的老伙计 |
22 |
喵喵喵喵喵sss |
89 |
23 |
aliyun7239067483 |
84 |
|
24 |
老艺人杨 |
75 |
|
25 |
heidergger |
74 |
|
26 |
游客m23ir5qzns2b4 |
72 |
|
26 |
驽马norman |
72 |
|
26 |
池中锦鲤 |
72 |
|
29 |
1429349039556034 |
69 |
|
29 |
游客u2eosh5ynsbbs |
69 |
|
29 |
RomanUSTC |
69 |
|
32 |
aliyun5863415169 |
68 |
|
33 |
1868524923381147 |
66 |
|
34 |
Mellon |
60 |
|
34 |
mybote |
60 |
|
34 |
艾莉西亚urAngelBae |
60 |
本次「虎卷 er 行动 · 春卷er」在排除了异常数据及重复提交后,共有近 4000 次的独立答题提交。
我们对四种试题类型的得分情况进行分析,根据结果显示,老伙计们在虎年热门工作类型下答题正确率最高,为 36.63%,其次 AI 开发者常用的基准数据集总部正确率为 26.74%,AI Foundations 正确率为 24.07%。刷爆顶会挑战赛的算法总部正确率最低仅为 12.56%。
下面我们将对四个试题类型下答题错误率最高的题目进行解析。
在「虎年 HOT AI 工作回顾 · Q1篇」试题类型下,「AAAI 2022 Outstanding Paper Award 是有关哪个方向的研究?」的错误率最高。本道题正确的答案为推荐系统。AAAI 2022 Outstanding Paper Award 的获奖工作为:巴黎第九大学、法国国家科学研究中心、Meta AI 等提出了一种样本高效算法理论上保证推荐系统不会降低用户体验。
在「AI 开发者常用的基准数据集总部」试题类型下,「新基准 SCROLLS 包含 Summarization、QA、NLI 任务,涵盖 Literature、Science 等多个领域。SCROLLS 的发布机构不包含以下哪个?」的错误率最高。不包含的发布机构为 Microsoft Research。新基准SCROLLS由IBM研究院、Meta AI等多家机构发布,包含总结、问题回答和自然语言推理任务,涵盖多个领域,包括文学、科学、商业和娱乐。
在「刷爆顶会挑战赛的算法总部」试题类型下,「CVPR 2021 AliProducts Challenge: Large-scale Product Recognition 中第一名 Joyy AI Research 的解决方案中使用了三个 Backbone,其中不包括下面哪个?」错误率最高。这道题不包括的 Backbone 是 mlp-mixer。Joyy AI Research 使用的三个骨干模型分别是 efficientnet,efficientnetv2 和 nfnet。
在「AI Foundations」试题类型下,「在卷积神经网络(CNN)中,使用 5*5 的卷积核对 500*500 的图片求卷积,那么在输入层和卷积层之间一共有多少个参数需要训练?」这题的错误率最高,同时该题也是本次「春卷er」答题错误率最高的一题,为 74.2%。下面我们来看看这道题的分析思路。
CNN 主要由输入层、卷积层、ReLU 层、池化层和全连接层组成。输入层到卷积层的训练参数分析:使用 1 个 5*5 卷积核对一张 500*500 的图片进行卷积,总共有 5x5 = 25 个权重参数和 1 个偏置参数,一共是 26 个训练参数。
「来一卷er」心意盲盒开箱
「虎卷er · 春榜」上榜的老伙计们,均将获得机器之心「SOTA!模型」、「机动组」及「虎卷er · 春榜」合作伙伴共同准备的「来一卷er」心意盲盒,具体内容如下 ——
「虎卷er ·冬榜」 区位 | 终身学AI · 专业书籍 | 机器之心 SOTA!模型 「小土同学搞 AI 」气氛组套装 |
||
T-shirt | 贴纸 | 公仔 | ||
TOP5 的卷er神 | 2本:可选其中1本 | 2件:可选图案 | 2包 | 1只 |
百分卷er的老伙计 | 1本:随机 | 1件:可选图案 | 1包 | 1 只 |
六十分卷er的老伙计 | 无 |
1件:随机图案 | 1包 | 1 只 |
在「来一卷er」心意盲盒之外,「虎卷er · 春榜」 区位为「TOP 5的卷er神」的 7 位老伙计将获得
「虎卷er · 冬榜 | TOP5 的卷er神」实体奖杯 1 个
所有「虎卷er · 春榜」上榜老伙计均将获得 ——
「虎卷er · 春榜 | 老伙计牛吖!」区位电子证书 1 份
60道「虎卷er · 春榜试题」答案公示
全部60道「虎卷er · 春榜试题」答案已于下方表格中标出,我们也将在机器之心SOTA!模型服务号长期放置复习资料与答案,方便老伙计们在遵循CC-BY-SA 协议的前提下使用。
没能赶上答题通道开放时间的老伙计们可以通过关注机器之心SOTA!模型服务号查阅复习资料,进行自测!更可第一时间了解「虎卷 er 行动 · 夏卷er」的启动动态~
以下为全部60道「虎卷er · 春榜试题」正确答案:
|
|
|||
|
|
|
|
|
|
|
|||
独立增量过程 |
泊松过程 |
维纳过程 |
自回归过程 |
|
|
以下对 k-means 聚类算法解释正确的是? |
|||
能自动识别类的个数,随机挑选初始点为中心点计算 |
能自动识别类的个数,不是随机挑选初始点为中心点计算 |
不能自动识别类的个数,随机挑选初始点为中心点计算 |
不能自动识别类的个数,不是随机挑选初始点为中心点计算 |
|
|
某个二分类模型,在训练数据上表现很好,但是在验证数据上表现不佳,通常称这种问题为? |
|||
欠拟合 |
过拟合 |
样本不均衡 |
样本缺失 |
|
|
下列哪一个不是常用于回归建模问题的损失函数? |
|||
均方误差(MSE Loss) |
交叉熵(Cross Entropy Loss) |
均绝对误差(MAE Loss) |
Huber Loss |
|
|
下列哪一个不是LSTM(Long Short-Term Memory)的门控单元? |
|||
输出门 |
更新门 |
输入门 |
遗忘门 |
|
|
在卷积神经网络(CNN)中,使用 5*5 的卷积核对 500*500 的图片求卷积,那么在输入层和卷积层之间一共有多少个参数需要训练? |
|||
10000 |
|
|
250000 |
|
|
在机器学习的分类模型中,评估模型预测效果的指标有准确率(Accuracy)、召回率(Recall)、精确率(Precision)、F1指标(F1 measure),下列属于Recall 指标的表达式为? |
|||
正确的正例样本数/样本中的正例样本数 |
提取出的正确样本数/总样本数 |
正确的正例样本数/预测为正例的样本数 |
Precision*Recall*2 / (Precision+Recall) |
|
|
进行机器学习的时候,通常需要对数据进行降维处理,关于降维,以下说法错误的是? |
|||
降维可以节省存储空间 |
一般先使用非线性降维的方法,再使用线性降维的方法 |
降维可以去除冗余特征 |
降维从一定程度上可以防止模型过拟合 |
|
|
对于一个深度学习分类任务,如果权重初始化时所有变量都设置为 0,下面哪一个描述是正确的? |
|||
没有问题,深度学习拟合能力很强,可以正常训练得到结果 |
深度学习不会开始训练,因为没有梯度变化 |
|
|
|
|
下列关于线性回归中的残差说法正确的是? |
|||
残差均值总是为零 | 残差均值总是小于零 | 残差均值总是大于零 | 以上说法都不对 | |
|
下面对激活函数描述正确的是? |
|||
激活函数引入线性因素,提高了模型的表达能力 |
随着层深的增加,ReLU 精度降低较小,因此被广泛应用 |
平滑的激活函数允许更好的信息深入神经网络,从而得到更好的准确性和泛化 |
Transformer FFN 层用的激活函数是 Tanh,收敛速度快、不会出现梯度消失或梯度爆炸的问题、计算复杂度低 |
|
|
下面关于随机森林和 GBDT 说法正确的是? |
|||
随机森林的中间树不是相互独立的,而 GBDT 的中间树是相互独立的 |
两者都使用随机特征子集来创建中间树 |
无论任何数据,GBDT 总是优于随机森林 |
无论任何数据,随机森林总是优于 GBDT |
|
|
训练神经网络时,Mini-Batch 最好是 2 的倍数,如 256 或 512,这样做的好处是什么? |
|||
使用偶数时梯度下降最优 |
优化显存使用,提升神经网络的并行性能 |
使用奇数时损失不稳定 | 以上都不是 |
|
|
下面哪些选项能够缓解模型训练时的过拟合现象?①增加更多数据;②使用数据增强;③采用泛化性能更好的模型;④增加正则;⑤降低模型的复杂度。 |
|||
①、②、③ |
①、④、⑤ |
①、③、④、⑤ |
以上都是 |
|
|
以下不属于深度学习领域的经典网络是? |
|||
卷积神经网络 |
长短期记忆神经网络 |
残差神经网络 |
多层神经网络 |
|
|
以下哪一项不是机器学习过程中的降维算法? |
|||
特征选择法 |
特征推导法 | 核平滑法 | 聚类法 |
|
|
下面有关分类算法的准确率,召回率,F1 值的描述,错误的是? |
|||
准确率是检索出相关文档数与检索出的文档总数的比率,衡量的是检索系统的查准率 |
召回率是指检索出的相关文档数和文档库中所有的相关文档数的比率,衡量的是检索系统的查全率 |
正确的正例样本数/预测为正例的样本数 |
为了解决准确率和召回率冲突问题,引入了 F1 分数 |
|
|
Nave Bayes 是一种特殊的 Bayes 分类器,特征变量是 X,类别标签是 C,它的一个假定是? |
|||
各类别的先验概率P(C)是相等的 |
以0为均值,sqr(2)/2为标准差的正态分布 |
特征变量X的各个维度是类别条件独立随机变量 |
P(X|C)是高斯分布 |
|
|
我们想在大数据集上训练随机森林, 为了使用较少时间, 我们可以? |
|||
增加树的深度 |
减少学习率(Learning Rate) |
减少树的深度 |
增加树的数量 |
|
|
具有线性复杂度 (O(N)) 且在长序列任务中速度和显存方面显著优于 Transformer 的计算模型 PoNet 是由下面哪个机构提出的? |
|||
阿里巴巴达摩院 |
字节跳动 |
微软 |
||
|
2022 年 1 月浙大和阿里巴巴达摩院联合提出一个多尺度自适应图神经网络(MAGNN)在四个真实世界的数据集实验中取得 SOTA 表现,请问是哪四类数据集? |
|||
太阳能、交通、电力、汇率 |
太阳能、交通、风力、汇率 |
太阳能、交通、电力、股市 |
风力、交通、电力、股市 |
|
|
2022 年 1 月,阿里巴巴达摩院提出了一个基于核的神经网络 DURation,该技术主要应用于什么问题? |
|||
电商图像描述生成 |
电商推荐系统 |
电商文本到图像生成 |
电商图文检索 |
|
|
用于对中文语音进行语音的命名实体识别任务的数据集 AISEHLL-NER 是以下哪个机构发布的? |
|||
阿里巴巴达摩院 |
腾讯 |
快手 |
讯飞 |
|
|
阿里巴巴达摩院推出十万亿参数超大规模通用性人工智能大模型 M6-10T,该模型使用 512 GPU 在多少天内即训练出具有可用水平的 10 万亿模型? |
|||
5天 |
10天 |
15天 |
20天 |
|
|
深度语言模型体系 AliceMind 由阿里巴巴达摩院历经三年打造,并于 21 年 6 月开源。请问以下哪一个模型不属于该体系? |
|||
StructBERT |
VECO |
PALM |
FILTER |
|
|
MUGE(Multimodal Understanding and Generation Evaluation)是业界首个大规模中文多模态评测基准,由阿里巴巴达摩院联合浙江大学、天池平台联合发布。请问以下哪个任务不属于该基准? |
|||
电商图像描述生成 |
电商视频描述生成 |
电商文本到图像生成 |
电商图文检索 |
|
|
由天池平台承办的中文医疗信息处理挑战榜 CBLUE(Chinese Biomedical Language Understanding Evaluation),其 2.0 版本相较于 1.0 版本新增了 1 个大类任务,请问是以下选项中的哪一个? |
|||
医学对话理解与生成 |
医学术语标准化 |
医学文本分类 |
医学句子语义关系判定 |
|
|
由阿里巴巴达摩院决策智能实验室维护,依托于天池平台支持的 RABBO(Real-Aplication Black-Box Optimization benchmark)榜单,不包含以下哪个题目集? |
|||
金属冶炼配比优化 |
火星车路径规划 |
火星车路径规划 |
光伏电站微观选 |
|
|
中国人工智能学会举办的首届全球人工智能技术创新大赛,是基于哪个竞赛平台举办的? |
|||
阿里云天池 |
Kaggle |
DataCastle |
DataFountain |
|
|
今年 2 月份使用深度强化学习控制托卡马克装置等离子体的研究登上了《自然》杂志,该项工作是瑞士洛桑联邦理工学院 EPFL 和哪个机构合著的? |
|||
OpenAI |
NVIDIA |
DeepMind |
SpaceX |
|
|
今年 2 月份在 GitHub 上名为 Real-CUGAN 的图像超分辨率的项目热度很高,可以把动画图像的质量提升 2 到 4 倍,该项目是来自以下哪个机构的实验室? |
|||
字节跳动 |
腾讯 |
谷歌 |
哔哩哔哩 |
|
|
在 2022 年 Q1 季度中,DeepMind 发布 AlphaCode,实验结果表明在 Codeforces 挑战中,AlphaCode 超过了多少的参赛者? |
|||
20.8% |
33.6% |
45.7% |
79.2% |
|
|
在 2022 年 Q1 季度中,哪个机构开发的神经定理证明器成功解出了两道国际奥数题? |
|||
DeepMind |
OpenAI |
Stanford |
||
|
能够预测蛋白质的功能和作用,让主流数据库 Pfam 中注释的蛋白质序列增加了近 10%,并预测了 360 种人类蛋白质功能的是以下哪种技术? |
|||
AlphaFold |
AlphaFold 2 |
ProtCNN |
TRFold |
|
|
2022 年 2 月,来自 Google AI 和 Waymo 的研究人员提出了一种神经辐射场的变体 Block-NeRF,请问他们用 280 万张街景图片重建了哪个城市? |
|||
纽约 |
旧金山 |
硅谷 |
洛杉矶 |
|
|
谷歌发布的接近人类水平的对话 AI 模型 LaMDA 的参数量是多少? |
|||
13.7亿 |
137亿 |
1370亿 |
13700亿 |
|
|
2022 年 1 月,Meta AI 提出了一种名为 data2vec 的适用于多模态的学习框架,请问该框架是为了以下哪种学习方式打造的? |
|||
强化学习 |
无监督学习 |
自监督学习 |
半监督学习 |
|
|
2022 年初,英伟达使用一种多分辨率哈希编码技术训练 NeRF,最快只需多长时间? |
|||
5秒 |
5分钟 |
5小时 |
5天 |
|
|
AAAI 2022 Outstanding Paper Award 是有关哪个方向的研究? |
|||
机器学习可解释性 |
推荐系统 |
图优化 |
自然语言生成系统 |
|
|
高水平轻量化的两人无限注德州扑克 AI 程序 AlphaHoldem 是 AAAI 2022 Distinguished Papers 之一,请问该工作来自以下哪个机构? |
|||
清华大学 |
北京大学 |
中国科学院自动化研究所 |
北京邮电大学 |
|
|
AAAI 2022 Distinguished Papers 之一是巴黎-萨克雷大学等提出的新 Metric InfoLM,论文实验结果表明在 Summarization 和 Data2Text Generation 上取得了超过多少点的相关增益? |
|||
5 |
10 |
15 |
20 |
|
|
NTU RGB+D 是一个用于 RGB-D 人类动作识别的大规模数据集,该数据集包含 60 个 Action Classes,这些 Actions 一般被分为多少个 Category? |
|||
1 |
3 |
5 |
7 |
|
|
自 2010 年以来,ImageNet 被用于 ImageNet 大规模视觉识别挑战赛(ILSVRC),该数据集可以属于哪个模态 ? |
|||
图像 |
文本 |
点云 |
RGB-D |
|
|
CIFAR-10 数据集是 Tiny Images 数据集的一个子集,由 60000 张彩色图像组成,其中这些图像的大小是? |
|||
28x28 |
32x32 |
64x64 |
128x128 |
|
|
MNIST 数据库是一个大型的手写数字集合,其中包含的训练集和测试集比例是多少? |
|||
4:1 |
5:1 |
6:1 |
7:1 |
|
|
GLUE(General Language Understanding Evaluation)不包含以下哪类任务? |
|||
Single-sentence tasks |
Similarity and paraphrase tasks |
Inference tasks |
Generation taks |
|
|
WikiSQL 数据集属于下面哪个模态? |
|||
图像 |
文本 |
视频 |
音频 |
|
|
截止 2022 年 2 月,SQuAD 最新的版本是? |
|||
SQuAD 1.2 |
SQuAD 2.0 |
SQuAD 2.1 | SQuAD 3.0 | |
|
CelebFaces Attributes 数据集中,每张图像包含几个 Landmark locations 标注? |
|||
1 |
3 |
5 |
7 |
|
UCF101 数据集中视频片段类别可以分为 5 种类型,其中不包括下面哪个类型? |
|||
Body motion |
Human-human interactions |
Human-object interactions |
Dance shows |
|
|
Cityscapes 是一个大规模的数据库,它为 30 个 Classes 提供语义、实例和密集的像素注释,这 30 个 Classes 又被分为几个 Categories? |
|||
6 |
7 |
8 | 9 |
|
|
新基准 SCROLLS 包含 Summarization、QA、NLI 任务,涵盖 Literature、Science 等多个领域。SCROLLS 的发布机构不包含以下哪个? |
|||
Allen Institute for AI |
IBM Research |
Meta AI |
Microsoft Research |
|
|
CLUE 团队发布应用在 NLP 领域的数据为中心的基准 DataCLUE,是在什么思想下实践的? |
|||
英文 NLP 任务在以数据为中心的思想下的实践 |
中文 NLP 任务在以数据为中心的思想下的实践 |
英文 NLP 任务在以模型为中心的思想下的实践 |
中文 NLP 任务在以模型为中心的思想下的实践 |
|
|
中科院智能交互团队获 ACM Multimedia 2021 多模态情感识别挑战赛三项冠军,其中哪项任务没有获得冠军? |
|||
Multimodal Continuous Emotions in-the-Wild Sub-challenge (MuSe-Wilder) |
Multimodal Sentiment Sub-challenge (MuSe-Sent) |
Multimodal Emotional Stress Sub-challenge (MuSe-Stress) |
Multimodal Physiological-Arousal Sub-challenge (MuSe-Physio) |
|
|
巴黎高科路桥学校等组成的团队斩获ICCV2021的UVO(Unidentified Video Objects) Challenge 双赛道冠军,其中在基于图片的开放世界实例分割这个赛道中,训练所用的数据集是? |
|||
COCO |
MNIST |
CIFAR-10 |
CIFAR-100 |
|
|
来自上海交通大学电子工程系的 “IntelligentLight” 团队获 KDD CUP 2021 City Brain Challenge 冠军,比赛方案的核心亮点中基于哪种训练方法对模型进行训练? |
|||
自监督 |
半监督 |
无监督 |
强化学习 |
|
|
在 ICCV 2021 挑战赛中,深兰科技 DeepBlueAI 团队共参加 2 项比赛 4 个赛道,分别在三个赛道中获得冠军,其中不包括哪个赛道? |
|||
VisDrone Object Detection |
VisDroneMot |
Large-AI-Food.VisDrone |
Large-Scale Fine-Grained Food Recognition |
|
|
CVPR 2021 AliProducts Challenge: Large-scale Product Recognition 中第一名 Joyy AI Research 的解决方案中使用了三个 Backbone,其中不包括下面哪个? |
|||
efficientnet |
efficientnetv2 |
nfnet |
mlp-mixer |
|
|
ACM MM 2021 Watch and Buy: Multimodal Product Identification Challenge 冠军方案在物体检测识别模块中使用了什么模型作为骨干? |
|||
ResNet18 |
ResNet50 |
ResNet100 |
VGG |