【面经】字节AI Lab-NLP算法热乎面经 - 专知

会员服务 ·

0

【面经】字节AI Lab-NLP算法热乎面经

2020 年 3 月 29 日 深度学习自然语言处理

作者 | 我爱雪糕

整理 | NewBeeNLP

写在前面

先说下感受吧。本人在今年3月1号（周日）投递简历，隔天周一hr就约了周四的面试，结果那天是2面视频技术面+hr面直接走完了，周五内推的学长就告诉我过了，紧接着就是offer call。整体投递+面试+发录用通知函的时间不到一周，而且面试官都是和简历对口的，整体体验非常棒。

PS：offer call里说我的leader是李航，看了看手里的小蓝书，意外的惊喜

面试的岗位是“AI Lab实习生 — 自然语言处理NLP”，一共2面技术和一面hr，这里主要说下其中的技术面试。

一面

20min简历 + 30min题

先自我介绍，然后面试官说了句“好的了解”就直接进入项目了。

我的经历主要是一些竞赛，因此也是主要聊竞赛，在竞赛细节中扣一些细节提问。竞赛主要是关于机器阅读理解MRC的（百度机器阅读、莱斯杯等），面试官也刚好懂，大致问题如下：

请你描述一下竞赛背景，以及你在其中的工作/职责。
我看你数据做了很多 预处理，这部分重要吗，具体是如何做的预处理。这个不同项目应该不太一样，不细说了。
我看你用了 word2vec的词向量，知道它是如何训练的吗，有哪些trick。这个很基础了，trick就是负采样和分层softmax。
glove了解吗，elmo呢？
你把很多组件改成了transformer 的 multi-head attention，为什么要舍弃lstm的结构而选用它呢。我回答的是可并行+更强大的特征提取能力，顺便还解释了self attention的原理以及multi-head的作用。
说一下bidaf的匹配层，解释了bidaf的c2q和q2c的意义和具体做法。
你取得top2的成绩还有其他优化吗。这部分答了很多，当时吃了没用bert的亏，所以在很多方面进行了一定的优化。
你的第二个竞赛用roberta，它和bert的区别。动态mask+去除NSP+大力出奇迹（更大的batch，更多的数据，更多的step）。
xlnet和bert有啥不同。自回归&&自编码的知识，其中解释了xlnet排列语言模型以及双流attention。
albert了解吗？embedding层矩阵分解+参数共享 + SOP + 工程细节。

其他还有些小问题想不起来了，总体来说问的面不广，但是扣了些细节。

最后是两道算法题：

顺时针打印数组
编辑距离

很顺利的写出来了，一面结束，在线等二面。

二面

先同样是自我介绍。

然后出了一道“智力题”？

10个袋子，1000个球，你用球填充袋子，然后就固定了。现在来一个客户，无论他要1~1000哪个数量，你都能通过组装几个袋子给他。

我开始对面试官说可以动态规划：第一个袋子放1个，第二个袋子放2个，这个时候3=1+2,所以第三个袋子不用放3个，放4个；此时5=4+1，6=4+2，7=4+2+1都能组合得到，所以第四个袋子放8个，以此类推。后来一想，这不就是个1,2,4,8的等比数列吗…

因为我提到了动态规划，面试官为了使用动态规划要满足的条件是什么？什么情况下时候动态规划比较好呢？答：使用dp需要满足最优子结构性质 + 无后效性，在子问题有重叠的时候可以自顶向下的记忆化搜索，或者直接写成自底向上的dp。

问我了一个C++的问题，后来看我很懵逼，看一眼简历说哦你是会Java啊，那我们换个问题，你说一下堆和栈。我说了数据结构的堆和栈，被打断，他说是内存分配中的堆和栈。这部分答得不好。

接着是简历了，主要也是问竞赛相关，听我这些竞赛的细节，然后针对细节提问，没咋问transformer、bert相关，问了更偏传统机器学习一些，主要是一些关于gbdt、xgb、crf。

gbdt和xgb的就不细说了。

crf部分问的很详细，例如它的具体定义？什么是马尔可夫随机场？讲讲你对crf的理解？crf和hmm的区别知道吗，为什么ner任务用crf而不是hmm?crf具体如何预测？感觉答得一般。

最后2道算法题：

口述了一道算法题，我记不起来了，是一道dp题来着，反正很快想到了方法，就pass了。
安卓手机的解码方式多少种，就是那种9个点，可以上下左右、左上、左下、右上、右下连线的解锁，最少一个第一点，最多可以全连上，一个点只能用一次。我用的dfs直接做的。

PS：时间有点久了，忘了很多…

- END -

交流学习，进群备注： 昵称-学校（公司）-方向，进入DL&NLP交流群。

方向有很多：机器学习、深度学习，python，情感分析、意见挖掘、句法分析、机器翻译、人机对话、知识图谱、语音识别等。

登录查看更多

14

相关内容

机器阅读理解

机器阅读理解

包括微软、CMU、Stanford在内的顶级人工智能专家和学者们正在研究更复杂的任务：让机器像人类一样阅读文本，进而根据对该文本的理解来回答问题。这种阅读理解就像是让计算机来做我们高考英语的阅读理解题。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

【圣经书】《强化学习导论(2nd)》电子书与代码，548页pdf

【圣经书】《强化学习导论(2nd)》电子书与代码，548页pdf

专知会员服务

208+阅读 · 2020年5月22日

史上机器学习 &深度学习课程大合集，一站搞定，Deep Learning Drizzle

史上机器学习 &深度学习课程大合集，一站搞定，Deep Learning Drizzle

专知会员服务

175+阅读 · 2020年5月10日

【2020新书】《“一行”Python：如何写出精炼的Python代码》，216页pdf

【2020新书】《“一行”Python：如何写出精炼的Python代码》，216页pdf

专知会员服务

252+阅读 · 2020年4月19日

【毕业之路】如何修改博士论文？这份45页PPT《Editing your thesis》教你

【毕业之路】如何修改博士论文？这份45页PPT《Editing your thesis》教你

专知会员服务

78+阅读 · 2020年4月13日

【牛津DeepMind】从Word2Vec到BERT:上下文嵌入(Contextual Embeddings)综述论文

【牛津DeepMind】从Word2Vec到BERT:上下文嵌入(Contextual Embeddings)综述论文

专知会员服务

85+阅读 · 2020年3月18日

《人工智能2020：落地挑战与应对》56页pdf

《人工智能2020：落地挑战与应对》56页pdf

专知会员服务

197+阅读 · 2020年3月8日

普林斯顿大学经典书《在线凸优化导论》，178页pdf

普林斯顿大学经典书《在线凸优化导论》，178页pdf

专知会员服务

185+阅读 · 2020年2月3日

【课程推荐】普林斯顿陈丹琦COS 484: 自然语言处理课程

【课程推荐】普林斯顿陈丹琦COS 484: 自然语言处理课程

专知会员服务

85+阅读 · 2019年12月11日

【机器学习课程】机器学习中的常识性问题

【机器学习课程】机器学习中的常识性问题

专知会员服务

75+阅读 · 2019年12月2日

人工智能算法工程师手册-程序员写的AI书《深度学习，统计学习，数学基础》，50章一书打尽

人工智能算法工程师手册-程序员写的AI书《深度学习，统计学习，数学基础》，50章一书打尽

专知会员服务

211+阅读 · 2019年11月29日

绝对干货！NLP预训练模型：从transformer到albert

绝对干货！NLP预训练模型：从transformer到albert

新智元

13+阅读 · 2019年11月10日

19.9元限前30名！剑桥女博士带你学NLP实战项目《商品评论情感分析》

19.9元限前30名！剑桥女博士带你学NLP实战项目《商品评论情感分析》

AINLP

8+阅读 · 2019年8月21日

NLP中的词向量对比：word2vec/glove/fastText/elmo/GPT/bert

NLP中的词向量对比：word2vec/glove/fastText/elmo/GPT/bert

AINLP

31+阅读 · 2019年6月1日

今日头条广告算法面经！

今日头条广告算法面经！

算法与数据结构

25+阅读 · 2019年5月29日

爱奇艺深度学习算法实习生面经

爱奇艺深度学习算法实习生面经

算法与数据结构

9+阅读 · 2019年5月28日

旷视科技算法研究员面经（21个问答）

旷视科技算法研究员面经（21个问答）

算法与数据结构

37+阅读 · 2019年5月8日

百度计算机视觉暑期实习面经（成功上岸！已拿offer）

百度计算机视觉暑期实习面经（成功上岸！已拿offer）

大数据技术

20+阅读 · 2019年4月26日

工作▍推荐系统算法工程师是搞啥的？工作内容、技能、面试题全解析

工作▍推荐系统算法工程师是搞啥的？工作内容、技能、面试题全解析

36大数据

13+阅读 · 2019年3月19日

面试▍我是如何从机械行业本科社招成功转行NLP并薪资翻倍的

面试▍我是如何从机械行业本科社招成功转行NLP并薪资翻倍的

36大数据

10+阅读 · 2019年3月12日

AI offer面经分享：薪资近乎翻倍，题库里的xgboost笔记看了不下十遍

AI offer面经分享：薪资近乎翻倍，题库里的xgboost笔记看了不下十遍

七月在线实验室

7+阅读 · 2019年3月10日

Q-value Path Decomposition for Deep Multiagent Reinforcement Learning

Q-value Path Decomposition for Deep Multiagent Reinforcement Learning

Arxiv

26+阅读 · 2020年2月10日

Anonymized BERT: An Augmentation Approach to the Gendered Pronoun Resolution Challenge

Anonymized BERT: An Augmentation Approach to the Gendered Pronoun Resolution Challenge

Arxiv

4+阅读 · 2019年5月6日

Conditional BERT Contextual Augmentation

Conditional BERT Contextual Augmentation

Arxiv

8+阅读 · 2018年12月17日

Fully Convolutional Network with Multi-Step Reinforcement Learning for Image Processing

Arxiv

4+阅读 · 2018年11月13日

Learning Visual Question Answering by Bootstrapping Hard Attention

Learning Visual Question Answering by Bootstrapping Hard Attention

Arxiv

4+阅读 · 2018年8月1日

Aleatoric uncertainty estimation with test-time augmentation for medical image segmentation with convolutional neural networks

Aleatoric uncertainty estimation with test-time augmentation for medical image segmentation with convolutional neural networks

Arxiv

7+阅读 · 2018年7月20日

Piecewise Flat Embedding for Image Segmentation

Arxiv

3+阅读 · 2018年5月20日

Compassionately Conservative Balanced Cuts for Image Segmentation

Arxiv

5+阅读 · 2018年3月27日

Convolutional Sequence to Sequence Learning

Arxiv

4+阅读 · 2017年7月25日

Fully Convolutional Networks for Semantic Segmentation

Arxiv

3+阅读 · 2015年3月8日

VIP会员

相关主题

机器阅读理解

注意力机制

相关VIP内容

【圣经书】《强化学习导论(2nd)》电子书与代码，548页pdf

【圣经书】《强化学习导论(2nd)》电子书与代码，548页pdf

专知会员服务

208+阅读 · 2020年5月22日

史上机器学习 &深度学习课程大合集，一站搞定，Deep Learning Drizzle

史上机器学习 &深度学习课程大合集，一站搞定，Deep Learning Drizzle

专知会员服务

175+阅读 · 2020年5月10日

【2020新书】《“一行”Python：如何写出精炼的Python代码》，216页pdf

【2020新书】《“一行”Python：如何写出精炼的Python代码》，216页pdf

专知会员服务

252+阅读 · 2020年4月19日

【毕业之路】如何修改博士论文？这份45页PPT《Editing your thesis》教你

【毕业之路】如何修改博士论文？这份45页PPT《Editing your thesis》教你

专知会员服务

78+阅读 · 2020年4月13日

【牛津DeepMind】从Word2Vec到BERT:上下文嵌入(Contextual Embeddings)综述论文

【牛津DeepMind】从Word2Vec到BERT:上下文嵌入(Contextual Embeddings)综述论文

专知会员服务

85+阅读 · 2020年3月18日

《人工智能2020：落地挑战与应对》56页pdf

《人工智能2020：落地挑战与应对》56页pdf

专知会员服务

197+阅读 · 2020年3月8日

普林斯顿大学经典书《在线凸优化导论》，178页pdf

普林斯顿大学经典书《在线凸优化导论》，178页pdf

专知会员服务

185+阅读 · 2020年2月3日

【课程推荐】普林斯顿陈丹琦COS 484: 自然语言处理课程

【课程推荐】普林斯顿陈丹琦COS 484: 自然语言处理课程

专知会员服务

85+阅读 · 2019年12月11日

【机器学习课程】机器学习中的常识性问题

【机器学习课程】机器学习中的常识性问题

专知会员服务

75+阅读 · 2019年12月2日

人工智能算法工程师手册-程序员写的AI书《深度学习，统计学习，数学基础》，50章一书打尽

人工智能算法工程师手册-程序员写的AI书《深度学习，统计学习，数学基础》，50章一书打尽

专知会员服务

211+阅读 · 2019年11月29日

热门VIP内容

开通专知VIP会员享更多权益服务

《小型无人机系统侦测追踪技术：声学、计算机视觉与深度学习融合方案》最新98页

《"牧羊人网格"拦截策略：实现无人机集群可靠拦截的新范式》

光纤无人机：反无人机系统的重大挑战

《作战建模与仿真实证研究》

相关资讯

绝对干货！NLP预训练模型：从transformer到albert

绝对干货！NLP预训练模型：从transformer到albert

新智元

13+阅读 · 2019年11月10日

19.9元限前30名！剑桥女博士带你学NLP实战项目《商品评论情感分析》

19.9元限前30名！剑桥女博士带你学NLP实战项目《商品评论情感分析》

AINLP

8+阅读 · 2019年8月21日

NLP中的词向量对比：word2vec/glove/fastText/elmo/GPT/bert

NLP中的词向量对比：word2vec/glove/fastText/elmo/GPT/bert

AINLP

31+阅读 · 2019年6月1日

今日头条广告算法面经！

今日头条广告算法面经！

算法与数据结构

25+阅读 · 2019年5月29日

爱奇艺深度学习算法实习生面经

爱奇艺深度学习算法实习生面经

算法与数据结构

9+阅读 · 2019年5月28日

旷视科技算法研究员面经（21个问答）

旷视科技算法研究员面经（21个问答）

算法与数据结构

37+阅读 · 2019年5月8日

百度计算机视觉暑期实习面经（成功上岸！已拿offer）

百度计算机视觉暑期实习面经（成功上岸！已拿offer）

大数据技术

20+阅读 · 2019年4月26日

工作▍推荐系统算法工程师是搞啥的？工作内容、技能、面试题全解析

工作▍推荐系统算法工程师是搞啥的？工作内容、技能、面试题全解析

36大数据

13+阅读 · 2019年3月19日

面试▍我是如何从机械行业本科社招成功转行NLP并薪资翻倍的

面试▍我是如何从机械行业本科社招成功转行NLP并薪资翻倍的

36大数据

10+阅读 · 2019年3月12日

AI offer面经分享：薪资近乎翻倍，题库里的xgboost笔记看了不下十遍

AI offer面经分享：薪资近乎翻倍，题库里的xgboost笔记看了不下十遍

七月在线实验室

7+阅读 · 2019年3月10日

相关论文

Q-value Path Decomposition for Deep Multiagent Reinforcement Learning

Q-value Path Decomposition for Deep Multiagent Reinforcement Learning

Arxiv

26+阅读 · 2020年2月10日

Anonymized BERT: An Augmentation Approach to the Gendered Pronoun Resolution Challenge

Anonymized BERT: An Augmentation Approach to the Gendered Pronoun Resolution Challenge

Arxiv

4+阅读 · 2019年5月6日

Conditional BERT Contextual Augmentation

Conditional BERT Contextual Augmentation

Arxiv

8+阅读 · 2018年12月17日

Fully Convolutional Network with Multi-Step Reinforcement Learning for Image Processing

Arxiv

4+阅读 · 2018年11月13日

Learning Visual Question Answering by Bootstrapping Hard Attention

Learning Visual Question Answering by Bootstrapping Hard Attention

Arxiv

4+阅读 · 2018年8月1日

Aleatoric uncertainty estimation with test-time augmentation for medical image segmentation with convolutional neural networks

Aleatoric uncertainty estimation with test-time augmentation for medical image segmentation with convolutional neural networks

Arxiv

7+阅读 · 2018年7月20日

Piecewise Flat Embedding for Image Segmentation

Arxiv

3+阅读 · 2018年5月20日

Compassionately Conservative Balanced Cuts for Image Segmentation

Arxiv

5+阅读 · 2018年3月27日

Convolutional Sequence to Sequence Learning

Arxiv

4+阅读 · 2017年7月25日

Fully Convolutional Networks for Semantic Segmentation

Arxiv

3+阅读 · 2015年3月8日

大家都在搜

无人机集群

CMU博士论文

软件无线电

久别重逢话双塔

国防科技创新

OpenKG开源系列 | 海洋鱼类百科知识图谱（浙江大学）

微信扫码咨询专知VIP会员