原创 · 作者 | ink
个人简介 | 985硕士,研究方向自然语言处理
师兄在腾讯,就让师兄内推了一下腾讯自然语言处理的实习。在内推前,简单把李航的统计学习方法,简历涉及的知识点都过了一遍,整理了一下,同时leetcode刷了大概100题。
准备过后就把简历给师兄了。投完简历当天下午就收到了腾讯的短信约晚上面试(这也太效率了= =)。下面简单记录一些面试的问题(很多问题都是项目涉及的知识点,每个人可能都不一样)。
一面(技术面)
基本就是把简历过了一遍,问问一些项目上的细节。
1、先简单自我介绍一下吧。
2、看你之前实习过,说说当时实习都做了些啥。
3、介绍一下transformer吧,除了self-attention还知道哪些attention。
4、看你用了反向翻译,简单介绍一下吧,除了这个还知道哪些数据扩充的方法吗,每个方法有什么区别?
5、介绍一下R2L-Rerank吧。
6、讲一讲bert,roberta吧,BPE和word piece有什么区别?
7、介绍一下FGM。
8、介绍一下Focal loss。
9、python的迭代器和生成器。
10、算法题:打印二叉树从右边看能看到的节点。
一面还算顺利结束后第二天就接到了二面的电话。
二面(技术面)
基本也是把项目比赛过一遍,然后问一些细节。
1、简单介绍一下自己吧。
2、介绍一下AUC吧,和准确率有啥区别。
3、介绍一下F-score,Macro-F1和micro-F1有啥区别。
4、bert如果输入超过512怎么办。
5、那你介绍一下transformer-xl吧。
6、如果你自己训练输入长度为1024的bert,使用的显存会是原来的几倍。
7、你在投的论文做的是什么,介绍一下,看你是用fairseq框架写的,具体修改了哪些模块。
8、算法题:最长上升子序列。
9、用过单机多卡或者多机多卡训练吗?讲一讲。
10、你有什么要问我的吗?
二面也比较顺利,第二天就接到了三面的电话。
三面(技术面)
我当时看面经别人都是两面,我居然有三面= = ,三面应该是一个leader面的。
1、之前实习是负责什么的,大概开发的流程是什么样的。
2、你做的这些项目是偏实验的的还是有一定的工业落地的,比如做了一个网站或者api等。
3、你们平常打比赛的时候,队伍是怎么合作的?
4、你做的项目里的公开数据集你知道是怎么采集的吗?它会不会有很多脏数据?这些脏数据对模型有什么影响?你是怎么处理它们的?
5、有看过模型的bad case吗?针对bad case做了哪些提升?
6、系统地介绍一下你研究的这个方向。最近你这个方向效果最好的论文是哪篇?它是怎么做的?
7、你有什么想问的吗?
三面没有算法题,感觉问的是一些方法论的东西。答得也还不错,没过几天就接到了HR的电话。
HR面
HR很亲切,面试体验很棒,上来先给我介绍了一下他们部门的一些发展历史和现在的情况,然后了解了一下我的实验室,实验室的研究方向,之前的实习情况,大概询问了可以入职的时间。整个面试下来感觉平时的积累很重要,之后有空了也准备把之前整理的资料慢慢写成博客。
由于微信平台算法改版,公号内容将不再以时间排序展示,如果大家想第一时间看到我们的推送,强烈建议星标我们和给我们多点点【在看】。星标具体步骤为:
(1)点击页面最上方"AINLP",进入公众号主页。
(2)点击右上角的小点点,在弹出页面点击“设为星标”,就可以啦。
感谢支持,比心。
推荐阅读
征稿启示| 200元稿费+5000DBC(价值20个小时GPU算力)
完结撒花!李宏毅老师深度学习与人类语言处理课程视频及课件(附下载)
模型压缩实践系列之——bert-of-theseus,一个非常亲民的bert压缩方法
文本自动摘要任务的“不完全”心得总结番外篇——submodular函数优化
斯坦福大学NLP组Python深度学习自然语言处理工具Stanza试用
关于AINLP
AINLP 是一个有趣有AI的自然语言处理社区,专注于 AI、NLP、机器学习、深度学习、推荐算法等相关技术的分享,主题包括文本摘要、智能问答、聊天机器人、机器翻译、自动生成、知识图谱、预训练模型、推荐系统、计算广告、招聘信息、求职经验分享等,欢迎关注!加技术交流群请添加AINLPer(id:ainlper),备注工作/研究方向+加群目的。
阅读至此了,分享、点赞、在看三选一吧🙏