点击上方“CVer”,选择加"星标"或“置顶”
重磅干货,第一时间送达
作者:小金的小跟班
https://www.nowcoder.com/discuss/186247
本文已授权,未经允许,不得二次转载
牛客网上看到大家对渣硕菜鸡疯狂讨论,瑟瑟发抖附上两个月基本陪跑,目前只拿到一家cv算法实习的面经。。顺便求点建议
投递后无消息:b站、爱奇艺、IBM(吐槽一下,跳转到大街网完善简历,至此之后每天都会发xxx公司看上你、有意什么的,真的是天天都在发。。。垃圾邮件,还屏蔽不了,求方法)
简历挂:思核科技、依图科技(看到依图科技简历挂了好多。。。AI算法工程师,然后转投了算法测试工程师,面完也没消息了🤣依图对菜鸡可能是真的不友好,流程是真的慢,也不说挂)
笔试凉或者没消息:网易互娱、招行信用卡、网易雷火、携程、美团
面试挂:腾讯、蚂蚁、海康(不知道怎么hr面就挂了,感觉没踩雷啊😅,可能是备胎池太深了。。。)、远景(面的时候正好是携程笔试,面完回来一通乱选。。算法题朴素贝叶斯。。撕不出来)
华为投了本专业对口的网络安全工程师,因为女票在上海,所以报了上研所,前几天南研所第一批奖也没开到,不知道是归上研所捞还是凉了,只收到泡池短信
唯一一家大概率拿offer的是被牛客网上吐槽招神仙的蘑菇街。。。目前也是hr口头说确认录用,节后发offer mail 希望可以上岸!
硕士期间主要是做深度学习中的对抗样本问题,一篇ccf-c在投(AB也不敢想啊🤣),两个横向项目,一篇专利,本科拿的出手的是一个大创省赛银奖
其实算下来也没投很多家。。。cv岗给人感觉招的少难度大,看不到很明确的发展前景。。纠结秋招是继续在神仙岗位继续打架还是稍微转转方向做机器学习,现阶段比较倾向于转一点点方向。。。
不太考虑开发,开发都忘光了,来不及了🤣而且开发方向竞争也好激烈🤣
以下附上面经:
fgsm(单步)、bim-a(多步)、bim-b、jsma、c&wattack、DeepFool
FCN攻击(日本)、清华团队、问到自闭。。。脑子里已经想到Ian Goodfellow写的那篇nips2017安全攻防挑战赛的总结,好久不看谁记得实现细节。。
对抗样本评价指标
论文跟进问题:
防御:
(1)梯度掩蔽:防御性蒸馏(软标签、硬标签)
(2)检测:KD、贝叶斯不确定性估计、LID
Ensemble Defense:这个完全没看到过。。就随口说了说,同质模型投票,异质模型查全
Mask R-CNN解耦
MaskR-CNN比FasterR-CNN好在哪里
为什么backbone用DenseNet
评价指标:mAP@IOU0.5:不到10%(还用了新的SWA的优化器)
ROIPooling和ROIAlign的区别
是否取消了量化操作:取消了(还反问了以下我真的取消了吗。。难道不是真的取消量化了🤣一度怀疑)
响应速度,模型加速
Inception改进
为什么不用YOLO
YOLOv2到v3的改进
One-stage速度不够的话怎么办:模型加速:蒸馏、剪枝、用小模型、量化、二/三值网络
对抗样本的发展,尤其是防御,给出自己的想法:含语义的扰动更值得研究,从ELEGANT获得的灵感
介绍SVM:
核函数的区别、什么时候用什么核。。问了一大堆
kNN:kNN流程,影响kNN的因素有哪些
什么语言熟练:python
设计模式:我说我知道单例模式。。然后问了一个具体的模式(见都没见过,后来发现我技能里写了掌握Java、Python🤣发现之后赶紧改成了熟悉。。。。)
Python:list和tuple的对比
投了大安全,很想做风控这方面的fintech
蚂蚁和腾讯不太像,很偏业务。。问了很多实际问题,最后跪在了一道建模题上,自作聪明没用深度学习方法,也没多嘴问一句能不能用lstm之类的。。血亏
常规问题同上
之前没有思考到的点是:
如何将研究的东西落地:
负面:利用更大的扰动挖掘模型在更高维空间中的对抗子空间
正面:利用这些生成数据,完成一种半监督的对抗训练
本科比赛用到的
ARIMA模型:
为什么要用
有无分布式经验,还是要会hive、spark之类的。。。
行为建模:(跪在了这种题上🤣用了传统的方法,专门避开了黑盒的embedding方法,隔了一个周末问内推人就说挂了,然后可能晾了三周,官网回绝)
问题:用两种方式对用户行为建模(LSTM、word2vec)
后来想到处理时序日志的方法:
lstm抽取embedding
用Word2Vec的思想对时间间隔建模
问题1:如果现在有一个相对于训练好的模型从未见过的类怎么办:
inference阶段:考虑异常检测
training阶段:考虑添加一个其他类
问题2:从算法层面改进模型的考虑:
anchor:过度采样、多次复制小目标
IoU:用GIoU(CVPR2019)
NMS:soft-NMS、Softer-NMS
损失函数:focal-loss
问题3:响应速度:模型剪枝
问题4:模型上线:做监控
远景这里涉及到很多读研前的问题,最终有点遗憾,还是很想去远景的,工作内容不枯燥,据说一天餐费十块、餐标40,工资也很诱人
是否能来上海,实习多久
吃了吗,吃了就可以聊很久了。。。
介绍大创的比赛:
ARIMA模型的介绍
数据是否具有周期性
arima模型是几阶的(一阶)一阶差分模型(将非平稳数据通过差分方式转化为平稳的)(跪在了这里。。忘记arima模型的三个参数p、d、q各是干嘛的了。。)
时序数据
专利介绍:
从安全交易从头讲起
熟悉传统机器学习吗
随机森林可以做回归和分类,GBDT只能回归
讲讲随机森林和xgboost
为什么决策树容易过拟合:对训练集中的错误数据过分拟合,致使在测试集中出现偏差
前剪枝和后剪枝
熟悉深度学习哪个框架,tensorflow更多一点
tensorflow的dashboard用过吗:tensorboard监控模型训练
讲讲GAN
讲讲如何将GAN应用到时序数据的生成上(GANsyths一篇文章生成了音乐)
扯了很多异常检测的内容
之前在算法和网络安全工程师之间换来换去,最后还是为了保底选了网安🤣
三月底找人内推了上海车联网实验室,做cv
为了保底,投了网络安全工程师🤣,去面的时候还因为这个内推从1点半折腾到了5点半。。
面试就不讲了。。玄学,面试官说的可能比我还多
不过好像华为招聘要改制了。。。现场代码+专业面 不好混了。。。。
聊项目(目标检测)、论文1和论文2
对抗样本从生成到应用的过程中涉及到的半监督、模型可解释性
论文实践过程中遇到的问题、是否和他人讨论过:GAN->WGAN、多尺度学习率动态调整(根据损失函数变化)
本科和研究生开了什么课程,学习思路
论文2的讲述有点卡壳,不如论文1的叙述,面试官鼓励了一下
项目中数据有多少:5000张
看模型的效果应该使用k-fold观测
为什么没把缺陷检测当做分类任务,而是要做成目标检测的任务:给了几个开放的思路
使用阈值将分割、检测的结果直接转化为分类结果
缺陷的面积、周长
检测框的置信度
训练模型时直接用多任务框架
分类作为主任务
分割、检测作为子任务
直接使用分类模型,检测框和分割的标注直接作为attention模块引入
应该多关注分类效果,不应该过分追求IoU
模型上线时,如何保证该模型不受对抗样本影响
论文中生成算法的叙述,WGAN较之前GAN的优势在哪里
如何用生成算法做具体业务(超分辨率GAN)
面试官对生成算法很感兴趣、做蘑菇街具体业务(5分裤、7分裤的图像生成)、大规模图搜索(以图搜图)
传统视觉方法了解多少
问了一下哪些方面需要改进:
图像方面的经验不多,只做了目标检测,还需要扩展更多,比如关键点检测等,秋招要求可能要更高,但是实习够了
做做传统机器学习的内容,xgboost之类的,工程应用
本文作者同时是 CVer 的读者。如果你想了解国内各大公司的面试经验、如何内推、学习路线、知识题库、秋招攻略和Offer如何选择等资料的,欢迎加入2019AI算法岗求职大本营(知识星球)。
本星球不仅面向今年(2020届)找工作的人群(研一/研二/大三等),还面向刚入学或已工作的人群。目前已有超过790+位同学加入。星球旨在分享AI算法岗的秋招准备攻略(含刷题)、面试经验和内推机会(含提前批)等。
希望这个星球可以让你少走一些弯路
扫码进星球
如果喜欢面试经验,麻烦给个在看
麻烦给我一个在看!
蘑菇街是国内最大的社会化电商平台,为国内广大年轻时尚人群提供衣服、鞋子、箱包、配饰和美妆等领域最新最潮的商品和搭配、购物分享。