面试锦囊之面经分享系列,持续更新中
赶紧后台回复"面试"加入讨论组交流吧
有两种数据,分别是被转发的用户和转发的用户,求原视频的用户以及转发的最长深度
from:1,1,2,2,3,6
to:2,3,4,5,6,7
面试官提示转换成树的结构,我写了求树的最大深度的函数,面试官说构造树比较复杂,差不多写这样可以。
有一张网页访问日志表,记录了user_id,session_id,page_id,timestamp
用户在每点击一个连接跳转,就会记录一个时间戳,并且page_id排序后与时间戳的排序一致,现要求每个用户的每个页面所停留的时间。
比如:
1 1 1 10:00 1 1 3 12:00
面试官看了后说差不多是这样,但要考虑一个边界的问题,最后一个page_id之类的 (请问这个怎么处理?
HiveSQL底层是怎么实现的?比如两张表Join的时候会有哪些操作?需要shuffle这一步吗?
mapReduce为什么需要Shuffle这一步
三面的时候网真的好差,中间网络断了很多次,重新发起了4、5次视频面试,最后还是打电话了
我开始用的是欧式距离的暴力求解,面试官让我提出优化的方案,我说可以计算出每个坐标点的geohash值,相等的值说明可以建立映射关系,面试官说geohash存在的一个问题是可能会出现两个相邻100m之内的点各自的geohash不同,这时怎么解决?
总结
编程基础仍然是关键,结合业务场景的问题更需要拓展思路,平时还要多独立思考。
三面由于一道题没做出来,面的不太好,回绝后隔了一段时间后捞我加面
聊天面,问能不能来提前实习,毕业论文,是否有别的offer,导师实验室是否自由等问题
- END -
推荐阅读
征稿启示| 200元稿费+5000DBC(价值20个小时GPU算力)
斯坦福大学NLP组Python深度学习自然语言处理工具Stanza试用
太赞了!Springer面向公众开放电子书籍,附65本数学、编程、机器学习、深度学习、数据挖掘、数据科学等书籍链接及打包下载
数学之美中盛赞的 Michael Collins 教授,他的NLP课程要不要收藏?
关于AINLP
AINLP 是一个有趣有AI的自然语言处理社区,专注于 AI、NLP、机器学习、深度学习、推荐算法等相关技术的分享,主题包括文本摘要、智能问答、聊天机器人、机器翻译、自动生成、知识图谱、预训练模型、推荐系统、计算广告、招聘信息、求职经验分享等,欢迎关注!加技术交流群请添加AINLPer(id:ainlper),备注工作/研究方向+加群目的。
阅读至此了,点个在看吧👇