注:发布直招信息,加社招、校招、实习交流群请添加微信AINLPer(id: ainlper),注明类型。
字节跳动搜索部门直招,公司重点业务,大量hc
搜索算法工程师
【职位介绍】
1、参与ByteDance搜索引擎研发工作,用最前沿的机器学习算法、海量的数据,做最激动人心的技术、给用户最好的搜索体验。
2、参与头条/抖音/TikTok等核心产品的搜索研发工作,服务数亿全球用户;
3、参与搜索核心算法改进,可能的方向包括:
(1)NLP:将业界最先进的NLP技术应用到搜索算法改进中,包括纠错、分词、改写、Term Weighting、意图识别;
(2)Ranking:解决千亿级网页的排序问题,攻克基础检索、相关性、意图理解、权威性、时效性等世界难题;
(3)页面分析和摘要:从千亿网页中提取最有价值的信息,进行结构化字段提取、智能摘要生成、转码等工作来优化搜索体验;
(4)链接分析:从万亿链接中找出最有价值的网页,优化链接质量、索引质量、垃圾作弊识别、调度策略等;
【职位要求】
1、出色的分析问题、解决问题能力,总是能从纷繁复杂的数据中一眼看出问题本质;
2、出色的机器学习(Deep Learning)、NLP和数据挖掘基础,并能很好地建模应用于解决搜索问题;
3、强悍的代码能力、数据结构和基础算法功底;
4、熟悉Linux开发环境,熟练使用C++和Python语言;
5、有主流大规模搜索引擎算法优化经验者加分;
后台开发/架构工程师
【职位介绍】
1、参与头条搜索业务优化;
2、负责搜索在线系统架构建设,优化系统稳定性、性能、容量、吞吐量,设计灵活的策略架构支持策略快速迭代和升级;
3、负责搜索离线系统架构建设,优化离线数据流的稳定性和效率,推进离线数据快速、准确的应用到线上;
4、抽象通用的搜索离在线系统架构和策略架构,用于快速支持各大垂直搜索引擎。
【职位要求】
1、优秀的编码与代码控制能力, 有扎实的数据结构和算法功底;
2、熟悉linux开发环境,熟悉C++和python语言, 精通网络编程、多线程编程;
3、熟悉搜索引擎,对搜索引擎架构、大规模引擎有经验者优先;
4、承担过主流搜索引擎工程或策略改进的工作者优先;
5、热爱技术,持续学习,追求极致。
简历投递邮箱:lizhaoxi@bytedance.com
字节跳动搜索部门直招,公司重点业务,大量hc,可转正
搜索算法实习生
【职位介绍】
1、参与ByteDance搜索引擎研发工作,用最前沿的机器学习算法、海量的数据,做最激动人心的技术、给用户最好的搜索体验;
2、参与今日头条/抖音/TikTok等核心产品的搜索研发工作,服务数亿全球用户;
3、参与搜索核心算法改进,可能的方向包括:
(1)NLP:将业界最先进的NLP技术应用到搜索算法改进中,包括纠错、分词、改写、Term Weighting、意图识别;
(2)Ranking:解决千亿级网页的排序问题,攻克基础检索、相关性、意图理解、权威性、时效性等世界难题;
(3)页面分析和摘要:从千亿网页中提取最有价值的信息,进行结构化字段提取、智能摘要生成、转码等工作来优化搜索体验;
(4)链接分析:从万亿链接中找出最有价值的网页,优化链接质量、索引质量、垃圾作弊识别、调度策略等。
【职位要求】
1、出色的分析问题、解决问题能力,扎实的代码能力、数据结构和基础算法功底;
2、有机器学习、NLP和数据挖掘基础和开发经验者优先;
3、熟悉Llinux开发环境,熟练使用C++和Python语言;
4、如果你绝顶聪明,总是能7天深入一个全新的领域成为专家,则可以忽略以上所有要求;
5、2020年及以后毕业,实习时间不少于4个月,每周不少于4天;我们希望能有充足的时间培养你,也希望你能充分参与业务做出卓越的贡献。
——————————————————————————
自然语言处理工程师实习生
【职位介绍】
1、监督式学习:分类/匹配/序列标注等,对训练语料收集,清理,标注,特征选择,特征提取,类别体系修改,训练算法改进等;
2、非监督式学习:聚类/词向量/语言模型等,大数据集的处理,应用到线上任务(比如分类训练书记筛选/基础特征等);
3、基础数据结构与核心算法的实现与调优:包括Trie树/自动机/LSM Tree/倒排索引/等基础数据结构,常用算法的C++实现。
【职位要求】
1、对职位描述中的一项或多项工作感兴趣且熟悉,有具体相关经验者优先;
2、具备强悍的编码能力,熟悉Linux开发环境,熟悉Python/C++/Java/Scala语言;
3、优秀的分析问题和解决问题的能力,对解决具有挑战性问题充满激情;
4、2020年毕业者优先,实习时间3个月及以上,每周至少4天。
——————————————————————————
数据抓取实习生
【职位介绍】
1、负责搜索Spider系统的架构设计和核心模块开发;
2、负责搜索Spider分布式计算、调度、抓取、压力控制等模块的设计开发;
3、负责蜘蛛程序的开发优化,基于webkit内核的js渲染引擎;
4、负责网页特征抽取,利用模版或自动化抽取网页特征;
5、负责搜索Spider数据可视化,日常数据分析和监控。
职位要求
【职位要求】
1、计算机或相关专业,本科及以上学历,2020年及以后毕业;
2、优秀的编码与代码控制能力, 有扎实的数据结构和算法功底 ;
3、精通C/C++语言编程,熟悉linux平台、shell编程;
4、每周实习至少3天,可以连续实习3个月以上。
——————————————————————————
搜索架构研发实习生
【职位介绍】
1、参与ByteDance搜索引擎研发工作,用最前沿的机器学习算法、海量的数据,做最激动人心的技术、给用户最好的搜索体验;
2、参与头条/抖音/TikTok等核心产品的搜索研发工作,服务数亿全球用户;
3、参与搜索核心架构改进,可能的方向包括:
(1)设计开发千亿级网页搜索的数据流、分布式建库、在线检索系统,设计业内领先的检索架构;
(2)设计开发万亿级Spider系统的实时计算、调度分发、压力控制、蜘蛛抓取等服务;
(3)设计开发高可用的搜索引擎稳定性解决方案、自动测试和运维平台;
4、在这里你可以毫无历史包袱地实现自己的架构梦想。
【职位要求】
1、出色的分析问题、解决问题能力;
2、出色的代码能力,出色的数据结构和基础算法功底;
3、有分布式系统基础和开发经验者优先;
4、精通linux开发环境、C++语言、网络和多线程编程;
5、如果你绝顶聪明,总是能7天深入一个全新的领域成为专家,则可以忽略以上所有要求;
6、2020年及以后毕业,实习时间不少于4个月,每周不少于4天;我们希望能有充足的时间培养你,也希望你能充分参与业务做出卓越的贡献。
——————————————————————————
简历投递邮箱:lizhaoxi@bytedance.com
推荐阅读
数学之美中盛赞的 Michael Collins 教授,他的NLP课程要不要收藏?
From Word Embeddings To Document Distances 阅读笔记
模型压缩实践系列之——bert-of-theseus,一个非常亲民的bert压缩方法
可解释性论文阅读笔记1-Tree Regularization
关于AINLP
AINLP 是一个有趣有AI的自然语言处理社区,专注于 AI、NLP、机器学习、深度学习、推荐算法等相关技术的分享,主题包括文本摘要、智能问答、聊天机器人、机器翻译、自动生成、知识图谱、预训练模型、推荐系统、计算广告、招聘信息、求职经验分享等,欢迎关注!加技术交流群请添加AINLPer(id:ainlper),备注工作/研究方向+加群目的。