0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

腾讯、百度、滴滴三家大厂NLP算法的最新面试经验

深度学习自然语言处理 来源:深度学习自然语言处理 作者:ZJU跑男F3 2021-02-10 16:56 次阅读

AI相关的算法岗位,竞争十分火热,既内卷又倒挂。

为帮助读者在即将到来的2021春招中斩获心仪offer,我们将整理一系列求职文章。

本文介绍腾讯、百度、滴滴三家大厂NLP算法的最新面试经验,其中前两家公司给了ssp offer。

腾讯TEG实习

视频一面

1、自我介绍

自我介绍即开场白需要提前准备并多次练习,内容不用太多,言简意赅地讲清楚学校、专业、研究方向,概括介绍实习/论文/比赛等亮点即可,细节可以根据面试官的兴趣再深入。

2、项目/实习经历

这部分主要根据简历上的实习/项目进行,可能会问背景、怎么做、为什么这样做、最终结果、是否成功上线等,再深挖一些技术细节,或顺带考察ML、DL等知识点。

由于校招同学没有工作经验,所以项目和实习是展示自身能力的最好亮点(一堆CCF-A的大佬请忽略并接受我的膝盖)。面试官可以从介绍中了解你的工程能力、抗压能力、沟通能力、思维方式等等,如果吸引到面试官肯定能加分,要是面试官觉得索然无味估计面试也就到这儿了...

所以对于简历上的内容要滚瓜烂熟,能知其然知其所以然最佳。如果问到简历上的内容没答上或吞吞呜呜,将非常打脸,造成硬伤(简历上自己写的都不会,别的还用问吗╮( ̄▽ ̄)╭)。

切忌在简历上洋洋洒洒地写“熟悉Xgboost、SVM、Bayes、HMM、CRF、KNN、LR、CNN、Attention等算法”。是听过名字就算熟悉?还是啃过源码、理解背后原理?即便真的对这些算法理解透彻,最好也能结合例子来说明,而不是穷举。

而对于没有项目/实习/比赛经历的同学,这一部分时间只能由考察基础算法来弥补了,这样一来随机性、难度都提升了不少;所以平时尽可能多积累这方面的经验,让简历充实起来。

“项目 or 实习 or 比赛 or 论文”最好为真,这是底线。

3、介绍一个比赛

我从简历上3个比赛中,选择了一个最有亮点的比赛,从数据、模型、提分trick三方面做了介绍。

4、如何实现知识蒸馏,loss怎么选择

5、介绍TinyBert的工作原理

6-9考察机器学习基础

6、LR是线性模型吗,为什么?

7、梯度下降和随机梯度下降的区别

8、GBDT和XGBoost的区别(至少3方面)

9、偏差和方差的区别

10-11考察深度学习基础

10、怎么理解XLNet的,XLNet的输入是什么?

11、一个二分类任务,假设只有一个维度的特征,取值范围是0~正无穷,如何实现二分类?

12、手撕代码:两个数组求交集

只能使用 list,如果要用其他数据结构(比如字典)需要自己实现;时间复杂度尽可能低。

腾讯一面难度中规中矩,量比较多但基本都在考察基础。

关于手撕代码,今年应该是非常关键也是必做的环节,很多公司直接将编程题作为通过面试与否的硬性指标。刷题要趁早!

电话二面

1、询问两个实习项目,详细考察细节

2、介绍textcnn实现过程,池化时loss如何反向传播

3、假如不用bert,一大堆文本有几百万个词,直接训练词向量很困难,如何去做特征选择

4、LSTM门控机制是怎样的

5、LTSM主要解决了RNN什么问题,为什么能解决

6-9重点考察语言模型

6、介绍GPT2如何写诗、写对联

7、GPT2如何围绕一个主题/关键词写诗

8、ELMO、BERT、GPT模型彼此之间有什么区别

9、word2vec和ELMO主要有什么不同,为什么elmo效果更好

hr视频面

1、询问导师、实验室的研究方向

2、智能客服系统中,你主要负责哪些模块?

3、base在深圳能否接受,多久可以来实习?

面试结束后过了2天,成功收到TEG的offer call。

百度自然语言处理

视频一面

1、手撕代码:

给定一个字符串S和一个字符C。返回一个代表字符串S中每个字符到C的最短距离的数组。

# inputS="paddlepaddle",C='d'# output[2,1,0,0,1,2,2,1,0,0,1,2]

2、介绍简历上的2个项目和1个比赛

3、介绍bert和TinyBert

4、bert如何实现微调

5、fasttext的实现原理

6、文本匹配如何实现

7、手推信息增益、信息增益率、Gini指数公式

8、ngram如何过滤不合理的组合

9、还有什么想和我分享的?

面试官给了一个展现自我的机会,我介绍了一个最近在实验室新做的项目(简历上没有)。

视频二面

1、手撕代码:

word2vec负采样具体怎么做的(知识点:累积概率分布、二分区间查找)

2、文本匹配怎么做

3、文本匹配不当分类来做,loss怎么设计?

4、bert在中文和英文场景下使用,有什么区别

5、介绍一下在开源组织CLUE的工作

6、假如给offer,什么时候能来实习

hr视频面

聊个人特质、看重公司哪些方面、个人职业规划等

滴滴出行规划

视频一面

1、详细介绍1个项目和1个比赛

面试官让现场打开比赛链接查看排名和解决方案

2、手撕代码:

因式分解

判断年份是否为闰年

视频二面

1、介绍1个项目

2、介绍transformer

3、介绍常用的聚类算法(KMeans、DBSCAN、Mean Shift)

4、介绍word2vec2种实现模型、区别以及和fasttext的区别

5、手撕代码:并查集

视频三面

1、介绍1个项目

2、手撕代码:

两个有序数组,求第k大,时间复杂度尽可能低(log(m+n))

总结

近两年AI算法岗非常内卷,加上疫情影响给找好工作都增加了难度。但身边的朋友基本都在头部大厂收获了1+offer。实习和项目经验仍然很重要,ACL、NIPS等论文近些年在贬值。扎实的理论基础和coding能力可以让你进大厂后继续保持足够的竞争力。

手撕代码是面试的一道坎,要早做准备。同时,尽可能把握住可以跳过笔试(大部分公司)的提前批面试。

祝大家在新的一年offer多多,好运连连。

责任编辑:xj

原文标题:腾讯、百度、滴滴最新NLP算法面经

文章出处:【微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 百度
    +关注

    关注

    9

    文章

    2258

    浏览量

    90262
  • 腾讯
    +关注

    关注

    7

    文章

    1645

    浏览量

    49402
  • 自然语言处理

    关注

    1

    文章

    614

    浏览量

    13511
  • nlp
    nlp
    +关注

    关注

    1

    文章

    487

    浏览量

    22015

原文标题:腾讯、百度、滴滴最新NLP算法面经

文章出处:【微信号:zenRRan,微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    百度文心大模型日均调用量超15亿

    近日,百度在上海世博中心举办了主题为“应用来了”的百度世界2024大会。会上,百度董事长李彦宏分享了关于大模型行业的最新动态和百度文心大模型的显著进展。
    的头像 发表于 11-12 15:28 235次阅读

    百度将发布AI智能眼镜

    近日,有知情人士透露,百度旗下的人工智能品牌小计划在即将举行的百度世界大会上推出一款全新的AI智能眼镜。这款眼镜将内置先进的人工智能助手,并配备摄像头,为用户提供前所未有的智能体验。
    的头像 发表于 11-11 14:50 341次阅读

    百度云智大会开幕 星携手百度共探AI新机遇

    9月25日,以“智能·跃迁”为主题的百度云智大会正式拉开帷幕。本次大会汇聚了全球人工智能领域的领军人物与科技界的先锋企业。星电子作为全球智能终端领域的领军企业之一受邀参会,以“开放、合作、共赢
    的头像 发表于 09-26 15:39 340次阅读
    <b class='flag-5'>百度</b>云智大会开幕 <b class='flag-5'>三</b>星携手<b class='flag-5'>百度</b>共探AI新机遇

    百度舸AI计算平台4.0震撼发布

    在2024年百度云智大会的璀璨舞台上,百度智能云重磅推出了舸AI异构计算平台的全新力作——4.0版本。此次升级,标志着百度在AI基础设施领域迈出了坚实的一步,致力于为行业提供更为强大
    的头像 发表于 09-26 14:46 419次阅读

    百度健康推出五款大模型应用产品

    百度集团资深副总裁、百度大健康事业群组总裁何明科发表主题演讲时表示,医疗行业中存在“看得上病”“看得起病”“看得好病”难以同时实现的“不可能角”,AI是平衡这个“不可能角”的关键点
    的头像 发表于 07-23 09:36 426次阅读

    百度智能云升级3款大模型应用:面向类场景打造企业“超级员工”

    6月25日,“AI Cloud Day:百度智能云大模型应用产品发布会”在北京举行。会上,百度智能云面向知识管理、客服、营销,大企业应用场景,升级百度智能云甄知知识管理平台、
    的头像 发表于 06-25 19:22 1069次阅读

    百度申请文小言商标

    近日,百度在线网络技术(北京)有限公司在知识产权领域有了新动作。据天眼查知识产权信息显示,百度已申请多枚“文小言”商标,这些商标将涵盖广告销售、网站服务、健身器材、机械设备等多个领域。
    的头像 发表于 06-19 09:20 456次阅读

    2024百度移动生态万象大会:百度新搜索11%内容已AI生成

    2024百度移动生态万象大会:百度新搜索11%内容已AI生成 今天2024百度移动生态万象大会在江苏苏州举办,特别是AI搜索与百度文心一言的相关信息被市场极度关注,我们看到,在2024
    发表于 05-30 18:58 398次阅读

    百度与特斯拉探讨Robotaxi合作新机遇

    在特斯拉宣布计划使用百度地图提供的高精度地图之后,百度与特斯拉之间的合作再度引起关注。百度自动驾驶技术部总经理徐宝强近日透露,百度正积极考虑与特斯拉在Robotaxi(共享出租车)项目
    的头像 发表于 05-24 10:20 423次阅读

    百度智能云正式发布了《百度智能云水业大模型白皮书》

    3月28日,由E20环境平台主办的2024(第二十二届)水业战略论坛在北京召开。会上,百度智能云正式发布了《百度智能云水业大模型白皮书》(以下简称《白皮书》)。
    的头像 发表于 03-29 09:20 1338次阅读
    <b class='flag-5'>百度</b>智能云正式发布了《<b class='flag-5'>百度</b>智能云水业大模型白皮书》

    漳州市长魏东到访百度,与百度智能云共商漳州新质生产力发展

    3月19日,漳州市市长魏东,人大常委会党组成员、副主任蔡总平,副市长洪泰伟一行到访百度亦庄基地,与百度副总裁石清华,百度智能云南区总经理段巍,百度智能云政务创新业务部总经理李琴,围绕漳
    的头像 发表于 03-25 11:27 802次阅读

    百度搜索赵世奇回归,组织架构调整涉及文库等部门

    包括百家号业务运营部、热点运营部及内容生态运营管理部在内的多个部门并入信息分发平台,由百度App总经理李小婉指挥。据悉,原百度内容生态平台经理宋健已经离职。
    的头像 发表于 02-23 14:21 853次阅读

    星Galaxy AI集成百度文心大模型

    近日,中国星与百度智能云宣布正式结成AI生态战略合作伙伴,共同推动AI技术在智能手机等设备上的应用。作为这一合作的一部分,星Galaxy AI深度集成了百度文心大模型的多项能力,为
    的头像 发表于 01-29 17:03 1178次阅读

    星电子与百度智能云达成合作

    近日,星电子与百度智能云宣布了一项重要的合作,将百度的文心大模型集成至星全新的AI手机Galaxy S24系列中。
    的头像 发表于 01-26 17:14 1143次阅读

    百度搜索exgraph图执行引擎设计与实践分享

    百度搜索exgraph图执行引擎设计重点分成个部分:图描述语言、图执行引擎、对接扩展。
    的头像 发表于 01-16 10:27 505次阅读
    <b class='flag-5'>百度</b>搜索exgraph图执行引擎设计与实践分享