字节电商&垂直策略部nlp算法工程师面经分享

说起1、2月,绝对算得上求职者的黄金准备期。传说中的金三银四和校园春招都马上要到来了,相信有准备的朋友们已经开始刷题了,今天就为大家分享一篇字节跳动的真实面经:

字节电商&垂直策略部nlp算法工程师面经分享

第一次面的字节电商下的智能客服组,主要做对话生成,部门的技术涉及到知识图谱以及多轮对话生成。一二面面试官都问得比较深,懂的东西也很多,对单纯的背八股回答不感兴趣,喜欢应试者有自己的思考。三面面试官面试的时候一直在看手机回消息,有时候根本没在听,最终三面不出所料地挂掉了。

一面

1. 详细介绍EMNLP的论文

a) 比BERT好在哪?某种attention,以及实现一定程度的信息跨句传播

b) 标注的细节?

c) 可否处理未见事件

2. 介绍文本表示方法:

One-hot,词袋模型,神经网络word2vec,w2v负采样,BERT的多头attention作用(面试官不喜欢背八股,喜欢有自己的思考,讨论了多头attention可以关注到一个小部分的信息,比如100/1000维,单独处理前100维不会使之被后面的轻易average掉)

3. 做题:二分查找

反问:字节电商下的抖音电商,业务有知识图谱和对话结构化。知识图谱主要针对抖音电商商家所填信息不完整的情况,和标题填一大堆引流的情况。

二面

1. 详细介绍EMNLP论文

a) Tensor-composition的具体过程,为什么work

b) 事件比attention好在哪里?

一个是高亮事件

一个是可以关注到模式(主-谓,谓-宾)

c) 是否分析bad case:句子比较长,事件被avg掉了

d) 为啥用交叉熵不用MSE

e) L1正则化为什么稀疏?涉及到凸优化的理论,面试官建议多看点机器学习基础内容。

2. 了解LDA吗

3. 代码题:手写k-means

三面

1. 讲EMNLP论文,无详细提问

2. BERT的改进有哪些模型

3. 场景题:以过去一年的所有对话为数据,构建一个对话系统

4. 代码:删除链表中的重复节点

5. 场景题:给出淘宝的总商品总量,估算拼多多的商品总量,分类后分别抽样,每个类前面乘一个权重,权重是单价分之一。

字节电商这边挂掉后转到了同一hr负责的垂直策略部,也就是火山引擎,主要做to B业务。

一面(垂直策略-火山引擎to b业务)

1. 二叉树中最大路径和,要求修改全局变量,不会做

2. 问项目

3. 讲BERT

4. 层次softmax中怎么就节省了计算量?类似Word2vec

5. Word2vec中用的前面那个映射矩阵还是后面那个映射矩阵

6. 为什么不能在nlp当中用bn,而是用ln

7. AUC了解吗

8. 梯度爆炸的缓解方法

二面

1. 做题:股票买卖1,股票买卖3(限制为两次)

2. 介绍EMNLP论文,只问了创新点在哪里

3. 讲self-attention

4. 讲BERT的两个预训练任务

5. Topic model原理?只会用。

6. GCN原理?只会用

7. 圆上取三点,围成锐角三角形的概率,钝角三角形的概率?

反问:

1. 业务:卖技术,推荐各种东西

2. 推荐背景重要吗?不重要

3. 哪方面能力重要:数据处理(有时候加去重都会提升效果),模型上面提升不大

4. 三面通过率:较小,三分之一,必须有一方面突出,代码或者算法

三面

1. 介绍论文

2. 提问缓解过拟合

3. 为什么论文里不用MSE?

4. 优化器:adam和adagrad的区别

5. 做题:找到一个和等于target的最小连续数组长度

八股文不背不行,背了不受用,面试都不知道该怎么刷题了。现在春招即将开启,很多同学还不知道该如何准备,解决就业难,进大厂难的CSDN超级实习生计划2022年内推正式开启!大厂、名企实习直通车,年薪最高可达30万,先到先得!即日起可填表预约测评及内推啦!

想知道你的实操能力如何?

点击链接开始测评>>> CSDN超级实习生测评名单收集

另有一份Java核心面试知识点整理,免费分享给大家,点击文章底部VX名片扫描添加即可免费领取! 

 

本图文内容来源于网友网络收集整理提供,作为学习参考使用,版权属于原作者。
THE END
分享
二维码
< <上一篇
下一篇>>