前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >秋招被虐,最终拿下腾讯和字节offer!

秋招被虐,最终拿下腾讯和字节offer!

作者头像
对白
发布2022-06-30 16:23:28
5750
发布2022-06-30 16:23:28
举报
文章被收录于专栏:对白的算法屋对白的算法屋

大家好,我是对白。

今天给大家分享一篇小伙伴的算法岗秋招总结文章,作者的背景是:1个腾讯实习、4个比赛、2个项目、1篇CCF-A二作和CCF-C一作,虽然网易、快手和百度都挂了,华为还在池子里,但最终拿下腾讯和字节的offer,希望能帮助到下半年准备秋招的小伙伴们,以下为原文。

一. 字节技术中台

一面(通过):

算法题:删除倒数第N个链表

面试题

1、为什么要用尖括号标记实体,尖括号在BERT词表中么,最好用unuse1字符;

2、FastText和Word2vec的区别;

3、Xgboost和Adaboost、GBDT、随机森林,随机森林如何采样;

4、怎么解决人工漏标、错标,NER的损失函数,关系抽取为什么用这个模型,有调研其它模型么;

二面(挂):

1、手撕编辑距离;

2、Xgboost如何分裂,公式,树的生成;

3、逻辑回归推导;

4、交叉熵;

5、softmax;

二. 字节电商

一面(通过):

1、逻辑回归求导、均方误差和交叉熵的区别;

2、防止欠拟合、过拟合、梯度爆炸的方式;

3、BERT结构、transformer中feed forward的作用;

4、self-attention的形式,为什么要除以根号d_k;

5、算法题:手撕kmeans,链表反转、扑克牌随机分3堆,大小王在同一堆的概率;

6、图最短路径算法;

二面(通过):

1、比赛:为什么使用注意力机制、介绍multi sample dropout;

2、注意力机制为什么不用多头;

3、矩阵相加和点乘;

4、SPU海量数据查重;

5、softmax;

6、手撕代码:前k个相似整数、最长不重复子串;

三面(通过):

1、比赛;

2、实习项目;

3、手撕代码:堆排序、组成某个值的硬币种数(回溯)、不相邻子序列最大和;

三. 华为消费者BG

一面(通过):

1、算法题:LeetCode 739 每日温度;

2、决策树算法有哪些:ID3、C4.5、CART;

3、TF-IDF特征;

4、BERT mask策略,分别的作用;

5、多模态建模思路;

6、上线部署时延要求,模型剪枝、模型蒸馏;

7、Transformer与LSTM相比,优势在哪;

8、Boosting算法的优缺点;

二面(通过):

1、实习项目;

2、为什么要finetune;

3、知识图谱技术路线,信息抽取综述;

三面(通过):

问的问题跟HR差不多

四. 阿里本地生活(上海)

一面(通过):

1、实习项目,fusion层,下一步如何优化,如何处理长文本;

2、语言模型,Word2vec,具体流程,损失函数,优化算法(hierarchical softmax、negative sampling);

3、逻辑回归损失函数为什么取log;

4、模型评估,F1、ROC-AUC;

5、kmeans聚类,向量距离不适合用欧氏距离衡量,如何变换;

6、CRF损失,实体识别有尝试其他算法么,关系抽取阈值有选择么;

五. 网易有道

一面(通过):

1、介绍中文人机对话技术评测比赛,别的队伍的优点;

2、介绍试题生成项目;

3、介绍BERT、attention公式,为什么除以根号dk;

4、介绍AAAI的论文,负责哪部分;

5、手撕算法:最小k个数、移掉k位数字;

二面(通过):

1、正则化有哪些;

2、深度神经网络为什么不使用sigmoid或tanh激活函数,什么情况下可以使用;

4、Self-attention时间复杂度;

5、手撕:循环递增数组查找、self-attention实现;

三面(通过)

1、给你一个项目,描述下你的技术路线;

六. 百度知识图谱

一面(通过):

1、Vggnet的Resnet的区别,Densenet;

2、Transformer在哪些地方体现了共享和并行;

3、is 和 ==区别;

4、re match 和 search;

5、range返回的是什么;

6、python内存管理、浅拷贝和深拷贝;

7、如何拼接字符串最高效;

8、手撕:二叉树层序遍历、连续子数组乘积最大;

二面(通过):

1、docker原理;

2、手撕:LRU;

3、场景题:给定一个文章,如何识别出所有观点(一个句子),如何识别出核心观点,如何识别出提出者

三面(通过):

1、实习项目背景、难点分析;

2、给定一个文本,如何抽取aspect、opinion、sentiment;

3、反问:部门规模、氛围、交流,管理;

四面(通过):

1、比赛负责什么,每个人的分工;

2、情感识别的建模思路;

3、知识图谱:项目背景,有考虑意图识别么,实体消歧,为什么用pipeline、不用joint;

4、如果现在考虑的话该怎么提升模型性能;

5、CRF和HMM的区别,HMM解决哪三个问题;

6、CRF基于条件分布建模是什么意思,什么条件;

7、维特比思路,解决HMM的什么问题;

8、词向量发展历史:one-hot、NNLM、word2vec、glove(推导公式)、fasttext、ELMO、CoVE(不了解)、GPT、BERT、ERNIE(清华的不了解)、ERNIE 2.0、Bert-wwm、Roberta、Xlnet;

你好,我是对白,清华计算机硕士,BAT算法工程师,拿过8家大厂算法岗SSP offer。

本科创业赚了五百多万,并获得三百万元投资项目入选南京321高层次创业人才引进计划,保研后退居股东。

我每周至少更新两篇原创,分享前沿AI算法、技术干货和工作感悟。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-06-02,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 对白的算法屋 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 一. 字节技术中台
  • 二. 字节电商
  • 三. 华为消费者BG
  • 四. 阿里本地生活(上海)
  • 五. 网易有道
  • 六. 百度知识图谱
相关产品与服务
灰盒安全测试
腾讯知识图谱(Tencent Knowledge Graph,TKG)是一个集成图数据库、图计算引擎和图可视化分析的一站式平台。支持抽取和融合异构数据,支持千亿级节点关系的存储和计算,支持规则匹配、机器学习、图嵌入等图数据挖掘算法,拥有丰富的图数据渲染和展现的可视化方案。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档