前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >面经 | NLP算法岗(拼多多)

面经 | NLP算法岗(拼多多)

作者头像
用户3946442
发布2022-04-11 19:00:21
6930
发布2022-04-11 19:00:21
举报
文章被收录于专栏:程序媛驿站程序媛驿站

体验总结

a. 两面技术面 + 一面HR面

b. 工作作息为11-11-6,中午11点上班,晚上11点下班,一周工作六天。但据师兄说包含午休两个小时,而且可以在晚11点前下班。

c. 以下答案为面经提供者的回答,欢迎留言讨论

一面

  • 自我介绍+项目
  • 归一化有几种方式
  • 过拟合的解决方法
  • 决策树剪枝方式
  • 情景题: 为用户的Query打标签,有层级的标签,例如教师节礼物(礼品、文具之类的)该如何处理?
    • 构建方法:
      • 决策树,对每一个二分类,层次化softMax,构造正负对+合叶损失
    • 评估方法:
      • 数据集交叉验证、上线后用户评测
    • 模型未能覆盖的实例如何解决:
      • 同语言机器翻译,把冷门query转化为言简意赅的query
    • 针对用户query对标签树进行重构
  • 编程题:
    • 已知中序前序重构二叉树

二面

  • 自我介绍+项目
  • 项目中的评价标准是什么?
    • accuracy和precision、recall一样吗?
    • AUC的解释
      • AUC(Area under Curve):Roc曲线下的面积,介于0.1和1之间。Auc作为数值可以直观的评价分类器的好坏,值越大越好。
      • AUC值是一个概率值,随机挑选一个正样本以及负样本,当前的分类算法根据计算得到的Score值将这个正样本排在负样本前面的概率就是AUC值,AUC值越大,当前分类算法越有可能将正样本排在负样本前面,从而能够更好地分类。
  • 了解哪些损失函数?有什么区别?
  • LSTM结构图,LSTM怎么解决梯度消失的? 梯度消失还有哪些解决方法
  • 介绍word2vec
  • 编程题:
    • 给定一个长度为n+1的数组,里面有n个数字,找出重复的那个数字,时间复杂度o(n)

HR面

  • 自我介绍
  • 还投了什么公司?拿到了几家offer
  • 常规谈话
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-06-22,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 程序媛驿站 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
机器翻译
机器翻译(Tencent Machine Translation,TMT)结合了神经机器翻译和统计机器翻译的优点,从大规模双语语料库自动学习翻译知识,实现从源语言文本到目标语言文本的自动翻译,目前可支持十余种语言的互译。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档