前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >美团付晴川:算法工程师需要考察三种素养

美团付晴川:算法工程师需要考察三种素养

作者头像
用户1737318
发布2018-06-05 17:39:48
1.2K3
发布2018-06-05 17:39:48
举报
文章被收录于专栏:人工智能头条

付晴川,目前在美团网技术工程部数据组担任技术专家。长期致力于机器学习&数据挖掘相关工作,曾就职于百度搜索研发部负责网页/图片分析,现任职于美团技术工程部,负责用户相关的数据挖掘工作。

CSDN:您对算法是怎样理解的?以及您认为算法有哪些应用领域?

付晴川:听过李开复老师的演讲《算法的力量》,也阅读过吴军老师的大作《数学之美》,不得不说算法是许多高效计算机程序的灵魂。 像查找、排序等等这样广义上讲的算法,实际上已经渗透到凡是涉及计算机程序上的几乎所有的领域了;而像机器学习/数据挖掘等等这样狭义上讲的算法,目前也越来越多的应用在电商、搜索、金融、游戏等领域中的分析、挖掘、推荐上。

CSDN:算法在美团都有哪些应用?以及如何评价算法带来的商业效果?

付晴川:美团有团购、外卖、酒店、电影等多个产品线,每个产品线都有海量的用户以及这些用户产生的海量数据。如何高效处理这些数据,是需要算法来驱动的,目前跟算法特别是机器学习有关的应用主要有:个性化推荐/排序、风险控制、精细化运营、行业大数据据报告等等。

至于算法带来的商业效果,主要是通过离线、在线对比实测数据影响来完成,离线评测会有一些具体的指标, 比如排序问题的ndcg, 分类的问题的准确/召回等,而线上通常会A/B test考察访购率、点击率的提升幅度等等。

CSDN:算法工程师面试美团,作为美团的数据组技术专家的您有哪些建议?

付晴川:算法工程师实际上是需要考察三个方面的:

  1. 首先是要具备工程师的常用技能,主要看工程能力,比如基本数据结构和算法、coding、数据库等等;
  2. 另外一块才是机器学习/数据挖掘相关的算法、平台,除了尽量去熟悉常用的分类、聚类、回归、推荐算法之外(最好精通一两个的原理和实现),还需要掌握主流的工具和平台,比如Sklearn/Spark等;
  3. 还有一块属于软素质的范畴,自驱和积极性是我们比较看重的,因为很多模型的效果在出来之前都是比较难拍计划指标的,好的效果往往需要工程师主动追求卓越。

CSDN:在这么多年的工作中您肯定使用了很多算法,再结合目前的工作,您感觉哪些算法比较重要?他们各有什么优势和劣势。

付晴川:我这里主要说说机器学习相关的算法,像分类用我自己用的比较多的就是:SVM/LR/最大熵/以及各种基于决策树的方法;聚类主要是kmeans及其变体;回归的话主要是线性回归/Lasso/Rigde等,损失函数通常会自己调整;推荐的话尝试过ALS。

直接探讨算法本身的优劣可能意义不大,通常需要基于不同的应用场景选择不同的算法,需要考虑的维度有样本量的大小、类别是否平衡、数据规模大小(性能tradeoff)、特征数量以及稀疏情况等等,比如说,SVM/最大熵/LR同样都是分类模型,但是在CTR的应用中LR最吃香,文本分类中SVM是王者,最大熵作为最完美的模型,反而因为实现和计算的复杂性应用的比较少。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2015-11-12,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 人工智能头条 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档