前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >【陆勤践行】数据科学家要会多少机器学习

【陆勤践行】数据科学家要会多少机器学习

作者头像
陆勤_数据人网
发布2018-02-26 10:59:22
6520
发布2018-02-26 10:59:22
举报

这个全民搞数据的年代越来越多新毕业的博士问我说,怎么样才能成为一个挣钱比较多的数据科学家?这个问题很广泛,因为要会的太多了而技术都在不断进步并且我也不能保证挣钱比较多,技术上大家可以参看山寨知乎网上的总结贴以及我的领英交友网(Linkedin)上面一哥们写的数据科学家地铁导航。作为这两个总结贴的补充,单独谈谈“数据科学”和“机器学习”这两个几乎总是同时出现的词:到底数据科学需要多少机器学习。

老实来说,搞数据的一般称自己的工作为“应用机器学习”,也就是说拿机器学习来解决实际问题。事实上平均下来,我们日常工作中只有10%时间在和机器学习模型相关,这不骗你。之所以说,数据科学要会很多乱七八糟的东西,主要都是在那另外90%上,包括净化数据,结构化数据,学习讨论特定领域知识之类的,这些才是最费时间的。

在这10%时间的机器学习里面,一个合格的数据科学家得会到什么程度呢?我以问答的方式来简单说一下:

  1. 问:是不是机器学习的每个算法你们都要自己实现?答:其实不是,我们都是用各种库,但是得会实现这些基本的算法,比如随机梯度下降法来解决逻辑回归的分类器。因为只有知道这些算法是怎么实现的,才知道哪些问题可以用哪些方法和模型,遇到模型输出和自己预期不太一样怎么去调整。
  2. 问:课思啦(Coursera)上吴恩达(Andrew Ng)老师的课值不值得上?答:如果不是机器学习专业博士出身,还是推荐上一上。这个课讲的深入浅出,对多数概念都有系统的讲解,并且有些讲解了“为什么要用这个”以及“出了问题怎么解决”。认真学下来,课后作业好好写,你就可以在简历上写上你会机器学习啦。其实平时工作用到的差不多就是这些基本算法。你如果想深入理解一下为什么分类器给出的是概率,参数为什么是那么调的,可以上上斯坦福的统计机器学习的课,教课的两位大爷以讲相声的形式教学还是很带感的,配套书籍可以在他们网站上下载。
  3. 问:我上了课但是只会课堂的那些例子,遇到新的实际问题不知道用哪个算法怎么办?答:这很正常,应用机器学习得练。推荐去卡高网(Kaggle)上找一些已经结束的比赛,选一些比较简单的,自己想想怎么解决,然后谷歌看看别人博客上写的解决方法。提交几个比赛的结果,就很容易知道如何切入一个实际的问题。
  4. 问:我讨厌编程怎么办?答:呵呵。

你看,本文为了响应净化中文网络环境尽量不说英语的号召,这写的多别扭啊。

文章来源:http://www.ppvke.com/Blog/archives/17954

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2015-06-24,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 数据科学与人工智能 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档