3招打破机器学习工程师的边界

本文约1300余字,阅读需要约3.2分钟; 系统资料领取见文末; 关键词:人工智能,机器学习,深度学习,数学,学习建议,微专业

01.机器学习工程师的边界是什么?

大多数的事物都是有边界的。那机器学习的边界又是什么呢?

对,就是数学。掌握了数学这个机器学习的底层基础,不仅可以加深对算法的理解,还能在模型优化阶段更加游刃有余。

02.如何打破边界?

希望以下的内容能给你参考思路。

机器学习中的数学基础

方法建议:将实际意义与兴趣赋予看似枯燥的学习之后,尽量死磕最少必要知识。

上图是个使用逻辑回归判断一个男生是否是一位合适的女婿的例子。

其中,Y=w1*身高+w2*品德+w3*财富+w4*颜值+w5*就可以表达为多项式Y=w1*x1+w2*x2+w3*x3+w4*x4+w5*5,通过Sigmoid函数后,转化为该男生可能成为优秀女婿的概率问题。

这里会涉及sigmoid函数、求导算法、梯度下降、正则项控制过拟合等数学知识。遇到问题解决问题,死磕关键点,才不会钻入牛角尖,陷入数学知识的汪洋大海中孤立无援。

• 机器学习中的线性代数

方法建议:尽量将线性代数与现实意义结合起来

对于线性代数,理解它与机器学习的关键在于:理解线性代数与现实世界的巧妙的耦合。

上图中的x,y可以分别代表观察事物的2个维度。 x,y各自有大量的线性组合,意味着事物的2个维度有大量不同的看法, 将这些看法用机器来进行计算、归纳、演绎,并组合大量个别的看法,抽离出符合大多数的平衡点,从而得出普遍适用的结论。这不就是一件奇妙的巧妙而耦合的事件嘛~

• 机器学习中的概率统计

方法建议:尽量将看似无味的概率统计知识与感兴趣的话题结合起来理解

隐马尔科夫(HMM)算法是机器学习中的一个概率图模型,也是很多算法岗位面试中的考察难点。来自知乎的王蒟蒻,就用一个游戏的场景清楚的解释了隐马尔科夫(HMM)算法的原理。

https://www.zhihu.com/question/20962240/answer/33614574(链接)

我是一战士,修炼出了三种战斗形态,分别为暴怒态,正常状态和防御态。同时我也会三个被动技能,分别是普通平A,爆击(攻击伤害翻倍),吸血(生命汲取)。 我在暴怒状态下打出暴击的概率是80%,打出吸血概率为5%; 在平衡形态下,打出暴击的比率为30%,打出吸血的概率是20%; 在防御形态下,暴击成功概率为5%,吸血概率为60%。 总结一下,战士在不同状态下能打出技能的概率不一样。 本来,战士这个职业在暴怒态时,身边会有一圈红光环;防御态时,会有一圈蓝光环。但是,现在我正在玩游戏,游戏突然出了个bug:有个傻x程序员改了游戏的代码,他给写崩了,从此战士身边光环都看不见了。那我没法通过看脚下的光环知道战士在爆什么状态了。 话说,现在问题来了:由于看不到脚下光环,我只能估计“战士”在爆什么状态;但我现在打一boss,砍10次,发现8次都是暴击,血哗哗地翻倍在掉,你觉得我这战士最可能是爆了什么状态?

所以,通过自己感兴趣的话题来理解深奥的概率问题,就轻松很多了。

03.打破边界的误区

也许你早已意识到高等数学、线性代数、概率统计对做机器学习的重要性,也在积极补课中,于是一头扎进大学的教材中。但埋头死磕了好多次,每次都半途而费,学了很多,学到的很少。

因为教材始终更偏向理论。优点是每一步都可靠,逻辑严谨;但缺点就是很难理解。

古语有云:“独学而无友则孤陋而寡闻”,多人学习,协作学习能较快认识到打破机器学习边界的误区,尽可能的使用合适的学习方法。

推荐网易云课堂联合稀牛学院共同推出的人工智能系列微专业课程,由知名企业一线人工智能专家打造,结合工业界应用经验设计学习路径,并且有讲师助教为你答疑解惑,真正带你从入门到精通。

原文发布于微信公众号 - 深度学习自然语言处理(zenRRan)

原文发表时间:2018-10-16

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏机器学习算法工程师

《机器学习》笔记-绪论(1)

作者:刘才权 编辑:王抒伟 写在最前面 1 如今机器学习和深度学习如此火热,相信很多像我一样的普通程序猿或者还在大学校园中的同学,一定也想参与其中。不管是出于好...

3527
来自专栏新智元

Quora:暮光之城女主角文章毫无价值,算不上人工智能论文

【新智元导读】1月20日,国外多家媒体报道,暮光之城女主角 Kristen Stewart 发表了一篇关于图像风格迁移的人工智能论文,引起业内广泛讨论。不少人感...

2957
来自专栏AI科技评论

学界 | 关于模型可解释性的深入思考:从哪里来,到哪里去?

「学习出一个通用智能行动者的潜力和局限性,算法公平方面细微的以及可以被真正规范化的挑战,以及现在的热门话题:能向人类解释、能被人类理解对模型来说意味着什么?」

1023
来自专栏机器学习算法与Python学习

从数学入手,3招打破机器学习工程师的边界

对,就是数学。掌握了数学这个机器学习的底层基础,不仅可以加深对算法的理解,还能在模型优化阶段更加游刃有余。

1314
来自专栏AI科技大本营的专栏

深度学习到底有没有缺陷?这里列满了它做不到的事情

本文源自一次讨论深度学习缺陷的推文风暴,斯坦福大学的Bharath Ramsundar,在用深度学习进行药物研究的过程中发现,深度学习做不到事情其实有很多,比如...

7707
来自专栏携程技术中心

干货 | 深度学习在携程攻略社区的应用

? 携程攻略社区是携程旗下的旅游攻略类社区,致力于为旅行者提供出行指南和资讯服务。依托携程2.5亿用户总量,社区日活跃用户超过500万,并汇集3000万条真实...

2448
来自专栏机器之心

专栏 | 阿里iDST CVPR 2017论文解读:视频衣物精确检索

机器之心专栏 作者:方广、磐君、思淘 在 CVPR 2017 开幕当天的文章《CVPR 2017国内外亮点论文汇集:史上最盛大会议,华人占据半壁江山》中,我们...

3878
来自专栏AI科技评论

学界 | 专家标注的数据少就少吧,普通人标的数据现在也可以用了

AI 科技评论按:对于缺乏高质量标注数据的专业应用,除了继续花钱标数据之外,常用方法似乎也就只有 ImageNet 预训练 + 任务专用数据 fine-tune...

1042
来自专栏人工智能头条

最强大脑第二场战平听音神童!百度大脑小度声纹识别技术算法解析

2036
来自专栏人工智能头条

集成学习:机器学习兵器谱的“屠龙刀”

1404

扫码关注云+社区

领取腾讯云代金券