首页
学习
活动
专区
工具
TVP
发布

简单易懂的机器学习知识:人工智能、建模和机器学习

写在前面:本文是系列的第一篇文章,“简单易懂的机器学习知识”系列文章是为了让更多人了解、入门机器学习,不会讲细节的算法和论证过程,会讲一些简单易懂的基础知识,附案例助于理解。

1.人工智能是什么?

在狭义上,人工智能(AI)是指以Siri、Alexa等语音助手,用语音代替界面交互的个人虚拟助手。

在广义上,人工智能(AI)是指由人工制造出的智能机器,是一种能够学习的计算机程序,可代替人类去解决需要人类智慧才能解决的问题。

人工智能包括自然语言处理、语音识别、图像识别、机器学习等,每一个分支都很复杂和庞大。本文主讲机器学习,其他的大家可自行研究。

2.什么是建模?

在我们深入了解之前,先说一下建模的概念。建模是指把具体问题抽象成为某一类问题并用数学模型表示,是应用于工程、科学等各方面的通用方法,是一种对现实世界的抽象总结。(PS:实际建模应用于社会各个方面,产品经理在从实际业务中梳理出角色、流程和实体也是建模过程。如果眼中只有数学建模就过于狭隘了。)

建模的流程具体如下:分析问题中的各种因素,并用变量表示→分析变量之间的关系,相互依存或独立等→根据实际问题选用合适的数学框架(典型的有优化问题,配置问题等),并将具体问题在此框架下表达出某种公式→选用合适的算法求解表达出的公式→使用计算结果解释实际问题,并分析结果。

由此可见,在我们描述的场景下,建模和训练的目标是得到某中算法能够解决某类问题。而在算法应用于实际问题的过程中,通过实践和归纳仍可对模型进行优化,这又称为模型训练。

再次强调,实际建模应用于社会各个方面,只是一种通用方法而已,实现建模的手段也多种多样。我在此描述的只是建模的一种场景。

3.专家规则和机器学习

在现实中,到处充满着规则,而设定规则则是人类解决问题的方法。设定规则已经经过人类历史的验证,但是也拥有很大的弊端:面对的问题/场景越多,规则的条数就越多,1000个场景可能需要1000条规则来应对。

需求越多,规则越多,法律法规就是一个很好的例子。除非在寻找某条规则能够整合其中几条,以减少“构建世界”的组件,而这又有几人能够做到?举个物理上的例子,17世界早期,人们已经能够区分摩擦力、阻力、重力等,是牛顿归纳为万有引力,而如今的科学家又希望用“大一统理论”阐释强相互作用力、弱相互作用力、电磁力、万有引力四种基本力,这是人类持续进步发展的目的。

如今,设定规则这种办法在面对个性化推荐、反欺诈、网络安全等大数据(数据量大、维度多、增长快、复杂且多样化)场景下,已经捉襟见附,准确率低而且低效,特别是在长尾部分。

如果所有情况都是已知的,每种情况和应用决策一一对应,那么基于规则的系统就会很高效的运行。过去,由于数据相对结构化和规模小,制定规则相对容易。而如今,数据变得非结构化和复杂多样化,全面的规则制定只能是想想。而机器学习可以很好的解决这个问题。

也就是说,需要解决问题的时候,从前开发者是基于规则进行开发的,规则一般来源于专家(能解决类似问题的人)依赖于经验和实践归纳总结的。而有了机器学习,程序能够通过自己学习去习得算法,而不是专家提供。

定义:机器学习是指计算机有能力基于案例、经验去习得算法,而不是依赖于预先设定的规则和代码。

总之,专家规则是指由专家根据自身经验、知识做出的规则设定,例如阿拉伯数字“1”是一条线,程序就可以根据这条规则去判断是不是“1”。机器学习则是需要输入很多阿拉伯数字“1”的图片,程序通过自我训练学会识别阿拉伯数字“1”。

各行业工作中也需要考虑到,策略(例如举报文章的审核)是基于人,还是基于专家规则,还是基于机器学习。用什么方案就得看场景、环境、需求、成本、准确率等综合评估。

纯人工:适用于量少的决策,特点是成本低、准确率高、效率低,微信公众号的精选评论就是这类。

专家规则:适用于能够总结出规则的,规则能够过滤部分以降低决策量的,特点是成本一般、准确率一般、效率高,通过敏感词列表审核UGC内容就是这类。

机器学习:适用于极大量的决策,提升效率能够极大降低总成本的,特点是成本高(数据集要求高和人工智能工资高)、准确率高(具体看数据集和技术水平)、效率高,人脸识别等不胜枚举都是这类。

Vency:我最近在看统计学、算法的相关知识,统计学翻完了大半本,之后都会把我所获得的知识理理以文章或者思维导图的形式分享给大家。机器学习是之前看的,都是为了扩充自己的知识广度。知识深度则来源于对世界、社会、人类的认知。

统计学:推荐贾俊平的《统计学》

算法:推荐入门《算法图解》 深入《算法导论》

链接: https://pan.baidu.com/s/1ocW4enns-Z4Voqnzqc0YKA 密码: brc8

产品知识推荐:得到《梁宁·产品思维30讲》 非常经典 链接:

https://m.igetget.com/share/master/mid/7/

梁宁·产品思维》

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180308G1D4RK00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券