大数据分析机器学习AI入门指南

许多人将机器学习视为通向人工智能的途径,但是对于统计学家或商人而言,机器学习也可以是一种强大的工具,可以实现前所未有的预测结果。

为什么机器学习如此重要?

在开始学习之前,我们想花一些时间强调WHY机器学习非常重要。

总之,每个人都知道人工智能或人工智能。通常,当我们听到AI时,我们会想象机器人到处走动,执行与人类相同的任务。但是,我们必须了解,虽然有些任务很容易,但有些任务却很困难,并且距离拥有像人类一样的机器人还有很长的路要走。

但是,机器学习是非常真实的并且已经存在。它可以被视为AI的一部分,因为当我们想到AI时,我们想象的大部分内容都是基于机器学习的。

在过去,我们相信未来的这些机器人将需要向我们学习一切。但是人脑是复杂的,并且并非可以轻松描述其协调的所有动作和活动。1959年,亚瑟·塞缪尔(Arthur Samuel)提出了一个绝妙的主意,即我们不需要教计算机,但我们应该让他们自己学习。塞缪尔(Samuel)也创造了“机器学习”一词,从那时起,当我们谈论机器学习过程时,我们指的是计算机自主学习的能力。

机器学习有哪些应用?

在准备这篇文章的内容时,我写下了没有进一步说明的示例,假定所有人都熟悉它们。然后我想:人们知道这些是机器学习的例子吗?

让我们考虑一些。

自然语言处理,例如翻译。如果您认为百度翻译是一本非常好的字典,请再考虑一下。百度翻译本质上是一组机器学习算法。百度不需要更新百度 Translate;它会根据不同单词的使用情况自动更新。

哦,哇 还有什么?

虽然仍然是主题,但Siri,Alexa,Cortana都是语音识别和合成的实例。有些技术可以使这些助手识别或发音以前从未听过的单词。他们现在能做的事令人难以置信,但在不久的将来,它们将给人留下深刻的印象!

SPAM过滤。令人印象深刻,但值得注意的是,SPAM不再遵循一组规则。它自己了解了什么是垃圾邮件,什么不是垃圾邮件。

推荐系统。Netflix,淘宝,Facebook。推荐给您的所有内容都取决于您的搜索活动,喜欢,以前的行为等等。一个人不可能像这些网站一样提出适合您的推荐。最重要的是,他们跨平台,跨设备和跨应用程序执行此操作。尽管有些人认为它是侵入性的,但通常情况下,数据不是由人处理的。通常,它是如此复杂,以至于人类无法掌握它。但是,机器将卖方与买方配对,将电影与潜在观众配对,将照片与希望观看的人配对。这极大地改善了我们的生活。

说到这,淘宝拥有如此出色的机器学习算法,它们可以高度确定地预测您将购买什么以及何时购买。那么,他们如何处理这些信息?他们将产品运送到最近的仓库,因此您可以在当天订购并收到产品。难以置信!

金融机器学习

我们名单上的下一个是金融交易。交易涉及随机行为,不断变化的数据以及从政治到司法的各种因素,这些因素与传统金融相距甚远。尽管金融家无法预测很多这种行为,但是机器学习算法会照顾到这种情况,并且对市场的变化做出响应的速度比人们想象的要快。

这些都是业务实现,但还有更多。您可以预测员工是否会留在公司或离开公司,或者可以确定客户是否值得您光顾-他们可能会从竞争对手那里购买还是根本不购买。您可以优化流程,预测销售,发现隐藏的机会。机器学习为机会开辟了一个全新的世界,对于在公司战略部门工作的人们来说,这是一个梦想成真。

无论如何,这些已在这里使用。然后,我们将进入自动驾驶汽车的新境界。

机器学习算法

直到最近几年,无人驾驶汽车还是科幻小说。好吧,不再了。自动驾驶汽车已经驱动了数百万英里(即使不是数十亿英里)。那是怎么发生的?没有一套规则。而是一组机器学习算法,使汽车学习了如何极其安全有效地驾驶。

我们可以继续学习几个小时,但我相信您的主旨是:“为什么要使用机器学习”。

因此,对您来说,这不是为什么的问题,而是如何的问题。

这就是我们的Python机器学习课程所要解决的问题。蓬勃发展的数据科学事业中最重要的技能之一-如何创建机器学习算法!

如何创建机器学习算法?

假设我们已经提供了输入数据,创建机器学习算法最终意味着建立一个输出正确信息的模型。

现在,将此模型视为黑匣子。我们提供输入,并提供输出。例如,考虑到过去几天的气象信息,我们可能想创建一个预测明天天气的模型。我们将输入模型的输入可以是度量,例如温度,湿度和降水。我们将获得的输出将是明天的天气预报。

现在,在对模型的输出感到满意和自信之前,我们必须训练模型。训练是机器学习中的核心概念,因为这是模型学习如何理解输入数据的过程。训练完模型后,我们可以简单地将其输入数据并获得输出。

如何训练机器学习算法?

训练算法背后的基本逻辑涉及四个要素:

a.数据

b.模型

c.目标函数

d.优化算法

让我们探索每个。

首先,我们必须准备一定数量的数据进行训练。

通常,这是历史数据,很容易获得。

其次,我们需要一个模型。

我们可以训练的最简单模型是线性模型。在天气预报示例中,这将意味着找到一些系数,将每个变量与它们相乘,然后将所有结果求和以得到输出。但是,正如我们稍后将看到的那样,线性模型只是冰山一角。依靠线性模型,深度机器学习使我们可以创建复杂的非线性模型。它们通常比简单的线性关系更好地拟合数据。

第三个要素是目标函数。

到目前为止,我们获取了数据,并将其输入到模型中,并获得了输出。当然,我们希望此输出尽可能接近实际情况。大数据分析机器学习AI入门指南https://www.aaa-cg.com.cn/data/2273.html这就是目标函数出现的地方。它估计平均而言,模型输出的正确性。整个机器学习框架归结为优化此功能。例如,如果我们的函数正在测量模型的预测误差,则我们希望将该误差最小化,或者换句话说,将目标函数最小化。

我们最后的要素是优化算法。它由机制组成,通过这些机制我们可以更改模型的参数以优化目标函数。例如,如果我们的天气预报模型为:

明天的天气等于:W1乘以温度,W2乘以湿度,优化算法可能会经过以下值:

W1和W2是将更改的参数。对于每组参数,我们将计算目标函数。然后,我们将选择具有最高预测能力的模型。我们怎么知道哪一个最好?好吧,那将是具有最佳目标函数的那个,不是吗?好的。大!

您是否注意到我们说了四个成分,而不是说了四个步骤?这是有意的,因为机器学习过程是迭代的。我们将数据输入模型,并通过目标函数比较准确性。然后,我们更改模型的参数并重复操作。当我们达到无法再优化或不需要优化的程度时,我们将停止,因为我们已经找到了解决问题的足够好的解决方案。

大数据分析技术有哪些

学习大数据分析python编程指南

大数据分析在病毒疫苗研究中的应用

大数据机器学习数据分析和业务分析四者间的关系

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20200429A0GTW000?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券