在之前我们分别介绍了,ChatGPT/Stable Diffusion
的实现原理和环境搭建。无论多少花里胡哨的技术,这些都属于AI
的技术范畴,所以本着「刨根问底」的求知欲望,我们今天讲讲 --「何为AI」。
人工智能
(AI
)是计算机科学的一个广泛领域,涉及构建智能机器,使其能够执行通常需要人类智能的任务。虽然AI是一个跨学科的科学,具有多种方法,但尤其是在「机器学习」Machine Learning
和「深度学习」Deep Learning
方面的进展引领着各行各业的发展。
AI
使机器能够模拟甚至改进人类思维的能力。从自动驾驶汽车的开发到生成式AI工具如ChatGPT[1]的广泛应用,AI正逐渐成为日常生活的一部分,各行各业的公司都在投资这个领域。
如果,想了解该系列(AI相关)的文章,可以参考我们已经发布的文章。如下是往期文章。
❝广义来说,AI系统能够执行与人类认知功能常常相关的任务,如
解释语音
、玩游戏
和识别模式
。它们通常通过处理大量数据来学习如何执行这些任务,寻找模式以在自己的决策过程中建模。 ❞
在许多情况下,人类会监督AI
的学习过程,加强好的决策并阻止不良决策。但有些AI
系统设计成可以在没有监督的情况下学习,例如反复玩一款视频游戏,直到最终弄清规则并学会如何获胜。
AI
与弱AI
「智能」的定义颇具难度,这也是为什么AI
专家通常区分「强人工智能」(Strong AI
)和「弱人工智能」的(Weak AI
)原因。
❝
Strong AI
,也被称为「人工通用智能」,是一种可以解决它从未接受过训练的问题的机器,就像人类一样。 ❞
这是我们在电影中看到的那种AI
,例如,像施瓦辛格饰演的T-101
。
这种类型的AI
目前尚不存在。
创造出一台具备人类水平智能并可以应用于任何任务的机器是许多AI
研究人员的终极目标,但追求人工通用智能
一直充满了困难。一些人认为,由于创建没有监管的强大AI
可能存在潜在风险,因此应限制Strong AI
的研究。
与Weak AI
相比,Strong AI
代表着具备一整套认知能力以及同样广泛的用途案例的机器,但是在短期内,人们还没看到实现的希望。
❝
Weak AI
,有时也称为「狭义人工智能」或「专用人工智能」,只能「在有限的上下文中运行,是对人类智能的一种模拟」,应用于具体定义的问题(例如驾驶汽车、转录人类语音或在网站上策划内容)。 ❞
Weak AI
通常专注于「非常擅长执行单一任务」。尽管这些机器可能看起来很智能,但它们在约束和限制方面远远不如最基本的人类智能。
Weak AI
的例子包括:
Siri
、Alexa[2](Amazon
的AI产品)和其他智能助手Netflix
的推荐系统尽管在讨论AI
时经常会提到「机器学习」(Machine Learning
)和「深度学习」(Deep Learning
)这两个术语,但它们不应该互换使用。
❝
深度学习
是机器学习
的一种形式,而机器学习
则是AI
的一个子领域
。 ❞
如果强制的用数学的交集来表示的话:AI
>机器学习
>深度学习
机器学习
算法由计算机提供数据,并使用「统计技术」来帮助它“学习”如何在某项任务上逐渐变得更加优秀,而不一定是为该任务专门编程的。机器学习
算法「使用历史数据作为输入来预测新的输出值」。为此,机器学习包括
有监督学习
(其中由于标记数据集,输入的预期输出是「已知的」)无监督学习
(其中由于使用未标记的数据集,输入的预期输出是「未知的」)深度学习
是机器学习
的一种类型,它通过一个「受生物启发的神经网络架构来处理输入数据」。神经网络包含多个隐藏层,通过这些层处理数据,使机器能够在学习过程中“深入”,建立连接并对输入进行加权以获得最佳结果。
大脑神经网络示意图
下图是,机器学习和深度学习处理数据的主要步骤
AI
的四种类型根据系统能够执行的任务类型和复杂性,AI
可以分为「四类」,它们分别是:
反应式机器
遵循最基本的AI
原则,正如其名称所示,它只能利用其智能感知和对面前的世界做出反应。反应式机器「不能存储记忆,因此不能依赖过去的经验来实时决策」。
直接感知世界意味着反应式机器被设计成「只能完成有限数量的专业任务」。有意地限制反应式机器的视野也有其好处:这种类型的AI
将更加可靠,对同样的刺激将每次都以相同的方式做出反应。
Deep Blue
是IBM
在1990年代设计的「国际象棋超级计算机」,它在一场比赛中击败了国际象棋大师加里·卡斯帕罗夫。Deep Blue
只能识别国际象棋棋盘上的棋子,根据国际象棋的规则知道每个棋子如何移动,承认每个棋子的当前位置,并确定在那一刻最合乎逻辑的下一步棋是什么。计算机没有追求对手未来潜在的着法,也没有试图把自己的棋子放在更好的位置上。每一轮被视为它自己的现实,与之前做出的任何其他动作都是分开的。AlphaGo
也无法评估未来,但依赖自己的神经网络
来评估当前游戏的发展,这使它在更复杂的游戏中胜过了Deep Blue
。在2017
年 AlphaGo Master
以3:0
战胜了当时世界排名第一的围棋棋手柯洁。(我战鹰表示不服)有限内存
的AI
具有在「收集信息和权衡潜在决策时存储先前数据和预测的能力」,实际上是通过「查看过去的线索来预测接下来可能发生的事情」。有限内存的AI
比反应式机器
更复杂,提供了更多的可能性。
❝
有限内存
的AI
是在一个团队不断培训模型如何分析和利用新数据,或者构建了一个AI
环境,使模型可以自动训练和更新时创建的。 ❞
在机器学习中利用有限内存的AI
时,需要遵循六个步骤:
训练数据
学习模型
可预测
可以接收人类或环境的反馈
存储为数据
心灵理论
只是一个「理论概念」。我们尚未达到达到下一级AI
所需的技术和科学能力。
这个概念「基于心理学前提」,即理解其他生物有思维和情感,影响自己行为的观点。就AI
机器而言,这意味着AI
可以理解人类、动物和其他机器如何感受和通过自我反思和决心做出决策,然后利用这些信息来做出自己的决策。基本上,机器必须能够掌握和实时处理“思维”概念、决策中情感的波动以及其他心理概念,从而在人与AI
之间建立双向关系。
一旦心灵理论
得以建立,可能会在AI
的未来某个时刻,最后一步是使AI
变得具有「自我意识」。这种类型的AI
具有人类级别的意识,了解自己存在于世界中,以及他人的存在和情感状态。它将能够根据不仅是人们对它们所传达的内容,还有他们如何传达这些内容来理解他人可能需要什么。
AI
的自我意识依赖于人类研究人员理解意识的前提,然后学习如何复制它,以便可以构建到机器中。
AI
实际应用AI
技术采用多种形式,从聊天机器人到导航应用和可穿戴健康追踪器等。
ChatGPT
是一款AI
聊天机器人,能够生成各种格式的书面内容,从文章到代码以及对简单问题的回答。由OpenAI
于2022年11月发布,ChatGPT
由一个大型语言模型驱动,使其能够紧密模仿人类写作。ChatGPT
还于2023年5月推出了iOS设备的移动应用版本,于2023年7月推出了Android设备的版本。它只是众多聊天机器人示例之一,国内也有很多。这里就不一一列举了。
地图软件(Google/baidu/高德等
)使用来自智能手机的位置数据,以及用户报告的关于施工和车祸等信息的数据,来监控交通的流动情况,并评估最快的路线。
个人AI
助手,如Siri
、Alexa
和Cortana[3](microsoft
的产品)还有我们引以为豪的华为手机助手hisuite[4](小名叫小艺
),使用自然语言处理(NLP
)来接收用户的指令,设置提醒,搜索在线信息,控制家庭照明等。在许多情况下,这些助手被设计成能够学习用户的偏好,并通过更好的建议和更贴身的回应来提高用户的体验。
很多社交软件,如微信视频,抖音动画,各种直播动画等使用机器学习算法来区分图像的主题和背景,跟踪面部动作,并根据用户的操作调整屏幕上的图像。
自动驾驶汽车是深度学习
的一个典型示例,因为它们使用深度神经网络来检测周围的物体,确定与其他汽车的距离,识别交通信号等。这块的王者还得特斯拉。(国内的部分厂商也在奋起直追)
别问,问就是「遥遥领先」。
医疗保健行业使用的可穿戴传感器和设备也应用深度学习
来评估患者的健康状况,包括血糖水平、血压和心率等。它们还可以从患者的先前医疗数据中提取模式,并用于预测未来的健康状况。
MuZero
是由DeepMind
创建的计算机程序,是实现真正人工通用智能
的有希望的先驱之一。它通过 brute force
(蛮力)的方式,玩了数百万次的游戏,已经掌握了甚至没有被教过的游戏,包括国际象棋和一套完整的Atari
游戏。
AI
的益处、挑战和未来AI
的益处AI
可以说是「无孔不入」。根据研究表明,2022年,AI
公司筹集了668亿美元的资金,超过了2020年筹集的资金数额的两倍以上。由于其快速的采用,AI
正在各种行业引起轰动。
在2022年有关银行业中AI
的报告发现,「超过一半的金融服务公司已经在风险管理和收入生成方面使用AI
解决方案」。在银行业中应用AI
可能会带来高达4,000亿美元的储蓄。
至于医学,世界卫生组织2021年的一份报告指出,虽然将AI
整合到医疗领域面临挑战,但这项技术“具有巨大的潜力”,因为它可以带来诸如更明智的健康政策和提高患者诊断准确性等好处。
AI
也在娱乐领域大放异彩。根估计,全球媒体和娱乐业的AI
市场预计将在2030
年达到994.8亿
美元,从2021
年的108.7亿
美元增长。这个扩展包括诸如「识别抄袭」和「开发高清图形」(MJ
/SD
)等AI
应用。
❝就我身边所看到的例子中,现在国内有些淘宝店已经采用
SD
生成模特图,然后已经形成一个产业链了。 ❞
AI
的挑战和局限性尽管AI
被视为一个重要且快速发展的资产,但这个新兴领域也存在一些不利因素。
有研究机构在2021年随机对1万多人进行采访,让他们谈谈对AI
的态度。调查结果发现,45%的受访者既感到兴奋又感到担忧,37%的人更担忧。此外,超过40%的受访者表示他们认为无人驾驶汽车对社会有害。然而,利用AI
来识别社交媒体上虚假信息的想法得到了更多人的认可,接近40%的受访者认为这是一个好主意。
AI
在提高生产效率以及减少人为错误的方面是有巨大的优势。但也存在一些缺点,如开发成本和自动化机器取代人类工作的可能性。然而,值得注意的是,AI
产业也「有可能创造就业机会,其中一些甚至还没有被发明出来」。
AI
的未来考虑到AI
背后的计算成本和技术数据基础设施,实际执行AI
是一项复杂且昂贵的业务。幸运的是,计算技术已经取得了巨大的进步,正如摩尔定律所示,该定律规定微芯片上的晶体管数量大约每两年翻一番,而计算机的成本减半。
尽管许多专家认为,摩尔定律可能在2020年代某个时候结束,但这对现代AI
技术产生了重大影响——从经济角度来看,没有这个定律,深度学习将是不可能的。最近的研究发现
❝
AI
创新实际上「超过了摩尔定律,每六个月左右翻一番,而不是两年」。 ❞
按照这个逻辑,AI
在过去几年中在各个行业取得了重大进展。在未来的几十年里,AI
可能会产生更大的影响,这似乎是不可避免的。
智能机器和人工存在首次出现在古希腊神话中。亚里士多德的演绎推理发展和其运用的演绎推理是人类探索自身智能的关键时刻。虽然根源悠久,但我们今天所认为的AI
的历史跨足不到一个世纪。
以下是AI
历史上一些最重要的事件的简要概述。
AI
不应对人类造成伤害的科幻媒体中常见的想法。AI
中仍然是一个重要的模型。SNARC
,第一台神经网络计算机。AI
夏季研究项目上,首次使用了“AI
”这个词汇。由约翰·麦卡锡领导的会议被广泛认为是AI
的诞生地。约翰·麦卡锡
开发了AI
编程语言Lisp
,并发表了题为“具有常识的程序”的论文,提出了假想的“顾问接受者”,一个完整的AI
系统,能够像人类一样有效地从经验中学习。AI
项目。约翰·麦卡锡
在斯坦福大学创办了AI
实验室。ALPAC
)关于机器翻译研究进展不足的报告,这是一项重要的冷战倡议,承诺能够自动瞬间翻译俄语。ALPAC报告导致了所有政府资助的机器翻译项目的取消。PROLOG
。AI
研究的失望之处的“莱特希尔报告”,导致了对AI
项目资金的大幅削减。AI
发展进展不满导致DARPA大幅削减学术资助。加上早期的ALPAC报告和前一年的莱特希尔报告,AI
资金枯竭,研究陷入停滞。这一时期被称为“第一次AI
寒冬”。AI
寒冬。AI
的发展。AI
研究。Lisp
机器市场崭露头角,以支持这些系统。像Symbolics和Lisp Machines Inc.这样的公司构建了专门的计算机来运行AI
编程语言Lisp。AI
寒冬”。在此期间,专家系统的维护和更新成本太高,最终失宠。Siri
,「一款由AI
驱动的虚拟助手」。Alexa
。AI
需要克服的一个重大障碍。AI
算法,供科学和医疗团队在SARS-CoV-2大流行的早期阶段开发疫苗时使用。该算法能够在短短27秒内预测病毒的RNA序列,比其他方法快120倍。GPT-3
,该模型能够「生成模仿人们说话和写作方式的文本」。DALL-E
,能够「根据文本提示创建图像」。AI
相关的个人、组织和社会风险。”Gato
,一个经过训练的AI
系统,能够执行数百项任务,包括玩Atari游戏、给图像加注释和使用机械臂堆叠积木。OpenAI
推出了ChatGPT
,一个由大型语言模型驱动的聊天机器人,在短短几个月内获得了超过1亿用户。Bard
,一款竞争性的对话型AI
。OpenAI
推出了GPT-4
,这是迄今为止其最复杂的语言模型。可以说,在2023
年,国内也不断涌现出让人眼花缭乱的AI
产品。2023
年算的上是,国内AI元年
。无论是否是从0-1
,还是从1-100
。毕竟,「百家争鸣,百花齐放」才是一个良好的环境。
❝希望,我们的
AI
市场能够越来越好,而作为历史见证者的我们,也希望能搭上这个风口,能够大浪淘沙,找到适合自己的位置。 ❞
[1]
ChatGPT: https://mp.weixin.qq.com/s/PZZW_Z4wr9AKdPS4wVJfRw
[2]
Alexa: https://developer.amazon.com/en-US/alexa
[3]
Cortana: https://www.microsoft.com/en-us/cortana
[4]
hisuite: https://consumer.huawei.com/cn/support/hisuite/