企业在利用AI时的三个建议

作者:Ben MacKenzie,Teradata加拿大

从无人驾驶汽车到图像识别技术,AI越来越多地从新闻头条走到了我们的生活里。但因为业务问题和涉及数据的不同,在企业背景中应用AI技术依然存在挑战。

企业AI的博弈是一场不一样的比赛、需要遵守不一样的规则。一些区别来自于企业内部可用数据类型的不同,而另一些则受到应用AI的领域的操作复杂程度所影响,这一点我将会在接下来的文章里展开来说。要在企业的环境中利用AI技术,以下是我总结出的三条值得考虑的建议。

01

考虑那些AI技术已经得到认可的领域

AI在广泛的领域内都获得了惊人的成就,例如:图像识别、目标检测、诊断影像学、自动无人驾驶、机器翻译、语义分析、语音识别、机器人控制等领域,其中自然包括围棋和象棋。但特别的是,这些取得了重大突破的领域都是人类所擅长的。这就意味着:深度学习的网络是由人脑内的架构所激发的;而在计算机视觉领域,深度学习就是由视觉皮质的特定结构所激发的。这些例子都展示了本身具有层级结构的问题,能够经得起越来越多的抽象化表达和对这个领域的多种理解。这些领域中还有着大量的公开研究、代码、并且在很多情况下都存在预先训练好的模型。

而另一方面,在上述领域之外对于AI技术的应用程度依然较低。试想一下推荐人系统、欺诈监测或者预防性维修模型。AI已经被成功地应用在了这些领域里,但它带来的成果往往是锦上添花的,而相关的研究成果也较少对公众公开。在某种程度上,这意味着这些领域牵涉到了受到更严密保管的企业数据,数据本身的特性要求它不能被轻易地共享给更多的人。

而现在,好消息是很多的企业现在已经开始着手解决涉及到视觉、语言和机器人控制等方面的问题。不管是在工厂厂房应用计算机视觉技术,还是用于库存管理系统,还是将自然语言处理(NPL)技术用于合规报告或者语义分析,现在企业们能够直接利用起无数的研究成果和前人积累的经验。而在其他领域,因为缺乏完善的研究、没有经过预先训练的模型、没有出版论文或著名的公开成功案例,AI就应该被统一划分到其他的机器学习和分析技术中。

02

AI并不是魔术

把AI看作是基于未检验的跟踪记录所进行的传统分析和机器学习的延续,这将有助于企业避免将AI神化:只要投入足够的数据,我们就能得到满意的结果。如果你对AI有这样神化的想法,那么你可以试试把一只橡皮鸭子丢到水里,试着让AI预测一下它最终会漂到哪里去。你当然可以在接下来的一千年里不断地训练你的模型,但却依然无法得到最终的结果。因为没有针对组成这段溪流的每一个分子进行建模,整个流程就是完全随机的,AI什么也干不了。

对于企业希望利用AI解决的所有问题,AI技术并不总是能成为那个整体的解决方案。具备了区分图像的能力,并不意味着我们就能完全准确地预测出11月份美国西北部地区整体的苏打水消耗量。

在为您的企业评估AI的最佳使用方案时,请密切关注于那些AI技术已经可用的问题领域。是否有哪个问题发生的领域中已经有了可用的研究成果?您是否已经在某些问题上利用起了机器学习技术?这些都是您开始使用AI技术的优选落脚点。

你可能还听说过,AI对于数据的需求是非常巨大的。我们在上面讨论的已经取得过重大突破的AI领域都牵涉到了真正称得上是海量的数据集:例如在计算机视觉模型中就包含了数百万的图像数据。要精确地预测做成一个AI项目需要多少数据,这是不可能完成的任务;但通常而言,数据集越小,那么传统的分析技术所能提供的结果就越有用。类似的,你还可能听说过AI和深度学习减少了人工手动作业的需要;在已经取得重大突破的领域,这一结论确实是正确的:计算机视觉模型只看像素、NLP模型只看单字(或者有时只看字母)。而对于企业数据而言,情况却是不清晰的。数据肯定需要经过清洗和整合,通过编码打标属类特征,而时间序列数据则需要进行相应处理(有时就需要人工手动操作)。总的来说,在未经检验的领域中,对于特殊操作和AI之间的关系应该持半信半疑态度,并为十分复杂的数据管道做好准备。

03

尝试不同的AI实验,找到速效方案

要评估AI技术是否适用于你的使用案例,其中牵涉了太多的未知数,所以更好的方案就是广撒网。把AI技术应用于处理大量的问题,比如说有10个问题,再观察AI在处理哪些问题上能够带来最好的结果。采取这样的方法意味着如果AI不是某个问题正确解决方案的话,你就不需要在那个问题上再白费力气,承担起不适合的工作。另外,采取这样的策略,你就可以确保以相对快的速度获得测试结果;接下来就可以耐心地搭建正确的以AI为基础的使用案例模型,这一过程需要花费相对更长的时间(在大范围内排除在非适用问题上套用AI技术的可能性)。

部署AI技术需要多方面的考虑。很多公司从来没有把机器学习模型投入用于生产,一开始就猛地扎进AI技术里,这样的人很快就会发现自己被弄得一头雾水。这并不是说AI技术比起机器学习要复杂多少,而是在于部署流程、监控流程、版本控制、模型的性能记录都是复杂的,如果企业从来没有相关的经验,那么AI的部署很难顺畅完成。所以采取一个经过深思熟虑的方案,逐渐将AI技术应用于更多的使用案例,是完成这一项转变的更好的方法。

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180123G0FHEV00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券