首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

有效AI的5个属性

IBM outlines the 5 attributes of useful AI

IBM:有效AI的5个属性

几周前,一个垂头丧气的首席技术官告诉我,他的团队花了三个礼拜的时间才建立起一个机器学习的模型。我告诉他才三周就建起一个模型听起来相当不错了,他表示同意。那么,为什么要拉长了脸满是沮丧呢?因为11个月后,这个模型就会被束之高阁。

随着人工智能和机器学习与现实世界接触,优秀人工智能雏形和在运人工智能之间的鸿沟开始成为一个共同主题。原因是……实际上有很多因素,我们可以任中择取一些来看,但是在其他所有原因下,最本质的问题还是数据变如潮涌且奔流不息这个事实。

世界日新月异,数据瞬息万变。建立人工智能或机器学习模型意味着建立一种看待世界的方式。但随着世界和数据的变化,模型也需要适应。我认识的首席技术官开始意识到建立一个优异的模型也仅仅只是跨出了第一步。

一个模型本身对于现实世界来说太脆弱了,它需要作为一个更庞大的系统并且保证流畅。那么我们如何使人工智能系统的流畅呢?——需要能清晰地构建五个属性:

1.控管

————

对于人工智能和机器学习来说,要做实际而持久的工作,他们需要周到、持续和透明的基础设施,这始于识别数据管道,纠正不良数据或丢失数据的问题。它还意味着对模型进行集成数据治理和版本控制,每个模型的版本——你也可以同时使用数以千计的模型——显示其输入。你会想知道,监管者也会想知道。

2.弹性

————

流体性意味着从一开始就能接受人工智能模型的不同步。这种“漂移”可以根据现实世界的变化时而迅速或缓慢地发生,经常进行数据科学回归测试,但不会耗费你的时间。

这需要一个系统来设置准确的阈值和自动警报,让你知道什么时候需要注意模型。你是否要在旧的数据上重训模型,获取新的数据,又或者从头对特性进行重组?答案取决于数据和模型,但第一步是知道问题出在哪里。

3.竞争力

————

大多数人工智能在计算上都非常紧张——无论是在训练期间还是在部署之后。大多数模型需要以毫秒为单位,而不是分钟来进行交易,以防止欺诈或投机倒把。理想情况下,你可以在GPU上训练模型,然后将它们部署到高性能的CPU上,并提供足够的内存来进行实时评分。

当然,不管部署在何处,on-prem、云计算或multi-cloud,你都希望一切能准确无误地快速运行。

4.可测性

————

目前,对于人工智能和机器学习项目的预算还算慷慨,但如果数据科学团队迟迟不能提供具体结果,这些预算也将缺口。从一开始就考虑如何量化和形象化你正在学习的东西以及变化过程,这改进了数存取和数据卷,提高了模型的精确度,并最终提升了底线。

当你的数据科学工作已日趋成熟,你不仅要考虑现在需要权衡什么,还要考虑将来的权衡问题,系统是足够“流动”以便跟进这些长期目标?

5.持续性

————

一开始我就指出了数据并不是静止的。流体人工智能的第五个也是最后一个方面是随着世界的变化不断地进行学习。一定要使用像Jupyter和Zeppelin这样的工具,这些工具可以接入到进程的调度评估和再培模型中。

同时,当你从各种算法、语言,数据集和工具中汲取优缺势,你也期待自己的学习不断地成长和发展。流体人工智能要求对数据、工具和系统进行持续改进,但也需要每个人在工作上不断改进。

数据科学是一段旅程。俗套但真实。注意以上这五个特质,你将聚焦于每一个时刻,迫使自己去发现未来的清晰脉络。

2018数博会专题入口

http://www.cbdio.com/zhuanti/node_10266.htm

注:译:数据观/黄玉叶,原文来源:VentureBeat.com,作者:IBM分析开发部门副总裁Dinesh Nirmal,编辑:Fynlch王培(微信号:WP1306020480),图片背景素材来源:视觉中国。欲了解更多大数据丨区块链丨人工智能行业相关资讯丨干货丨报告等,可搜索数据观微信公众号(ID:cbdioreview)进入查看。

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180426A0UA4L00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券