动态 | 首个应用到大规模真实工业场景的神经网络控制系统在谷歌上线了

AI 科技评论按:即便深度学习和其它机器学习方法近几年已经取得了不小的发展,但是把它们直接应用在真实工业场景中、让它们直接控制工业系统还未曾见到。深度学习本身缺乏鲁棒性、面对新状况难以预测行为等一些特性固然是重要的掣肘之处,如何让算法逐步提高控制范围、协调与人类的协作方式也是难题。DeepMind 和谷歌最近就做出了新一步尝试,取得了不小的成功,然后在 DeepMind 博客上进行了介绍。AI 科技评论编译如下。

我们人类社会面对的许多紧迫问题中,有许多问题还在变得越来越复杂,所有人都急切地想要找到好的解决方法。对于 DeepMind 和谷歌来说,他们相信如果人类可以把 AI 作为探寻新知识的工具加以利用,找到解决方法就会容易得多。

2016 年时,DeepMind 和谷歌联手开发了一个基于 AI 的动作推荐系统,向负责维护、调节冷却系统的数据中心运营人员推荐不同状况下的应对方法,它让谷歌当时已经具有很高能源效率的推荐系统数据中心向前更进了一步。他们的出发点也很简单,为了应对全球气候变化,大型能耗场所的一点点小改进也能在在减少能源消耗、减少二氧化碳排放方面有重大影响。

最近,DeepMind 把这个系统升级到了一个全新的级别上:不再像原来的系统那样向人类推荐一些动作,然后由人类去完成,AI 系统现在会直接控制数据中心的冷却系统,当然了它也仍然受到数据中心运营人员的专业监控。这是首个基于云的控制系统,已经在多个谷歌的数据中心中安静地运行、持续地节省能源。

工作方式

每隔 5 分钟,这个基于云的 AI 会从数据中心的数千个传感器中采集数据,获得数据中心冷却系统的状态快照,然后把它输入深度神经网络。这个网络会预测各种可能的操作的不同组合会如何影响数据中心的能量消耗。然后 AI 就会就会在满足鲁棒安全性限制的条件下判断出一组能够最小化能源消耗的动作。这些动作的判断结果接下来会被发回给数据中心,由本地的控制系统验证并执行。

这种系统运行的想法其实来自于在数据中心使用原来那个 AI 推荐系统的操作人员。他们告诉 DeepMind 的研究人员们,虽然系统给他们教了一些最新最好的操作技巧,比如让冷却介质覆盖更多的设备,而不是更少,但是实现这些推荐操作其实需要花费非常多的操作精力和长期规划。所以他们自然地就很想知道,能不能不需要人来出力就达到类似的能源节省效果。

现在他们就可以很高兴地宣布,答案是能。谷歌的一位数据库操作人员表示:「我们希望可以节省能源,同时也降低操作人员的工作强度。自动化的系统就可以让我们以更高的频率执行更细粒度的行动,同时出的错误还更少。」

兼顾安全性和可靠性

谷歌的数据中心里一般都有上千台服务器,它们支撑着谷歌搜索、Gmail、YouTube 等用户们每天都会使用的服务。确保这些服务可以可靠、高效地运行是最关键的一件事。DeepMind 和谷歌一起设计 AI 智能体以及背后的控制界面时,都是带着安全、可靠的思维从头设计的,还使用了 8 种不同的机制确保系统能够总是能够按照预期行动。

他们使用的方法里,其中一种较为简单的是估计不确定性。对于总计上亿个可能的动作中的每一种,AI 智能体都需要计算自己认为这是一个好的动作的信心。估计出来信心太低的动作就不去考虑了。

另一个方法是两层验证。AI 计算出的最优行动首先需要根据一个内置的、由数据中心运营人员们制定的安全限制清单做检查。计算的结果通过检查、从云端发送到实际的数据中心之后,当地的控制系统还会再次把指令根据自己的一套安全限制清单再检查一遍。这种冗余设计的检查流程确保了系统的运行总是在当地的限制之内的,操作人员们也总是对操作的边界有完全的控制。

最重要的是,谷歌的数据中心总是会受到人类的完全控制的,人类随时可以选择退出 AI 控制模式。这时候,控制系统会自动从 AI 控制无缝地切换到基于现代自动化工业使用的基于现场规则的以及启发式设计的控制系统。

他们设计的其它安全机制如下图:

连续监控、自动错误重启、平滑切换、两层验证、不间断通讯、不确定性估计、规则与启发式设计的备用控制系统、人类指令优先

越用越节省能源

相比于原来的动作推荐系统需要操作人员自己检查以及实施推荐的动作,新的 AI 控制系统是自己直接实现这些动作的。DeepMind 和谷歌的研究人员在开发它时也有有意识地把系统的优化边界设定到了一个更窄更小的策略中,让它把安全和可靠作为首要目标,也就是说对于节约能源的目标来说,它需要在过于节约导致的不稳定风险和优化不足的低反馈之间找到平衡。

虽然只上线了几个月时间,这个系统已经可以稳定地节约平均 30% 左右的能源,而且他们还期待系统未来可以改善更多。这是因为随着数据更多,系统的优化判断能力也会变得更强,如下图。随着技术越来越成熟,DeepMind 和谷歌的研究人员未来也会把系统的优化边界设置得宽松一些,来达到更好的能源节约效果。

这个 AI 直接控制的系统时不时找到一些新的方法管理冷却系统,有一些方法甚至让数据库操作人员觉得惊讶。与这个系统紧密协作的一位谷歌数据中心运营人员就惊讶道:「这个 AI 会利用冬天外面比较冷的特点,产生比平时更冷的冷却水,然后减少了给数据中心降温所需的能源消耗。规则是不会自己变得越来越好的,但是 AI 可以啊。」

对于已经安全运行、独立运行、降低能耗的 AI 直接控制系统,DeepMind 和谷歌都觉得非常激动。不过,在数据中心中使用这样的系统才仅仅是个开始。在长远的未来,他们认为还有很多的潜力把这样的技术运用在其他工业场景中,也就可以在更大的规模上帮助对抗气候变化。

via deepmind.com,AI 科技评论编译

原文发布于微信公众号 - AI科技评论(aitechtalk)

原文发表时间:2018-08-20

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏SDNLAB

混合云的四大典型应用案例

在云计算的早期,业界的专家们就对公有云和私有云的优缺点进行了大量的讨论,以帮助企业做出更好的选择。现在大多数企业不再是需要从公有云或者私有云中作出选择,企业现在...

5504
来自专栏CSDN技术头条

软件架构发展历程分享

架构的形式与特点 设计文档和代码 我们一般说的架构既包括架构的设计过程,也包括设计的产出物,一般可以包括各类设计文档、设计图,也可以包括一些技术验证代码、De...

4134
来自专栏Material Design组件

About Face 4 第二章(4)定性研究的其他类型

2737
来自专栏架构之美

转转大数据平台从 0 到 1 演进与实践

1332
来自专栏罗超频道

找社交要答案,搜狗能重构搜索吗?

移动互联网还在不断瓜分着互联网的流量,入口的碎片化使得搜索引擎受到很大冲击,搜索引擎都在尝试重构自己,寻找新的出路,执掌搜狗11年的王小川的思路是:接入独家内容...

4344
来自专栏DevOps时代的专栏

DevOps实施:项目群管理(PPM)中的需求和计划管理

本文面向的是企业IT用户(尤其是每年要投入数以百计的人力,开发维护十几个甚至几十个上百个上不同系统的企业),在组织范围内的计划和需求消耗太多的问题。而对于只有十...

1969
来自专栏姬小光

前端工程师的核心价值 @2018

作为一个还算资深的前端工程师,我也时常在思考自身的价值到底在何处。网上每年都有许多关于前端工程师这个岗位的讨论,其之所以如此激烈,或因该岗位本身无法明确定义,故...

1343
来自专栏PPV课数据科学社区

测测你的数据管理处于什么段位?

营销技术、新工具和流程的不断演变,营销自动化的兴起,已迫使许多商家学习智能化数据管理。了解数据管理的细微差别,不但有利于改善发件人信誉风险、低响应...

3558
来自专栏ATYUN订阅号

【算法】我们对Google的排名算法到底了解多少?

Google是搜索引擎领域的主导力量,在搜索引擎优化(SEO)中,致力于最大限度地提高知名度。 ? 像我这样的人已经建立了自己的职业生涯,想方设法从Google...

3885
来自专栏云计算D1net

IDC转型成为云服务重要参与者

“云”是生活在数据中心的,依赖于数据中心存在。在当今不断变化的环境中,更多业务和数据放在数据中心,现在数据中心几乎被用于存储所有的东西。事实上,今天几乎所有的新...

2465

扫码关注云+社区

领取腾讯云代金券