开源 | 微软发行 Cognitive Toolkit 2.0 完整版:从性能更新到应用案例

选自Microsoft

作者:John Roach

机器之心编译

参与:黄小天、蒋思源

近日,微软在其官方博客上撰文宣布全面开源 Microsoft Cognitive Toolkit 2.0,该版本版本包含了 beta 版本以来的数百个新功能,简化了深度学习流程,可在更广泛的人工智能生态系统之中实现无缝整合;此外它还支持 Keras、Java API、英伟达最新版本的深度学习 SDK 和高级 GPU 架构(比如英伟达 Volta)。机器之心对该文进行了编译,原文链接请见文末。

美国切萨皮克州保护协会(The Chesapeake Conservancy)正在使用微软的 Cognitive Toolkit 来定义和训练一个神经网络,加速创建用于监督恢复与保护的这个切萨皮克湾土地覆盖的数据集。

今天,一支微软的研究者与软件工程师团队声称,微软开源了其用来取得人工智能重大突破的一个工具包。

在开发「Microsoft Cognitive Toolkit」(也被称作 CNTK)中扮演重要角色的合伙人工程经理(partner engineering manager)Chris Basoglu 说:「该工具包的 2.0 完整版本现已全面发行。」其有五大重要更新:1、支持 Keras;2、极快的 Halide 二进制卷曲;3、支持 Java API;4、新的 NuGet 软件包集;5、多漏洞修复。(链接:https://github.com/microsoft/cntk)

用于产品级和企业级工作负载的微软 Cognitive Toolkit 2.0 的完整版本包含了 beta 版本以来的数百个新功能,简化了深度学习流程,确保该工具包在更广泛的人工智能生态系统之中无缝整合。

此外,Cognitive Toolkit 的完整版本还将支持 Keras,一个用户友好的开源神经网络库,它在深度学习应用开发者之间广受欢迎。Basoglu 解释道,为 Keras 编写的代码现在可以利用 Cognitive Toolkit 的性能与速度而无需改变任何代码。目前对 Keras 的支持正在公开预览之中。

通过支持最新版本的英伟达深度学习 SDK 和高级 GPU 架构(比如英伟达 Volta),Cognitive Toolkit 将会继续加速训练能力。

自 2016 年 10 月 Cognitive Toolkit 的 beta 版本发行以来,就受到了需要定义和训练神经网络的大量公司和组织的欢迎,这些神经网络能够以科学家认为的类似于人脑学习的方式学习执行具体任务。

楠蒂柯克河(The Nanticoke River)是 Demlarva 半岛上流入的切萨皮克湾的最大支流。楠蒂柯克流域大约占地 53 万英亩,包括了超过 5 万英亩的潮汐湿地。切萨皮克州保护协会正努力借助人工智能保护这片湿地

例如,位于美国马里兰州首府安纳波利斯(Annapolis)的切萨皮克州保护协会正和微软研究者一起合作使用该工具包定义和训练一个神经网络,加速创建当下最新的一米分辨率的土地覆盖数据集,可优先处理整个切萨皮克湾(跨越 6 个州和 华盛顿特区的 64000 平方英里的土地)的恢复和保护倡议。

这些新数据集的信息量是现有的 30 米分辨率数据集的 900 倍;但是如果没有人工智能,这需要人力数月的数据输入和图像处理才能完成。新的神经网络把工作流程压缩为单一算法,可在一小部分时间内生成相似的映射。据项目合伙人讲,这种人工智能技术应该扩展开来,帮助全美和全球性的保护组织。

在中国,人工智能医疗创业公司 Airdoc 正使用微软的 Azure 云服务、认知服务和 Cognitive Toolkit 来研发其技术,该技术可以快速准确地探测糖尿病性视网膜病变的发作(糖尿病的一种并发症,可导致失明如果没有正确对待)。

视频内容

Cognitive Toolkit 的开发最开始是为了微软研究者和工程师加速训练深度神经网络和其他机器学习模型,开发诸如必应视频搜索和语音识别系统等应用,其中后者是微软一个突破性进展,它可以像人一样识别对话中的字词。

微软研究员们意识到,相同的工具可以满足人工智能应用日益增长的需求,比如语音理解和图像识别就从小型初创公司到大型科技公司、政府机构、非营利组织和学术机构等都在使用。

Basoglu 及其团队调整了该工具以满足有基本编程技巧和笔记本电脑的爱好者,同时其还允许高技能开发者对搜索工具进行全面定制,从而加速在多个服务器和最新 GPU 上有大量数据集的深度神经网络训练。

除了支持 Keras 外,今天发布的其他新特性还包括添加了用于模型评估的 Java 捆绑包,还有压缩已训练的模型以在资源受限的设备上实时运行的新工具,进而将图像识别等应用加载到这种设备中(如智能手机)。

该工具是微软「人工智能技术民主化」这一倡议的一部分。除了 Cognitive Toolkit 之外,开发者可以通过微软 Azure 访问一套云计算应用,就如同通过微软认知服务容易地使用和部署机器学习应用程序接口或 API 那样。

Basoglu 说:「最初,人们手写他们的数学函数,用个人代码创建他们自己的神经网络,并独自计算出如何提供数据;但是现在,面对海量的数据,复杂的算法和多 GPU、CPU 和机器之间令人生畏的优化,个人式的自我编写就变得不合时宜了。他们需要的是新工具。」

扩展阅读:

  • 查看微软 Cognitive Toolkit 博客:https://www.microsoft.com/en-us/cognitive-toolkit/blog/
  • 查看微软 Cognitive Toolkit 主页:https://www.microsoft.com/en-us/cognitive-toolkit/
  • 该项目 GitHub 的下载地址:https://github.com/microsoft/cntk

原文链接:https://blogs.microsoft.com/next/2017/06/01/microsoft-releases-open-source-toolkit-to-accelerate-deep-learning/#sm.000001nsijtrqgfleudmujejudoj9

原文发布于微信公众号 - 机器之心(almosthuman2014)

原文发表时间:2017-06-02

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏何俊林

Android Multimedia框架总结(十七)音频开发基础知识

近年来,唱吧,全民K歌,QQ音乐,等成为音频软件的主流力量,音频开发一直是多媒体开发中不可或缺的部分,如为什么这个声音这么不清楚,为什么耳机里有电流声,为什么录...

3995
来自专栏媒矿工厂

【视频编码】 Content Aware ABR技术(七)

在本系列前面的帖子中,我们连续梳理了Netflix、YouTube、Beamr、EuclidIQ、Bitmovin及Harmonic在CAE(Content A...

2985
来自专栏大数据挖掘DT机器学习

【趣味】数据挖掘(4)——借博客点击兼谈干预规则

讲过长课的老师,常在受众将发生审美疲劳之时段,安排一点有趣的内容。为消除疲劳,现来一段有趣的、与博友的自尊心和荣誉感相关的博文,议题是:挖掘科学博客的平均...

3287
来自专栏奇点大数据

入门深度学习应该学什么

最近被人问的最多的一个问题是“我想入门深度学习,我应该学些什么”。 老实说,这个问题不是那么好回答,毕竟每个人的知识背景和技能背景实在是太不一样了。如果要假设...

3897
来自专栏深度学习思考者

深度学习数据集(一)

海量数据(又称大数据)已经成为各大互联网企业面临的最大问题,如何处理海量数据,提供更好的解决方案,是目前相当热门的一个话题。类似MapReduce、 Hadoo...

2317
来自专栏机器学习算法与Python学习

资源 | 中文NLP资源库

最近,在GitHub上,有人收罗了一份资源,汇集了40个关于中文NLP词库,涵盖了各个方面。

2872
来自专栏媒矿工厂

2017 HDR技术动态

2017年是HDR发展突飞猛进的一年,这一年里,HDR不仅仅在技术层面取得了巨大的进步,在消费市场也取得了极大的成功,在其他相关领域中也得到了广泛的应用。 在消...

6457
来自专栏ThoughtWorks

Lightweight Architecture Decision Records | 雷达哔哔哔

ThoughtWorks每年都会出品两期技术雷达,这是一份关于科技行业的技术趋势报告,在四个象限:技术、平台、工具以及语言和框架对每一个条目(Blip)做采用、...

1422
来自专栏QQ会员技术团队的专栏

小明带你看WWDC 2017(day2实况)

作者介绍: 黄明,WWDC 2017大会的小时光茶社特派员 ,腾讯SNG增值产品部内容中心iOS组leader,主要负责手Q个性化业务、手Q WebView等项...

22810
来自专栏新智元

深度学习动手实践:用 TensorFlow 打造“会看”的机器人

(文/Lukas Biewald)物体识别是当前机器学习最热门的方向。计算机早已能够识别如人脸、猫之类的物体,但识别更大范围里的任意物体对人工智能来说仍是难题。...

4776

扫码关注云+社区

领取腾讯云代金券