【新智元导读】近日,IBM 宣布他们使用一组由 Criteo Labs发布的广告数据集来训练逻辑回归分类器,在POWER9服务器和GPU上运行自身机器学习库Snap ML,结果比此前来自谷歌的最佳成绩快了46倍。 英伟达CEO黄仁勋和IBM 高级副总裁John Kelly在Think大会上 最近,在拉斯维加斯的IBM THINK大会上,IBM宣布,他们利用优化的硬件上的新软件和算法,取得了AI性能的大突破,包括采用 POWER9 和NVIDIA®V100™GPU 的组合。 谷歌云上TensorF
深度神经网络训练传统上依赖IEEE单精度格式,但在混合精度的情况下,可以训练半精度,同时保持单精度网络的精度。这种同时使用单精度和半精度表示的技术称为混合精度技术。
2017 年,Facebook 开源了针对深度学习的框架 PyTorch。PyTorch 可以帮助开发者和研究人员更加轻松的构建和训练模型。凭借其简单易用、功能强大、用途广泛等特点,PyTorch 广受欢迎,且至今仍是最火的深度学习框架之一。 近年来,随着数据集和模型规模的日益庞大,出于效率考虑,开发者通常采用分布式训练的方式,提⾼训练速度以加快模型迭代。流行的深度学习框架 PyTorch 也为分布式训练提供了内置支持。PyTorch 的分布式训练方式主要有 DP (DataParallel)、DDP (
最近,谷歌在GitHub上发布了用TensorFlow实现的AutoML框架——AdaNet,它改进了集成学习的方法,能以最少的专家干预实现自动习得高质量模型。
随着深度学习研究热潮的持续发酵,各种开源深度学习框架层出不穷,其中包括:Caffe、CNTK、MXNet、Neon、TensorFlow、Theano 和 Torch (著名开源深度学习框架 Keras 相当于是 TensorFlow 和 Theano 的简化接口,这里就不并列了)。在这些深度学习框架中,我个人是支持 TensorFlow 的。以前我的观点不是这样,当时的我觉得 TensorFlow 没有什么厉害的。TensorFlow 刚出来的时候,我还和 Mentor 思远大大一顿吐槽。不过我最近转变观
提起ICNET,就不得不说说ICNET构建的初衷-解决图像语义分割在实时应用中的挑战。图像语义分割(semantic segmentation)是结合了图像分类和对象检测,对图像中的每个像素实现细粒度的分类,就像下面的图中看到的那样,可以对封闭形状区域进行类别标记!得益于深度学习技术的爆发式发展,图像语义分割也进入高速的发展阶段。
https://tensorflow.google.cn/guide/distributed_training(此文的信息是2.3版本之前)。
李林 若朴 编译整理 量子位 出品 | 公众号 QbitAI 少年,你知道Jeff Dean么? 传奇一般的Jeff Dean现在领导着Google Brain团队,也是Google研发群组的高级研究
在这篇文章中,我们将看到 2019 年在 MyBridge 上最受欢迎的顶级开源机器学习项目。
基于图像分类,在VGG16模型的基础上,训练0、90、180、270度检测的分类模型. 详细代码参考angle/predict.py文件,训练图片8000张,准确率88.23%
Tensorflow是实验深度学习算法的绝佳工具。但是要利用深度学习的力量,需要利用计算能力和良好的工程技术。最终需要使用多个GPU,甚至可能需要多个流程才能实现目标。建议先阅读TensorFlow关于GPU 的官方教程。
本文介绍了DI-X平台,它是一个一站式深度学习平台,致力于让中小企业快速、低成本地接入人工智能。DI-X平台通过使用腾讯云对象存储(COS)和云服务器(CVM)等基础设施,结合腾讯云的DI-X组件,为中小企业提供了快速部署、训练和预测一站式深度学习服务。它主要包含六边形数据节点、长方形算法节点和圆形模型节点,支持在线预测、离线训练和模型管理等功能。DI-X平台旨在降低人工智能的门槛,推动人工智能的普及,为中小企业提供快速、低成本接入人工智能的能力,让它们能够更好地创新和发展。
NVIDIA Jetson平台通过全球最全面的人工智能软件堆栈和生态系统,实现了对边缘人工智能和机器人应用开发的广泛访问。它集成了可扩展的平台软件、现代化的人工智能堆栈、灵活的微服务和API、ROS包以及特定应用的人工智能工作流程。在本次讲座中,您将学习到使用新升级的NVIDIA Jetson软件堆栈加快开发视觉人工智能和工业机器人应用的技能。
作者:才云科技Caicloud,郑泽宇,顾思宇 要将深度学习应用到实际问题中,一个非常大的问题在于训练深度学习模型需要的计算量太大。比如Inception-v3模型在单机上训练到78%的正确率需要将近半年的时间 ,这样的训练速度是完全无法应用到实际生产中的。为了加速训练过程,本章将介绍如何通过TensorFlow利用GPU或/和分布式计算进行模型训练。本文节选自《TensorFlow:实战Google深度学习框架》第十章。 本文将介绍如何在TensorFlow中使用单个GPU进行计算加速,也将介绍生成T
要将深度学习应用到实际问题中,一个非常大的问题在于训练深度学习模型需要的计算量太大。比如Inception-v3模型在单机上训练到78%的正确率需要将近半年的时间 ,这样的训练速度是完全无法应用到实际生产中的。为了加速训练过程,本章将介绍如何通过TensorFlow利用GPU或/和分布式计算进行模型训练。本文节选自《TensorFlow:实战Google深度学习框架》第十章。 本文将介绍如何在TensorFlow中使用单个GPU进行计算加速,也将介绍生成TensorFlow会话(tf.Session)时的一
关键要点 我们看到越来越多的公司使用深度学习算法。因此,我们将深度学习从创新者转移到了早期采用者类别。与此相关的是,深度学习存在新的挑战,例如在边缘设备上部署算法和训练非常大的模型。 尽管采用率正在缓慢增长,但现在有更多的商业机器人平台可用。我们在学术界之外看到了一些用途,但相信未来会有更多未被发现的用例。 GPU 编程仍然是一项很有前途的技术,但目前尚未得到充分利用。除了深度学习,我们相信还有更多有趣的应用。 借助 Kubernetes 等技术,在典型的计算堆栈中部署机器学习变得越来越容易。我们看到越来越
TensorFlow™是一个开源软件库,最初由研究Google Brain Team的研究人员和工程师开发。TensorFlow用于使用数据流图进行数值计算。图中的节点表示数学运算,而图表边表示在它们之间传递的多维数据阵列(张量)。灵活的体系结构允许您使用单个API将计算部署到桌面,服务器或移动设备中的一个或多个CPU或GPU。
作者:才云科技Caicloud,郑泽宇,顾思宇 要将深度学习应用到实际问题中,一个非常大的问题在于训练深度学习模型需要的计算量太大。比如Inception-v3模型在单机上训练到78%的正确率需要将近半年的时间 ,这样的训练速度是完全无法应用到实际生产中的。为了加速训练过程,本章将介绍如何通过TensorFlow利用GPU或/和分布式计算进行模型训练。本文节选自《TensorFlow:实战Google深度学习框架》第十章。 本文将介绍如何在TensorFlow中使用单个GPU进行计算加速,也将介绍生成Ten
选自Minimaxir 作者:Max Woolf 机器之心编译 参与:乾树、李泽南 越来越多的开发者正在使用云服务来训练和运行模型,然而目前看来这种做法的成本较高。不过相比云 GPU 而言,动态分配的云 CPU 就便宜很多了。前苹果员工 Max Woolf 最近测试了云 CPU 阵列在执行 TensorFlow 任务时的效率,并得到了令人满意的结果。利用价格差使用云 CPU 代替 GPU 可以为我们节约不少使用成本。 我一直在使用 Keras 和 TensorFlow 开展一些个人深度学习项目。但是,使用
周日 2016年4月24日 由弗朗索瓦Chollet 在教程中。
生成式对抗网络(GANs)是深度学习中最热门的话题之一。 生成式对抗网络是一类用于无监督学习算法的人工算法,由两个神经网络组成的系统实现:
2018 年 12 月,英伟达在加拿大蒙特利尔 NeurIPS 大会上发布最新款产品 Titan RTX,作为 2017 年 Titan V 的「继承者」,Titan RTX 价格更低,显存更大,性能更强,且使用图灵架构,具备强大的光线追踪能力。因此,Titan RTX 的发布对 AI 社区而言,是不是做深度学习的一个不错选择呢?
Lady在想,人工智能技术应用在医疗上,会不会有助于改善医患关系呢?也欢迎你留言谈谈你的想法吧!
大数据时代的到来带来了海量数据的处理和分析需求。在这个背景下,TensorFlow作为一种强大的深度学习框架,展现了其在大数据领域中的巨大潜力。本文将深入探索TensorFlow在大数据处理和分析中的应用,介绍其在数据预处理、模型构建、分布式训练和性能优化等方面的优势和特点。
今年初,我们在 TensorFlow 开发者大会 (TensorFlow Dev Summit) 上发布了 TensorFlow 2.0 的 Alpha 版本。经过近 7 个月的努力,今天我们高兴的宣布,TensorFlow 2.0 正式版现已推出!
选自Uber 作者:Alex Sergeev、Mike Del Balso 机器之心编译 参与:李泽南、路雪 Horovod 是 Uber 开源的又一个深度学习工具,它的发展吸取了 Facebook「一小时训练 ImageNet 论文」与百度 Ring Allreduce 的优点,可为用户实现分布式训练提供帮助。本文将简要介绍这一框架的特性。 近年来,深度学习引领了图像处理、语音识别和预测等方面的巨大进步。在 Uber,我们将深度学习应用到了公司业务中,从自动驾驶搜索路线到防御欺诈,深度学习让我们的数据科
有了能做出惊人预测的模型之后,要做什么呢?当然是部署生产了。这只要用模型运行一批数据就成,可能需要写一个脚本让模型每夜都跑着。但是,现实通常会更复杂。系统基础组件都可能需要这个模型用于实时数据,这种情况需要将模型包装成网络服务:这样的话,任何组件都可以通过REST API询问模型。随着时间的推移,你需要用新数据重新训练模型,更新生产版本。必须处理好模型版本,平稳地过渡到新版本,碰到问题的话需要回滚,也许要并行运行多个版本做AB测试。如果产品很成功,你的服务可能每秒会有大量查询,系统必须提升负载能力。提升负载能力的方法之一,是使用TF Serving,通过自己的硬件或通过云服务,比如Google Cloud API平台。TF Serving能高效服务化模型,优雅处理模型过渡,等等。如果使用云平台,还能获得其它功能,比如强大的监督工具。
这是一本简明的 TensorFlow 2.0 入门指导手册,基于 Keras 和 Eager Execution(即时运行)模式,力图让具备一定机器学习及 Python 基础的开发者们快速上手 TensorFlow 2.0。
今天,Google 发布了分布式 TensorFlow。Google 的博文介绍了 TensorFlow 在图像分类的任务中,100 个 GPUs 和不到 65 小时的训练时间下,达到了 78% 的正确率。在激烈的商业竞争中,更快的训练速度是人工智能企业的核心竞争力。而分布式 TensorFlow意味着它能够真正大规模进入到人工智能产业中,产生实质的影响。 Google 今天发布分布式 TensorFlow 版本! 即便 TensorFlow 在 2015 年底才出现,它已经吸引了全球机器学习开发者的目
我们非常高兴能够将训练后的 float16 quantization 作为模型优化工具包(Model Optimization Toolkit)的一部分。这套工具包括了:
随着深度学习技术的飞速发展,各种基于深度学习的人工智能应用层出不穷。在这些应用中,人脸识别是一个非常典型且广泛应用的场景。本文将分享基于GPU进行人脸识别模型训练的实践经验。
坊间有传MacOs系统不适合机器(ml)学习和深度(dl)学习,这是板上钉钉的刻板印象,就好像有人说女生不适合编程一样的离谱。现而今,无论是Pytorch框架的MPS模式,还是最新的Tensorflow2框架,都已经可以在M1/M2芯片的Mac系统中毫无桎梏地使用GPU显卡设备,本次我们来分享如何在苹果MacOS系统上安装和配置Tensorflow2框架(CPU/GPU)。
在本系列的上一篇博客文章中,我们探索了将GPU用于数据科学工作流的好处,并演示了如何在Cloudera Machine Learning(CML)中设置会话以访问NVIDIA GPU来加速机器学习项目。尽管将GPU用于复杂和大型任务的省时潜力巨大,但设置这些环境和任务(例如整理NVIDIA驱动程序,管理CUDA版本以及为特定项目需求部署自定义引擎)可能既耗时又充满挑战。为了简化这些流程,并使数据科学家更快地在ML用例上工作,我们简化了在CML中本地配置和利用NVIDIA GPU的工作。在接下来的部分中,我们将为您提供三种简单的方法,使数据科学团队可以开始使用GPU来为CML中的深度学习模型提供支持。
前四篇文章我们介绍了 PaddleFluid 和 TensorFlow 的设计原理基本使用概念,分别通过在两个平台上实现完全相同的模型完成图像分类,语言模型和序列标注三个任务,了解我们的使用经验如何在两个平台之间迁移,以此来了解非序列模型和序列模型在两个平台之上设计和使用的差异。
总第497篇 2022年 第014篇 美团机器学习平台基于内部深度定制的TensorFlow研发了Booster GPU训练架构。该架构在整体设计上充分考虑了算法、架构、新硬件的特性,从数据、计算、通信等多个角度进行了深度的优化,最终其性价比达到CPU任务的2~4倍。本文主要讲述Booster架构的设计实现、性能优化及业务落地工作,希望能对从事相关开发的同学有所帮助或者启发。 1 背景 2 GPU训练优化挑战 3 系统设计与实现 3.1 参数规模的合理化 3.2 系统架构 3.3 关键实现 4 系统性能优
选自Julia Blog 作者:Mike Innes等人 机器之心编译 任何机器学习系统复杂到一定程度,都会包含一个临时开发的、不合规范的、充满错误的、运行速度很慢的、只有一半功能的编程语言实现。(格林斯潘第十定律) 我们很高兴看到机器学习大爆发,以及机器学习模型的复杂度和用来构建模型的框架。越来越多的顶尖模型更多地涉及到编程问题,通常它们需要支持循环和递归等编程结构,这给创建它们的工具(编程语言)带来了一些有趣的问题。 尽管机器学习没有专用的语言,但有的机器学习框架(如 TensorFlow)在 Pyth
得益于更快的计算,更好的存储和易于使用的软件,基于深度学习的解决方案绝对可以看到从概念验证隧道进入现实世界的曙光!看到深度学习模型已广泛应用于该行业的各个领域,包括医疗保健,金融,零售,技术,物流,食品技术,农业等!考虑到深度学习模型需要大量资源并且经常需要大量计算的事实,因此我们需要暂停片刻,并考虑一下最终用户使用模型时的推断和服务时间。
通过本教程,你可以了解 Keras 和 tf.keras 之间的区别,以及 TensorFlow 2.0 的新特性。本教程的灵感来自于上周二我在 PyImageSearch 阅读器上收到的一封邮件。
选自clindatsci 作者:Neil Tenenholtz 机器之心编译 参与:Jane W、黄小天 Tensorflow 是一个为数值计算(最常见的是训练神经网络)设计的流行开源库。在这个框架中,计算流程通过数据流程图(data flow graph)设计,这为更改操作结构与安置提供了很大灵活性。TensorFlow 允许多个 worker 并行计算,这对必须通过处理的大量训练数据训练的神经网络是有益的。此外,如果模型足够大,这种并行化有时可能是必须的。在本文中,我们将探讨 TensorFlow 的
选自RStudio 作者:Tareef Kawaf 机器之心编译 参与:路雪、李泽南 日前,RStudio 博客发文称其已开发出适合 R 语言用户的 TensorFlow 接口,R 语言的用户也可以方便地使用 TensorFlow 了。博客还介绍了接口中的包和工具、学习资源等。以下,机器之心对本文进行了编译介绍。 链接:https://tensorflow.rstudio.com/ 在过去一年中,RStudio 的开发者们一直在努力为 R 语言构建 TensorFlow 的接口。几天前,开发小组终于宣布大部
文 / Khanh LeViet 和 Luiz Gustavo Martins,技术推广工程师
原文链接:The Good, Bad, & Ugly of TensorFlow 作者:Dan Kuster 译者:刘翔宇 审校:赵屹华 责编:周建丁(zhoujd@csdn.net) 自从TensorFlow半年前发布以来,我们一直使用它来进行日常研究和工程。在此过程中我们也学习到了很多知识。是时候写一些新体会了! 因为TensorFlow上没有很多主观的文章和有用的文档,我必须尽可能地使用我能找到的样例、教程、文档和代码片段。 善 社区参与是最重要的。 当涉及到机器学习时,很容易把注意力集中于技术
在机器学习的领域中,张量指的是描述神经网络的数学模型中使用的多维数组。换言之,张量通常是一个矩阵或矢量的更高维泛化。 通过一种使用秩来显示维数的简单表示法,张量可以将复杂的 n 维矢量和超形状表示为 n 维数组。张量有两个属性:数据类型和形状。 关于 TensorFlow TensorFlow 是一个开源的深度学习框架,于 2015 年末依据 Apache 2.0 许可进行发布。自那以后,它成为了在全球得到最广泛采用的深度学习框架之一(根据它的 GitHub 项目数量来判断)。 TensorFlow 的起源
我们尝试去工程化深度神经网络并最终落地,当中的一些实践经验通过本文记录下来。
一般来说我们会在笔记本或者 PC 端编写模型和训练代码,准备一些数据,配置训练之后会在笔记本或者 PC 端做一个简单验证,如果这些代码数据都 OK 的话,然后真正的训练放在计算力更强的的计算机上面执行,一般来说至少有一块或者多块 GPU,有相当好的显存和内存,接下来实验一下。 选择一个支持 TensorFlow GPU 的计算机 当务之急是找到一块可以用于 TensorFlow 的显卡,TensorFlow 只支持在 NVIDIA 的部分高端显卡上面进行 GPU 加速, 在 NVIDIA 开发者中心可以找到
AI 研习社按:随着深度学习神经网络规模越来越大,训练一个深度神经网络(Deep Neural Networks, DNNs)往往需要几天甚至几周的时间。为了加快学习速度,经常需要分布式的 CPU/GPU 集群来完成整个训练。本文就就来为大家简单简单介绍一下如何进行分布式训练深度学习模型。 在近期 AI 研习社的线上公开课上,来自 IBM 系统部研发工程师武维博士为大家做了一期主题为「深度学习中的分布式训练」的在线分享,错过了直播的同学们如果看了本文有疑惑之处还可以到雷锋网(公众号:雷锋网) AI 慕课学院
领取专属 10元无门槛券
手把手带您无忧上云