TensorFlow:在contrib.learn中不允许使用GPU内存增长选项。估计器

TensorFlow是一个开源的机器学习框架，由Google开发和维护。它提供了丰富的工具和库，用于构建和训练各种机器学习模型。

在TensorFlow中，contrib.learn是一个旧版的API，用于构建和训练机器学习模型。然而，从TensorFlow 1.14版本开始，官方不再推荐使用contrib.learn，而是推荐使用更现代化的tf.keras和tf.estimator API。

在contrib.learn中，GPU内存增长选项是一种用于动态分配GPU内存的功能。它允许TensorFlow在需要时按需增加GPU内存的大小，以适应模型和数据的需求。然而，由于一些技术限制和性能问题，这个选项在contrib.learn中被禁用。

估计器（Estimator）是TensorFlow中的一个重要概念，它提供了一种高级的API，用于简化模型的构建、训练和评估过程。估计器封装了模型的定义、损失函数、优化器和评估指标等，使得模型的开发和使用更加方便。

推荐的腾讯云相关产品和产品介绍链接地址：

腾讯云AI Lab：https://cloud.tencent.com/developer/labs
腾讯云机器学习平台：https://cloud.tencent.com/product/tensorflow

请注意，以上答案仅供参考，具体的推荐产品和链接地址可能会根据实际情况有所调整。

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

腾讯云TKE-GPU案例: TensorFlow 在TKE中的使用

背景用户在TKE中部署TensorFlow, 不知道如何部署已经如何验证是否可以使用GPU,还是用的cpu....下面主要演示如何部署TensorFlow以及验证TensorFlow在TKE中是否可以使用GPU 在TKE中添加GPU节点在TKE控制台中添加GPU节点 [GPU] 检查状态: 节点状态为健康说明添加成功...')] 这个结果说明可以使用GPU进行计算限制 GPU 内存增长默认情况下，TensorFlow 会映射进程可见的所有 GPU（取决于 CUDA_VISIBLE_DEVICES）的几乎全部内存。...TensorFlow 为此提供了两种控制方法。第一个选项是通过调用 tf.config.experimental.set_memory_growth 来打开内存增长。...请注意，我们不会释放内存，因为这样会产生内存碎片。要关闭特定 GPU 的内存增长，请在分配任何张量或执行任何运算之前使用以下代码。

2K9 0

Tensorflow多GPU使用详解

磐创AI 专注分享原创AI技术文章翻译 | fendouai 编辑 | 磐石【磐创AI导读】：本文编译自tensorflow官方网站，详细介绍了Tensorflow中多GPU的使用。...目录：介绍记录设备状态手动分配状态允许GPU内存增长在多GPU系统是使用单个GPU 使用多个 GPU 一．介绍在一个典型的系统中，有多个计算设备。...允许 GPU 内存增长默认情况下，TensorFlow 将几乎所有的 GPU的显存（受 CUDA_VISIBLE_DEVICES 影响）映射到进程。...通过减少内存碎片，可以更有效地使用设备上宝贵的GPU内存资源。在某些情况下，只需要分配可用内存的一个子集给进程，或者仅根据进程需要增加内存使用量。...如果要真正限制 TensorFlow 进程可用的GPU内存量，这非常有用。五．在多GPU系统上使用单个GPU 如果您的系统中有多个GPU，则默认情况下将选择具有最低ID的GPU。

5.5K4 0

使用GPU

支持的设备在典型的系统中，有多个计算设备。在TensorFlow中，支持的设备类型是CPU和GPU。它们被表示为strings。...允许GPU内存增长默认情况下，TensorFlow将几乎所有GPU的GPU内存映射 CUDA_VISIBLE_DEVICES到该进程的可见内容。...这样做可以通过减少内存碎片来更有效地使用设备上相对宝贵的GPU 内存资源。在某些情况下，该过程仅需要分配可用存储器的一个子集，或只是根据该过程需要增加内存使用量。...TensorFlow在会话上提供两个配置选项来控制。...如果要真正限制TensorFlow进程可用的GPU内存量，这是非常有用的。在多GPU系统上使用单个GPU 如果您的系统中有多个GPU，则默认情况下将选择具有最低ID的GPU。

1.7K5 0

GPU加持，TensorFlow Lite更快了

由于处理器性能和电池容量有限，在移动设备上使用计算密集的机器学习模型进行推断是非常耗资源的。...在Pixel 3上的纵向模式下，Tensorflow Lite GPU推理相比具有浮点精度的CPU推断，将前景 - 背景分割模型加速4倍以上，新的深度估计模型加速10倍以上。...神经网络模型越复杂，GPU加速越重要，这些模型可以更好地利用GPU，例如计算密集的预测、分段或分类任务。在非常小的模型上，可能没什么加速，使用CPU反而更有利，可以避免内存传输中固有的延迟代价。...由于GPU在4通道数据结构中效率最高，因此通道大小不等于4的张量将重新整形为更加GPU友好的布局。执行着色器程序：将上述着色器程序插入命令缓冲区队列，GPU将这些程序输出。...在此步骤中，我们还为中间张量管理GPU内存，以尽可能减少后端的内存占用。

1.2K2 0

TensorFlow Lite发布重大更新！支持移动GPU、推断速度提升4-6倍

新的后端利用了： OpenGL ES 3.1 在 Android 设备上计算着色器 iOS 设备上的金属计算着色器 ?...GPU 与 CPU 性能在Pixel 3的人像模式（Portrait mode）中，与使用CPU相比，使用GPU的Tensorflow Lite，用于抠图/背景虚化的前景-背景分隔模型加速了4倍以上。...在小型模型中，加速效果效果可能略差，但 CPU 的使用可以降低内存传输固有的延迟成本。如何使用？...由于 GPU 在 4 通道数据结构中效率最高，因此通道大小不等于 4 的张量将重新调整为更加适合 GPU 的布局执行着色器程序：将上述着色器程序插入命令缓冲区队列中，GPU 将这些程序输出。...在此步骤中，我们还为中间张量管理 GPU 内存，以尽可能减少后端的内存占用必要时将输出移动到 CPU：一旦深度神经网络完成处理，框架将结果从 GPU 内存复制到 CPU 内存，除非网络的输出可以直接在屏幕上呈现

1.2K2 0

TensorFlow会话的配置项

比如TensorFlow在进程里可以看到8张GPU，而有人想把可见的GPU的5和3映射成”/gpu:0”和”/gpu:1”，那么他可以制定这个参数值为”5,3”。...因而，要求用户在调用TensorFlow之前，使用供应商指定的机制（比如CUDA_VISIBLE_DEVICES）来控制从物理的到可见硬件的映射关系。...bool force_gpu_compatible：是否启动强制张量的GPU兼容。在启用了GPU的TensorFlow中，这个选项为True，意味着所有的CPU的张量将被分配Cuda的固定内存。...通常情况下，TensorFlow会推断哪些张量应该分配固定内存。但是有些情况下这种推断可能不完整，那么只要它适配内存，这个选项就对于跨硬件的内存拷贝的性能尤为重要。...更高的数值可能会降低并行的机会，并且会使用更多的内存（现在对于这些没有限制，但是之后会改变。） GlobalJitLevel global_jit_level：编辑器/运行时编译的等级。

2K4 0

Intel为什么强调NVIDIA Tensor Core GPU非常适合推理

据Anandtech称，为了实现单一主流NVIDIA V100 GPU的性能，英特尔将两款耗电量大的高端cpu组合在一起，估计售价在5万至10万美元之间。...它们旨在加速人工智能训练和推理，并且很容易使用TensorFlow和PyTorch框架中的自动混合精度特性。开发人员只需向TensorFlow项目添加两行代码，就可以实现3倍的培训速度。...Tensor Core gpu在推荐系统中的应用人工智能的另一个关键用途是推荐系统，该系统用于在视频分享网站、社交网站上的新闻源和电子商务网站上提供相关内容推荐。...表3:NCF上的推理 CPU服务器:单插槽Xeon Gold 6240@2.6GHz;内存384 gb的系统;使用Intel的TF Docker容器版本1.13.1在TensorFlow上为NCF使用Intel...统一的人工智能训练和推理平台在应用程序中使用AI模型是一个迭代过程，旨在不断提高它们的性能。数据科学家团队不断用新的数据和算法更新他们的模型，以提高准确性。然后开发人员在应用程序中更新这些模型。

3K2 0

做深度学习这么多年还不会挑GPU？这儿有份选购全攻略

1.6K5 0

深度学习框架机器学习的开源库TensorFlow

使用 TensorFlow 的一个主要优势是，它拥有模块化、可扩展、灵活的设计。开发人员只需更改少量代码，就能轻松地在 CPU、GPU 或 TPU 处理器之间移植模型。...TensorFlow 可以在图内和图之间同步或异步执行分布式训练，还可以在内存中或跨联网的计算节点来共享通用数据。性能。...虚拟机选项用于深度学习的虚拟机 (VM) 目前最适合有许多核心的以 CPU 为中心的硬件。因为主机操作系统控制着物理 GPU，所以在 VM 上实现 GPU 加速很复杂。...Docker 安装选项在 Docker 容器或 Kubernetes 集群中运行 TensorFlow 有许多优势。...部署在 PowerAI OpenPOWER 服务器上的 Kubernetes 集群中。

1.1K1 0

《Scikit-Learn与TensorFlow机器学习实用指南》第12章设备和服务器上的分布式 TensorFlow

在本章中，我们将看到如何使用 TensorFlow 在多个设备（CPU 和 GPU）上分配计算并将它们并行运行（参见图 12-1）。...在本节中，我们将介绍如何设置您的环境，以便 TensorFlow 可以在一台机器上使用多个 GPU 卡。然后，我们将看看如何在可用设备上进行分布操作，并且并行执行它们。...在 ŽigaAvsec 的博客文章中，提供了在 Amazon AWS GPU 实例上使用 Python 3.5 设置 TensorFlow 0.9 的详细说明。...但是，TensorFlow 一旦抓取内存就不会释放内存（以避免内存碎片），因此您可能会在一段时间后内存不足。是否使用此选项可能难以确定，因此一般而言，您可能想要坚持之前的某个选项。...TensorFlow 集群中的所有服务器都可能与集群中的任何其他服务器通信，因此请确保在防火墙上打开适当的端口。每台 TensorFlow 服务器都提供两种服务：主服务和辅助服务。

1.1K1 0

为了加速在GPU上进行深度学习训练，NVIDIA原来还做了这么多事情，你都知道么?

TensorFlow 18.11 TensorFlow NGC容器包含TensorFlow 1.12的最新版本。这为实验性XLA编译器支持的GPU性能提供了重大改进。...在相关的注释中，NVIDIA为分析器提供了对CUDA应用程序性能的强大洞察。然而，尽管这些概要文件提供了大量关于应用程序底层性能的数据，但通常很难为TensorFlow用户解释这些数据。...我们增强了TensorFlow的图形执行器(使用NVIDIA profiler NVTX扩展)，将标记发送到使用CUDA profiler(如nvprof)收集的配置文件中，从而简化了性能分析。...这个选项缓冲所有要在gpu中累积的所有层的梯度，然后在完成向后传递后将它们链接在一起。...这些都可以在最新的cuDNN 7.4.1版本中获得。这些新实现支持更有效的内存访问，并且在许多典型用例中可以接近内存带宽峰值。

2.2K4 0

放下王者农药这锅，玩一把Tensorflow吧

TensorFlow是谷歌基于DistBelief进行研发的第二代人工智能学习系统，可被用于语音或图像识别等多项机器深度学习领域。对于这种高大上的东西估计很多人都想学吧，包括我这位零基础的小编。...但我参考了Andrew Che的教程，加上实践操作，我成功的在Windows上安装了TensorFlow，以下是我的步骤： 1.检查GPU是否支持CUDN：其实这一步是可以省略的，因为CUDN支持的显卡范围特别广...，你基本只要确认你的GPU是不是NVIDIA的就可以了，当然如果你还是不确定的话，也可以去这个网站中的“CUDA-Enabled GeForce Products”查一下，只要你的显卡型号在里面就可以了...create — name tensorflow-gpu python=3.5 anaconda activate tensorflow-gpu pip install tensorflow-gpu...pip install keras 7.确认TensorFlow安装完成：在命令提示符中输入“jupyter notebook”，在浏览器中召唤jupyter notebook 新建个python3档案

90510 0

思科公司发布强大的AI服务器UCS C480 ML M5

它是一个配备Intel Xeon可扩展处理器的4U服务器，八个带有高带宽NVLink互连的Nvidia Tesla V100-32G GPU，以及CPU，网络，存储，内存和软件前端的灵活选项。...“GPU与减少训练模型所需的时间非常相关，特别是在深度学习中，”他说。“我们看到训练时间减少了一个数量级。”...UCS服务器与容器化应用程序（在与更广泛的系统隔离的自己的操作环境中运行的应用程序）和多云计算模型（具有跨服务存储的数据集的AI系统）一起使用，并且它与思科的AI解决方案堆栈完全兼容。...思科正在努力验证UCS C480 ML M5存储数据并运行容器化Apache Spark和Google TensorFlow分析工作负载的设计。...Brannon补充道，“在过去的五到四年里，我们看到我们的大数据业务增长了18倍，从全球企业客户到公共部门，所有不同行业都有需求。

8003 0

和TensorFlow一样，英伟达CUDA的垄断格局将被打破？

如今，谷歌在机器学习社区中似乎有些被孤立了，因为它没有使用 PyTorch 和 GPU，而是使用自己的软件堆栈和硬件。...虽然 TensorFlow 现在也默认使用 Eager 模式，但研究社区和大多数大型科技公司都选择使用 PyTorch。...之后，模型在参数数量上增长了 3 到 4 个数量级，而最快的 GPU 在 FLOPS 上增长了 1 个数量级。...很大一部分时间花费在等待来自另一个计算 / 内存的数据，或者及时重新计算结果以减少内存瓶颈。从 A100 到 H100，FLOPS 增长到原来的 6 倍以上，但内存带宽仅增长到 1.65 倍。...接着，Inductor 进入调度阶段，在该阶段融合算子，并确定内存规划。随后，Inductor 进入「Wrapper Codegen」，它生成在 CPU、GPU 或其他 AI 加速器上运行的代码。

9151 0

学界丨基准测评当前最先进的 5 大深度学习开源框架

在很多实验结果中，使用16核CPU的性能仅比使用4核或8核稍好。TensorFlow在CPU环境有相对较好的可扩展性。...因为单个GPU卡内存相对较少，限制了神经网络规模，训练的可伸缩性对于深度学习框架至关重要。在如今的深度学习工具中，支持多GPU卡成为了一个标准功能。...例如CNTK中可以在配置文件中指定“maxTempMemSizeIn-SamplesForCNN”选项，以控制CNN使用的临时内存的大小，虽然可能导致效率略微降低，但是内存需求更小了。...在Caffe中，梯度更新在GPU端执行，但它使用了树减少策略（tree reduction strategy）。...然而，TensorFlow在CPU端进行梯度聚合和模型更新，这不仅需要很多时间通过PCI-e传输梯度，而且还使用单个CPU更新串行算法中的模型。因此TensorFlow的伸缩性不如其他工具。

1.1K5 0

keras系列︱keras是如何指定显卡且限制显存用量（GPUCPU使用）

若单核GPU也无所谓，若是服务器GPU较多，性能较好，全部占满就太浪费了。...于是乎有以下五种情况： 1、指定GPU 2、使用固定显存的GPU 3、指定GPU + 固定显存 4 GPU动态增长 5 CPU充分占用 ---- 一、固定显存的GPU 本节来源于：深度学习theano...· GitHub）在使用keras时候会出现总是占满GPU显存的情况，可以通过重设backend的GPU占用情况来进行调节。...allow_soft_placement=True，有时候，不同的设备，它的cpu和gpu是不同的，如果将这个选项设置成True，那么当运行设备不满足要求时，会自动分配GPU或者CPU。...Github中给出了在tf.keras中直接使用DistributionStrategy的例子。

3.8K3 0

基准评测 TensorFlow、Caffe、CNTK、MXNet、Torch 在三类流行深度神经网络上的表现（论文）

在很多实验结果中，使用16核CPU的性能仅比使用4核或8核稍好。TensorFlow在CPU环境有相对较好的可扩展性。...因为单个GPU卡内存相对较少，限制了神经网络规模，训练的可伸缩性对于深度学习框架至关重要。在如今的深度学习工具中，支持多GPU卡成为了一个标准功能。...例如CNTK中可以在配置文件中指定“maxTempMemSizeIn-SamplesForCNN”选项，以控制CNN使用的临时内存的大小，虽然可能导致效率略微降低，但是内存需求更小了。...随着GPU数量的增长，全部工具均实现高达40%的提速，而TensorFlow只有30%。...在Caffe中，梯度更新在GPU端执行，但它使用了树减少策略（tree reduction strategy）。

1.9K8 0

【技术创作101训练营】TensorFlow Lite的 GPU 委托（Delegate）加速模型推理

TFLite在端侧 GPU 推理的支持方面，最早便支持了 OpenGL 的推理，在2020年5月中旬，基于委托代理方式也支持了 OpenCL 。 4....实际 APP 中，多使用 C++ API，下面以 Android 系统的 C++ API 添加 GPU 代理为例。...例如，包含相机传输的GPU纹理），那么可以直接保留在GPU内存中而无需进入到CPU内存，。TFLite有提供这样的接口。...下面是在部分安卓手机上在armv7环境测试tensorflow MobileNetV2的GPU性能： [图4 部分安卓手机上在armv7环境测试tensorflow MobileNetV2的GPU性能]...本文对委托代理（Delegate）做一定的解释，因为仅从TensorFlow Lite的文档出发结合我的思考，并介绍了委托代理在TensorFlow Lite中的实现方式，对TensorFlow Lite

5.2K220 191

Tensorflow Lite人体姿势跟踪功能上线：基于PosNet的实时人体姿态估计

怀着激动的心情，我们发布了一个「TensorFlow Lite」示例应用程序（https://www.tensorflow.org/lite），通过它在安卓设备上通过使用「PoseNet」模型来实现人体姿势估计...在 Google I/O』19 上，TensorFlow Lite 展示了应用程序 Dance Like，该程序通过使用 PoseNet 帮助用户学习如何跳舞。...使用从「Person」对象中获取的关键点位置在画布上绘制骨架。显示置信度超过特定阈值（默认值为 0.2）的关键点。为了将姿势渲染与摄像头帧同步。...，我们希望为这个示例应用程序探索更多的功能，包括：多姿态估计通过 GPU delegate 进行 GPU 加速通过 NNAPI delegate 进行 NNAPI 加速通过训练后（post-training...如果你在使用这个应用程序，请通过 #TFLite、#TensorFlow 和 #PoweredByTF 与我们分享.

2K3 0

NVIDIA HugeCTR，GPU 版本参数服务器 --(1)

节点上提高了 114 倍，在同一个 V100 GPU 上实现了 TensorFlow 的 8.3 倍提高。...为了训练大规模 CTR 估计模型，HugeCTR 中的嵌入表是模型并行的，并分布在同构集群中的所有 GPU 上，该集群由多个节点组成。...对于包括嵌入在内的其他层，数据类型更改为 FP16，以便节省内存带宽和容量。要启用混合精度模式，请在配置文件中指定 mix_precision 选项。...它是通过在训练阶段以粗粒度、按需方式将超过 GPU 内存聚合容量的嵌入表的一个子集加载到 GPU 中来实现的。要使用此功能，您需要将数据集拆分为多个子数据集，同时从中提取唯一键集（见图 7）。...4.7 分层参数服务器 HugeCTR 分层参数服务器 (POC) 上的本地 SSD 和 CPU 内存之间实现了分层存储机制。通过这种实现，嵌入表不再需要存储在本地 CPU 内存中。

1.1K2 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云