Keras多GPU :指定显式GPU ids_keras指定gpu_keras 指定gpu - 腾讯云开发者社区 - 腾讯云

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

MaskRCNN 何凯明_cnn应用

本文介绍了Mask Rcnn目标分割项目的搭建及运行过程，并对搭建过程中可能出现的问题进行了解答。

01

[翻译] 使用 TensorFlow 进行分布式训练

https://tensorflow.google.cn/guide/distributed_training（此文的信息是2.3版本之前）。

02

您找到你想要的搜索结果了吗？

是的

没有找到

一文教你在Colab上使用TPU训练模型

Google Colab免费为TPUs提供实验支持！在本文中，我们将讨论如何在Colab上使用TPU训练模型。具体来说，我们将通过在TPU上训练huggingface transformers库里的BERT来进行文本分类。

02

『深度应用』一小时教你上手训练MaskRCNN·Keras开源实战（Windows&Linux）

MaskRCNN是何凯明基于以往的faster rcnn架构提出的新的卷积网络，一举完成了object instance segmentation. 该方法在有效地目标的同时完成了高质量的语义分割。文章的主要思路就是把原有的Faster-RCNN进行扩展，添加一个分支使用现有的检测对目标进行并行预测。

02

NLP项目工作流程

文章目录 1. 谷歌Colab设置 2. 编写代码 3. flask 微服务 4. 打包到容器 5. 容器托管参考基于深度学习的自然语言处理使用这篇文章的数据(情感分类)进行学习。

03

Transformers2.0让你三行代码调用语言模型，兼容TF2.0和PyTorch

参考链接：在Python中使用BERT Tokenizer和TensorFlow 2.0进行文本分类

02

Transformers2.0让你三行代码调用语言模型，兼容TF2.0和PyTorch

最近，专注于自然语言处理（NLP）的初创公司 HuggingFace 对其非常受欢迎的 Transformers 库进行了重大更新，从而为 PyTorch 和 Tensorflow 2.0 两大深度学习框架提供了前所未有的兼容性。

03

教程 | 如何使用Keras、Redis、Flask和Apache把深度学习模型部署到生产环境？

选自pyimagesearch 作者：Adrian Rosebrock 机器之心编译参与：Jane W、黄小天本文介绍了如何使用 Keras、Redis、Flask 和 Apache 将自己的深度学习模型迁移到生产环境。文中的大多数工具可以互换，比如 Keras 可替换成 TensorFlow 或 PyTorch，Django 可代替 Flask，Nginx 可代替 Apache。作者唯一不推荐替换的工具是 Redis。同时本文还对深度学习 REST API 进行了压力测试，这种方法可以轻松扩展到添加的

「决战紫禁之巅」之深度学习框架篇：Keras VS PyTorch

TensorFlow 是很多科学家、工程师和开发人员的首个深度学习框架。虽然 TensorFlow 1.0 早在 2017 年 2 月就发布了，但使用过程中对用户不太友好。

04

深度学习框架对决篇：Keras VS PyTorch

TensorFlow 是很多科学家、工程师和开发人员的首个深度学习框架。虽然 TensorFlow 1.0 早在 2017 年 2 月就发布了，但使用过程中对用户不太友好。

02

【NLP实战】基于ALBERT的文本相似度计算

实战是学习一门技术最好的方式，也是深入了解一门技术唯一的方式。因此，NLP专栏推出了实战专栏，让有兴趣的同学在看文章之余也可以自己动手试一试。

02

maskrcnn训练步骤_神经网络如何预测

今天我们来说一下，如何使用自己训练出来的Mask_RCNN模型，或是官方自己的模型权重来进行预测：

04

文末福利 | 深度学习框架Keras与Pytorch对比

【磐创AI导读】：本篇文章为大家介绍了深度学习框架Keras与Pytorch对比，希望对大家有所帮助。想要获取更多的机器学习、深度学习资源，欢迎大家点击上方蓝字关注我们的公众号：磐创AI。

02

Keras 3.0一统江湖！大更新整合PyTorch、JAX，全球250万开发者在用了

经过5个月的公开Beta测试，深度学习框架Keras 3.0终于面向所有开发者推出。

01

【AI大模型】训练Al大模型

应用领域首先来谈一谈大模型的·成就大模型已经在许多应用领域取得了显著的成果，包括：

03

Mask R-CNN上手指南:对象检测和分割实现无人机的检测

目标检测是一种计算机视觉技术，用于识别和定位图像中的目标。有很多检测算法存在，这里是对Mask R-CNN的一个很好的总结。

01

基于 Google Colab 的 Milvus 使用教程

Milvus 是一款开源的向量相似度搜索引擎，集成了 Faiss、NMSLIB、Annoy 等广泛应用的向量索引库，并提供了一整套简单直观的 API。Milvus 具备高度灵活、稳定可靠以及高速搜索等特点，在全球范围内已被数百家组织和机构所采用。他们将 Milvus 与 AI 模型结合，广泛应用于以下场景：

01

Tensorflow笔记：高级封装——tf.Estimator

Google官方给出了两个tensorflow的高级封装——keras和Estimator，本文主要介绍tf.Estimator的内容。tf.Estimator的特点是：既能在model_fn中灵活的搭建网络结构，也不至于像原生tensorflow那样复杂繁琐。相比于原生tensorflow更便捷、相比与keras更灵活，属于二者的中间态。

01

keras系列︱keras是如何指定显卡且限制显存用量（GPU/CPU使用）

版权声明：博主原创文章，微信公众号：素质云笔记,转载请注明来源“素质云博客”，谢谢合作！！ https://blog.csdn.net/sinat_26917383/article/details/75633754

03

用Kaggle免费GPU微调ChatGLM2

前方干货预警：这篇文章可能是你目前能够找到的可以无痛跑通LLM微调并基本理解整个流程的门槛最低的入门范例。

02

深度推荐模型——DIN [KDD 18][Alibaba]

import tensorflow as tf from tensorflow import keras from utils import * EPOCH = 10 BATCH_SIZE = 32 VEC_DIM = 10 DROPOUT_RATE = 0.5 HEAD_NUM = 4 HIDE_SIZE = 128 LAYER_NUM = 3 DNN_LAYERS = [200, 80] data, max_user_id, max_item_id = load_data() # 行为特征个数 BEH

02

mask rcnn训练自己的数据集

最近迷上了mask rcnn，也是由于自己工作需要吧，特意研究了其源代码，并基于自己的数据进行训练~

02

聊一聊深度学习分布式训练

在深度学习时代，训练数据特别大的时候想要单卡完成训练基本是不可能的。所以就需要进行分布式深度学习。在此总结下个人近期的研究成果，欢迎大佬指正。

06

keras系列︱keras是如何指定显卡且限制显存用量

本文介绍了在keras中使用GPU显存的三种方式，包括指定GPU、使用固定显存的GPU和使用GPU显存限制。通过重设backend的GPU占用情况，可以调节模型训练时的显存占用情况，避免显存不足的问题。同时，在命令行中使用CUDA_VISIBLE_DEVICES可以指定使用哪些GPU，从而更好地利用GPU资源进行训练和推理。

09

Tensorflow与Keras自适应使用显存方式

Tensorflow支持基于cuda内核与cudnn的GPU加速，Keras出现较晚，为Tensorflow的高层框架，由于Keras使用的方便性与很好的延展性，之后更是作为Tensorflow的官方指定第三方支持开源框架。

02

广告行业中那些趣事系列57：从理论到实战一网打尽Transformer中的位置编码

摘要：本篇从理论到实践介绍了Transformer中的位置编码。首先介绍了位置编码的作用以及主要实现方式；然后重点介绍了主流的位置编码方式，包括训练式位置编码、三角函数式位置编码和相对位置编码，同时基于开源项目bert4keras源码实践了各种位置编码。对Transformer中位置编码的知识和源码实践感兴趣的小伙伴可以多交流。

02

如何微调BERT模型进行文本分类

BERT（Bidirectional Encoder Representations from Transformers）在各种自然语言处理任务中提供了最前沿的结果在深度学习社区引起了轰动。德夫林等人。2018 年在 Google 使用英文维基百科和 BookCorpus 开发了 BERT，从那时起，类似的架构被修改并用于各种 NLP 应用程序。XL.net 是建立在 BERT 之上的示例之一，它在 20 种不同任务上的表现优于 BERT。在理解基于 BERT 构建的不同模型之前，我们需要更好地了解 Transformer 和注意力模型。

01

keras 指定程序在某块卡上训练实例

策略：CUDA_VISIBLE_DEVICES=1 python train.py就可以指定程序在某块卡上训练。

03

[开发技巧]·TensorFlow&Keras GPU使用技巧

使用TensorFlow&Keras通过GPU进行加速训练时，有时在训练一个任务的时候需要去测试结果，或者是需要并行训练数据的时候就会显示OOM显存容量不足的错误。以下简称在训练一个任务的时候需要去测试结果，或者是需要并行训练数据为进行新的运算任务。

02

深度推荐模型——BST [KDD 19][Alibaba]

受Transformer在自然语言处理中取得巨大的效果启发，BST将应用Transformer 用于提取用户行为序列背后的隐藏信息，同时考虑序列的前后顺序，能够更好的表达用户兴趣。

02

Keras – GPU ID 和显存占用设定步骤

初步尝试 Keras (基于 Tensorflow 后端)深度框架时, 发现其对于 GPU 的使用比较神奇, 默认竟然是全部占满显存, 1080Ti 跑个小分类问题, 就一下子满了. 而且是服务器上的两张 1080Ti.

04

【学术】如何在15分钟内建立一个深度学习模型?

我们正在开源Lore，它是一个框架，可供机器学习研究人员使用。 Lore地址：https://github.com/instacart/lore 机器学习常常给人一种这样的感觉: 论文没有告诉我该如何

07

【Keras】Keras入门指南

在用了一段时间的Keras后感觉真的很爽，所以特意祭出此文与我们公众号的粉丝分享。 Keras是一个非常方便的深度学习框架，它以TensorFlow或Theano为后端。用它可以快速地搭建深度网络，灵活地选取训练参数来进行网路训练。总之就是：灵活+快速！

02

深度推荐模型——DIEN [AAAI 19][Alibaba]

import tensorflow as tf from tensorflow import keras from utils import * import numpy as np EPOCH = 10 BATCH_SIZE = 32 VEC_DIM = 10 DROPOUT_RATE = 0.5 HEAD_NUM = 4 HIDE_SIZE = 128 LAYER_NUM = 3 DNN_LAYERS = [200, 80] data, max_user_id, max_item_id = load_

02

防止在训练模型时信息丢失用于TensorFlow、Keras和PyTorch的检查点教程

如果你玩过电子游戏，你就会明白为什么检查点（chekpoint）是有用的了。举个例子，有时候你会在一个大Boss的城堡前把你的游戏的当前进度保存起来——以防进入城堡里面就Game Over了。机器学

05

Keras多GPU训练

Keras 2.X版本后可以很方便的支持使用多GPU进行训练了，使用多GPU可以提高我们的训练过程，比如加速和解决内存不足问题。

03

使用TensorFlow 2.0的简单BERT

这篇文章展示了使用TensorFlow 2.0的BERT [1]嵌入的简单用法。由于TensorFlow 2.0最近已发布，该模块旨在使用基于高级Keras API的简单易用的模型。在一本很长的NoteBook中描述了BERT的先前用法，该NoteBook实现了电影评论预测。在这篇文章中，将看到一个使用Keras和最新的TensorFlow和TensorFlow Hub模块的简单BERT嵌入生成器。所有代码都可以在Google Colab上找到。

01

使用 Python 构建图片搜索引擎

我们经常使用搜索引擎。当我们需要查询时，我们可以使用像 Google 这样的搜索引擎来检索最相关的答案。

01

Pytorch分布式训练

简单来说，如果数据集较小时推荐尽量使用Map式Dataset，数据量过大、数据量未知、训练内存无法满足时只能使用Iterable式构建Dataset。

02

keras自带数据集(横线生成器)

在使用kears训练model的时候，一般会将所有的训练数据加载到内存中，然后喂给网络，但当内存有限，且数据量过大时，此方法则不再可用。此博客，将介绍如何在多核（多线程）上实时的生成数据，并立即的送入到模型当中训练。工具为keras。

02

如何根据thucnews中的海量文章数据集训练一个根据文章生成题目的seq2seq模型

首先安装bert4keras pip install git+https://www.github.com/bojone/bert4keras.git 基于苏剑林老师的bert4keras进行小幅度改动

01

TensorFlow 2.0 - CNN / 预训练 / RNN

文章目录 1. CNN 卷积神经网络 2. 预训练模型 3. RNN 循环神经网络学习于：简单粗暴 TensorFlow 2 1. CNN 卷积神经网络卷积神经网络，卷积后尺寸计算 tf.keras.layers.Conv2D， tf.keras.layers.MaxPool2D # CNN 模型 class myCNN(tf.keras.Model): def __init__(self): super().__init__() self.conv1 = tf

02

最新！TensorFlow 1.9.0正式版发布

TensorFlow 1.9.0正式版发布了，下面是更新和改进的细节，更详细的信息请到网站查阅：github.com/tensorflow/tensorflow/releases/tag/v1.9.0

02

超快速！10分钟入门Keras指南

作者：李中粱小编：赵一帆 1 Keras框架介绍在用了一段时间的Keras后感觉真的很爽，所以特意祭出此文与我们公众号的粉丝分享。 Keras是一个非常方便的深度学习框架，它以TensorFlow或Theano为后端。用它可以快速地搭建深度网络，灵活地选取训练参数来进行网路训练。总之就是：灵活+快速！！！ 2 安装Keras 首先你需要有一个Python开发环境，直接点就用Anaconda，然后在CMD命令行中安装： # GPU 版本 >>> pip install --upgrade tensorf

08

流水账︱Elmo词向量中文训练过程杂记

参考：《文本嵌入的经典模型与最新进展》人们已经提出了大量可能的词嵌入方法。最常用的模型是 word2vec 和 GloVe，它们都是基于分布假设的无监督学习方法（在相同上下文中的单词往往具有相似的含义）。

02

keras实现多GPU或指定GPU的使用介绍

补充知识：踩坑记—-large batch_size cause low var_acc

01

利用bert系列预训练模型在非结构化数据抽取数据

本文代码来源苏剑林老师bert4keras example中的例子。 https://github.com/bojone/bert4keras 中文数据中有一个数据是从非结构化文本中找到演艺圈相关实

00

Tensorflow全局设置可见GPU编号操作

笔者需要tensorflow仅运行在一个GPU上（机器本身有多GPU），而且需要依据系统参数动态调节，故无法简单使用CUDA_VISIBLE_DEVICES。

02

Ray 源码解析（一）：任务的状态转移和组织形式

之前文章写了 Ray 的论文翻译。后来我花了些时间读了读 Ray 的源码，为了学习和记忆，后续预计会出一系列的源码解析文章。为了做到能持续更新，尽量将模块拆碎些，以保持较短篇幅。另外，阅历所限，源码理解不免有偏颇指出，欢迎大家一块讨论。

02

教程 | 从预处理到部署：如何使用Lore快速构建机器学习模型

选自Medium 作者：Montana Low 机器之心编译参与：李诗萌、思源机器学习的构建和部署通常需要非常多的工作与努力，这对于软件开发者和入门者造成了很多困难。本文介绍了如何使用软件库 Lore 快速而高效地构建机器学习模型，并从数据预处理到模型部署等七个步骤介绍构建的经验。一般问题 Python 或 SQL 等高级语言编写代码时，模型性能很容易出现瓶颈。代码复杂性在增长，因为有价值的模型需要通过许多次迭代才能得到。当代码以非结构化的方式演化时，难以保证与传达最初的想法。对数据和函数库的依赖

05

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭