TensorFlow 2.0 - TFRecord存储数据集、@tf.function图执行模式、tf.TensorArray、tf.config分配GPU

Michael阿明

发布于 2021-02-19 14:12:54

8080

发布于 2021-02-19 14:12:54

文章被收录于专栏：Michael阿明学习之路

文章目录

学习于：简单粗暴 TensorFlow 2

1. TFRecord 格式存储

使用该种格式，更高效地进行大规模的模型训练

import random
import os
import tensorflow as tf

# 使用前一节 kaggle 上的 猫狗数据集
train_data_dir = "./dogs-vs-cats/train/"
test_data_dir = "./dogs-vs-cats/test/"

# 训练文件路径
file_dir = [train_data_dir + filename for filename in os.listdir(train_data_dir)]
labels = [0 if filename[0] == 'c' else 1
          for filename in os.listdir(train_data_dir)]

# 打包并打乱
f_l = list(zip(file_dir, labels))
random.shuffle(f_l)
file_dir, labels = zip(*f_l)

# 切分训练集，验证集
valid_ratio = 0.1
idx = int((1 - valid_ratio) * len(file_dir))
train_files, valid_files = file_dir[:idx], file_dir[idx:]
train_labels, valid_labels = labels[:idx], labels[idx:]

# tfrecord 格式数据存储路径
train_tfrecord_file = "./dogs-vs-cats/train.tfrecords"
valid_tfrecord_file = "./dogs-vs-cats/valid.tfrecords"

# -------------------看下面代码-----------------------------
# 存储过程
# 预先定义一个写入器
with tf.io.TFRecordWriter(path=train_tfrecord_file) as writer:
    # 遍历原始数据
    for filename, label in zip(train_files, train_labels):
        img = open(filename, 'rb').read()  # 读取图片，img 是 Byte 类型的字符串
        # 建立 feature 的 字典 k : v
        feature = {
            'image': tf.train.Feature(bytes_list=tf.train.BytesList(value=[img])),
            'label': tf.train.Feature(int64_list=tf.train.Int64List(value=[label]))
        }
        # feature 包裹成 example
        example = tf.train.Example(features=tf.train.Features(feature=feature))
        # example 序列化为字符串，写入
        writer.write(example.SerializeToString())

# -------------------看下面代码-----------------------------
# 读取过程
# 读取 tfrecord 数据，得到 tf.data.Dataset 对象
raw_train_dataset = tf.data.TFRecordDataset(train_tfrecord_file)
# 特征的格式、数据类型
feature_description = {
    'image': tf.io.FixedLenFeature(shape=[], dtype=tf.string),
    'label': tf.io.FixedLenFeature([], tf.int64),
}


def _parse_example(example_string): # 解码每个example
    # tf.io.parse_single_example 反序列化
    feature_dict = tf.io.parse_single_example(example_string, feature_description)
    # 图像解码
    feature_dict['image'] = tf.io.decode_jpeg(feature_dict['image'])
    # 返回数据 X, y
    return feature_dict['image'], feature_dict['label']

# 处理数据集
train_dataset = raw_train_dataset.map(_parse_example)

import matplotlib.pyplot as plt
for img, label in train_dataset:
    plt.title('cat' if label==0 else 'dog')
    plt.imshow(img.numpy())
    plt.show()

2. tf.function 高性能

TF 2.0 默认 即时执行模式（Eager Execution），灵活、易调试
追求高性能、部署模型时，使用图执行模式（Graph Execution）
TF 2.0 的 tf.function 模块 + AutoGraph 机制，使用 @tf.function 修饰符，就可以将模型以图执行模式运行

注意：@tf.function修饰的函数内，尽量只用 tf 的内置函数，变量只用 tensor、numpy 数组

被修饰的函数 F(X, y) 可以调用get_concrete_function 方法，获得计算图

graph = F.get_concrete_function(X, y)

3. tf.TensorArray 支持计算图特性

tf.TensorArray 支持计算图模式的动态数组

arr = tf.TensorArray(dtype=tf.int64, size=1, dynamic_size=True)
arr = arr.write(index=1, value=512)
# arr.write(index=0, value=512) # 没有左值接受，会丢失
for i in range(arr.size()):
    print(arr.read(i))

4. tf.config 分配GPU

列出设备 list_physical_devices

print('---device----')
gpus = tf.config.list_physical_devices(device_type='GPU')
cpus = tf.config.list_physical_devices(device_type='CPU')
print(gpus, "\n", cpus)

# 单个的 GPU, CPU
[PhysicalDevice(name='/physical_device:GPU:0', device_type='GPU')] 
 [PhysicalDevice(name='/physical_device:CPU:0', device_type='CPU')]

设置哪些可见 set_visible_devices

tf.config.set_visible_devices(devices=gpus[0:2], device_type='GPU')

或者

终端输入 export CUDA_VISIBLE_DEVICES=2,3
or 代码中加入

import os
os.environ['CUDA_VISIBLE_DEVICES'] = "2,3"

指定程序只在显卡 2, 3 上运行

显存使用策略：

gpus = tf.config.list_physical_devices(device_type='GPU')
for gpu in gpus:
	# 仅在需要时申请显存
    tf.config.experimental.set_memory_growth(device=gpu, enable=True)

gpus = tf.config.list_physical_devices(device_type='GPU')
# 固定显存使用上限，超出报错
tf.config.set_logical_device_configuration(
    gpus[0],
    [tf.config.LogicalDeviceConfiguration(memory_limit=1024)])

单 GPU 模拟多 GPU 环境

在单GPU电脑上，写多GPU 代码，可以模拟实现

gpus = tf.config.list_physical_devices('GPU')
tf.config.set_logical_device_configuration(
    gpus[0],
    [tf.config.LogicalDeviceConfiguration(memory_limit=2048),
     tf.config.LogicalDeviceConfiguration(memory_limit=2048)])
gpus = tf.config.list_logical_devices(device_type='GPU')
print(gpus)

输出：2个虚拟的GPU

[LogicalDevice(name='/device:GPU:0', device_type='GPU'), 
 LogicalDevice(name='/device:GPU:1', device_type='GPU')]

本文参与腾讯云自媒体同步曝光计划，分享自作者个人站点/博客。

原始发表：2021/02/01 ，如有侵权请联系 cloudcommunity@tencent.com 删除

数据结构

本文分享自作者个人站点/博客前往查看

如有侵权，请联系 cloudcommunity@tencent.com 删除。

本文参与腾讯云自媒体同步曝光计划，欢迎热爱写作的你一起参与！

数据结构

登录后参与评论

0 条评论

热度

TensorFlow 2.0 - TFRecord存储数据集、@tf.function图执行模式、tf.TensorArray、tf.config分配GPU

TensorFlow 2.0 - TFRecord存储数据集、@tf.function图执行模式、tf.TensorArray、tf.config分配GPU

文章目录

1. TFRecord 格式存储

2. tf.function 高性能

3. tf.TensorArray 支持计算图特性

4. tf.config 分配GPU

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐