前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >构建DeblurGAN模型,将模糊相片变清晰

构建DeblurGAN模型,将模糊相片变清晰

作者头像
代码医生工作室
发布2019-09-04 11:11:16
4.5K1
发布2019-09-04 11:11:16
举报
文章被收录于专栏:相约机器人相约机器人

本内容取之电子工业出版社出版、李金洪编著的《深度学习之TensorFlow工程化项目实战》一书的实例36。

在拍照时,常常因为手抖或补光不足,导致拍出的照片很模糊。可以用DeblurGAN模型将模糊的照片变清晰,留住精彩瞬间。

DeblurGAN模型是一个对抗神经网络模型,由生成器模型和判别器模型组成。

  • 生成器模型,根据输入的模糊图片模拟生成清晰的图片。
  • 判别器模型,用在训练过程中,帮助生成器模型达到更好的效果。具体可以参考论文:

https://arxiv.org/pdf/1711.07064.pdf

实例描述

有一套街景拍摄的照片数据集,其中包含清晰照片和模糊照片。要求:

(1)用该数据集训练DeblurGAN模型,使模型具有将模糊图片转成清晰图片的能力。

(2)DeblurGAN模型能将数据集之外的模糊照片变清晰。

本实例的代码用tf.keras接口编写。具体过程如下。

一、获取样本

本实例使用GOPRO_Large数据集作为训练样本。GOPRO_Large数据集里包含高帧相机拍摄的街景图片(其中的照片有的清晰,有的模糊)和人工合成的模糊照片。样本中每张照片的尺寸为720 pixel×1280 pixel。

1. 下载GOPRO_Large数据集

可以通过以下链接获取原始的GOPRO_Large数据集:

https://drive.google.com/file/d/1H0PIXvJH4c40pk7ou6nAwoxuR4Qh_Sa2/view

2. 部署GOPRO_Large数据集

在GOPRO_Large数据集中有若干套实景拍摄的照片。每套照片中包含有3个文件夹:

  • 在blur文件夹中,放置了模糊的照片。
  • 在sharp文件夹中,放置了清晰的照片。
  • 在blur_gamma文件夹中,放置了人工合成的模糊照片

从GOPRO_Large数据集的blur与sharp文件夹里,各取出200张模糊与清晰的图片,放到本地代码的同级目录image文件夹下用作训练。其中,模糊的图片放在image/train/A文件夹下,清晰的图片在image/train/B文件夹下。

二、准备SwitchableNorm算法模块

SwitchableNorm算法与其他的归一化算法一样,可以被当作函数来使用。由于在当前的API库里没有该代码的实现,所以需要自己编写一套这样的算法。

SwitchableNorm算法的实现不是本节重点,其原理已经在见《深度学习之TensorFlow工程化项目实战》一书的10.1.6小节介绍。这里直接使用《深度学习之TensorFlow工程化项目实战》一书配套资源代码“switchnorm.py”即可。

直接将该代码放到本地代码文件夹下,然后将其引入。

提示:

在SwitchableNorm算法的实现过程中,定义了额外的变量参数。所以在运行时,需要通过会话中的tf.global_variables_initializer函数对其进行初始化,否则会报“SwitchableNorm类中的某些张量没有初始化”之类的错误。正确的用法见《深度学习之TensorFlow工程化项目实战》一书10.2.9小节的具体实现。

三、代码实现:构建DeblurGAN中的生成器模型

DeblurGAN中的生成器模型是使用残差结构来实现的。其模型的层次结构顺序如下:

(1)通过1层卷积核为7×7、步长为1的卷积变换。保持输入数据的尺寸不变。

(2)将第(1)步的结果进行两次卷积核为3×3、步长为2的卷积操作,实现两次下采样效果。

(3)经过5层残差块。其中,残差块是中间带有Dropout层的两次卷积操作。

(4)仿照(1)和(2)步的逆操作,进行两次上采样,再来一个卷积操作。

(5)将(1)的输入与(4)的输出加在一起,完成一次残差操作。

该结构使用“先下采样,后上采样”的卷积处理方式,这种方式可以表现出样本分布中更好的潜在特征。具体代码如下:

代码1 deblurmodel


代码语言:javascript
复制
    from tensorflow.keras import layers as KL
    from tensorflow.keras import models as KM
    from switchnorm import SwitchNormalization   #载入SwitchableNorm算法
    ngf = 64                    #定义生成器模型原始卷积核个数
    ndf = 64                        #定义判别器模型原始卷积核个数
    input_nc = 3                    #定义输入通道
    output_nc = 3               #定义输出通道
    n_blocks_gen = 9                #定义残差层数量

    #定义残差块函数
    def res_block(input, filters, kernel_size=(3, 3), strides=(1, 1), use_dropout=False):
        x = KL.Conv2D(filters=filters, #使用步长为1的卷积操作,保持输入数据的尺寸不变
                   kernel_size=kernel_size,
                   strides=strides, padding='same')(input)    

        x = KL.SwitchNormalization()(x)
        x = KL.Activation('relu')(x)

        if use_dropout:                     #使用dropout方法
            x = KL.Dropout(0.5)(x)

        x = KL.Conv2D(filters=filters,  #再做一次步长为1的卷积操作
                   kernel_size=kernel_size,
                   strides=strides,padding='same')(x)    

        x = KL.SwitchNormalization()(x)

        #将卷积后的结果与原始输入相加
        merged = KL.Add()([input, x])   #残差层
        return merged

    def generator_model(image_shape ,istrain = True):   #构建生成器模型
        #构建输入层(与动态图不兼容)
        inputs = KL.Input(shape=(image_shape[0],image_shape[1], input_nc))
        #使用步长为1的卷积操作,保持输入数据的尺寸不变
        x = KL.Conv2D(filters=ngf, kernel_size=(7, 7), padding='same')(inputs)
        x = KL.SwitchNormalization()(x)
        x = KL.Activation('relu')(x)

        n_downsampling = 2
        for i in range(n_downsampling):     #两次下采样
            mult = 2**i
            x = KL.Conv2D(filters=ngf*mult*2, kernel_size=(3, 3), strides=2, padding='same')(x)
            x = KL.SwitchNormalization()(x)
            x = KL.Activation('relu')(x)

        mult = 2**n_downsampling
        for i in range(n_blocks_gen):       #定义多个残差层
            x = res_block(x, ngf*mult, use_dropout= istrain)

        for i in range(n_downsampling):     #两次上采样
            mult = 2**(n_downsampling - i)
            #x = KL.Conv2DTranspose(filters=int(ngf * mult / 2), kernel_size=(3, 3), strides=2, padding='same')(x)
            x = KL.UpSampling2D()(x)
            x = KL.Conv2D(filters=int(ngf * mult / 2), kernel_size=(3, 3), padding='same')(x)
            x = KL.SwitchNormalization()(x)
            x = KL.Activation('relu')(x)

        #步长为1的卷积操作
        x = KL.Conv2D(filters=output_nc, kernel_size=(7, 7), padding='same')(x)
        x = KL.Activation('tanh')(x)

        outputs = KL.Add()([x, inputs])     #与最外层的输入完成一次大残差
        #防止特征值域过大,进行除2操作(取平均数残差)
        outputs = KL.Lambda(lambda z: z/2)(outputs)
        #构建模型
        model = KM.Model(inputs=inputs, outputs=outputs, name='Generator')
        return model

代码第11行,通过定义函数res_block搭建残差块的结构。

代码第32行,通过定义函数generator_model构建生成器模型。由于生成器模型输入的是模糊图片,输出的是清晰图片,所以函数generator_model的输入与输出具有相同的尺寸。

代码第65行,在使用残差操作时,将输入的数据与生成的数据一起取平均值。这样做是为了防止生成器模型的返回值的值域过大。在计算损失时,一旦生成的数据与真实图片的像素数据值域不同,则会影响收敛效果。

四、代码实现:构建DeblurGAN中的判别器模型

判别器模型的结构相对比较简单。

(1)通过4次下采样卷积(见代码第74~82行),将输入数据的尺寸变小。

(2)经过两次尺寸不变的1×1卷积(见代码第85~92行),将通道压缩。

(3)经过两层全连接网络(见代码第95~97行),生成判别结果(0还是1)。

具体代码如下。

代码1 deblurmodel(续)

代码语言:javascript
复制

    def discriminator_model(image_shape):#构建判别器模型

        n_layers, use_sigmoid = 3, False
        inputs = KL.Input(shape=(image_shape[0],image_shape[1],output_nc))
        #下采样卷积
        x = KL.Conv2D(filters=ndf, kernel_size=(4, 4), strides=2, padding='same')(inputs)
        x = KL.LeakyReLU(0.2)(x)

        nf_mult, nf_mult_prev = 1, 1
        for n in range(n_layers):#继续3次下采样卷积
            nf_mult_prev, nf_mult = nf_mult, min(2**n, 8)
            x = KL.Conv2D(filters=ndf*nf_mult, kernel_size=(4, 4), strides=2, padding='same')(x)
            x = KL.BatchNormalization()(x)
            x = KL.LeakyReLU(0.2)(x)

        #步长为1的卷积操作,尺寸不变
        nf_mult_prev, nf_mult = nf_mult, min(2**n_layers, 8)
        x = KL.Conv2D(filters=ndf*nf_mult, kernel_size=(4, 4), strides=1, padding='same')(x)
        x = KL.BatchNormalization()(x)
        x = KL.LeakyReLU(0.2)(x)

        #步长为1的卷积操作,尺寸不变。将通道压缩为1
        x = KL.Conv2D(filters=1, kernel_size=(4, 4), strides=1, padding='same')(x)
        if use_sigmoid:
            x = KL.Activation('sigmoid')(x)

        x = KL.Flatten()(x) #两层全连接,输出判别结果
        x = KL.Dense(1024, activation='tanh')(x)
        x = KL.Dense(1, activation='sigmoid')(x)

        model = KM.Model(inputs=inputs, outputs=x, name='Discriminator')
        return model

代码81行,调用了批量归一化函数,使用了参数trainable的默认值True。

代码99行,用tf.keras接口的Model类构造判别器模型model。在使用model时,可以设置trainable参数来控制模型的内部结构。

五、代码实现:搭建DeblurGAN的完整结构

将判别器模型与生成器模型结合起来,构成DeblurGAN模型的完整结构。具体代码如下:

代码1 deblurmodel(续)

代码语言:javascript
复制

    def g_containing_d_multiple_outputs(generator, discriminator,image_shape):
        inputs = KL.Input(shape=(image_shape[0],image_shape[1],input_nc)  )
        generated_image = generator(inputs)         #调用生成器模型
        outputs = discriminator(generated_image)    #调用判别器模型
        #构建模型
        model = KM.Model(inputs=inputs, outputs=[generated_image, outputs])
        return model

函数g_containing_d_multiple_outputs用于训练生成器模型。在使用时,需要将判别器模型的权重固定,让生成器模型不断地调整权重。具体可以参考《深度学习之TensorFlow工程化项目实战》一书10.2.10小节代码。

六、代码实现:引入库文件,定义模型参数

编写代码实现如下步骤:

(1)载入模型文件——代码文件“10-1 deblurmodel”。

(2)定义训练参数。

(3)定义函数save_all_weights,将模型的权重保存起来。

具体代码如下:

代码2 训练deblur

代码语言:javascript
复制
    import os
    import datetime
    import numpy as np
    import tqdm
    import tensorflow as tf
    import glob
    from tensorflow.python.keras.applications.vgg16 import VGG16
    from functools import partial
    from tensorflow.keras import models as KM
    from tensorflow.keras import backend as K       #载入Keras的后端实现
    deblurmodel = __import__("10-1  deblurmodel")   #载入模型文件
    generator_model = deblurmodel.generator_model
    discriminator_model = deblurmodel.discriminator_model
    g_containing_d_multiple_outputs = deblurmodel.g_containing_d_multiple_outputs

    RESHAPE = (360,640)             #定义处理图片的大小
    epoch_num = 500                 #定义迭代训练次数

    batch_size =4                   #定义批次大小
    critic_updates = 5          #定义每训练一次生成器模型需要训练判别器模型的次数
    #保存模型
    BASE_DIR = 'weights/'
    def save_all_weights(d, g, epoch_number, current_loss):
        now = datetime.datetime.now()
        save_dir = os.path.join(BASE_DIR, '{}{}'.format(now.month, now.day))
        os.makedirs(save_dir, exist_ok=True)        #创建目录
        g.save_weights(os.path.join(save_dir, 'generator_{}_{}.h5'.format(epoch_number, current_loss)), True)
        d.save_weights(os.path.join(save_dir, 'discriminator_{}.h5'.format(epoch_number)), True)

代码第16行将输入图片的尺寸设为(360,640),使其与样本中图片的高、宽比例相对应(样本中图片的尺寸比例为720∶1280)。

提示:

在TensorFlow中,默认的图片尺寸顺序是“高”在前,“宽”在后。

七、代码实现:定义数据集,构建正反向模型

本小节代码的步骤如下:

(1)用tf.data.Dataset接口完成样本图片的载入(见代码第29~54行)。

(2)将生成器模型和判别器模型搭建起来。

(3)构建Adam优化器,用于生成器模型和判别器模型的训练过程。

(4)以WGAN的方式定义损失函数wasserstein_loss,用于计算生成器模型和判别器模型的损失值。其中,生成器模型的损失值是由WGAN损失与特征空间损失(见《深度学习之TensorFlow工程化项目实战》一书10.2.8小节)两部分组成。

(5)将损失函数wasserstein_loss与优化器一起编译到可训练的判别器模型中(见代码第70行)。

具体代码如下:

代码2 训练deblur(续)

代码语言:javascript
复制

    path = r'./image/train'
    A_paths, =os.path.join(path, 'A', "*.png")          #定义样本路径
    B_paths = os.path.join(path, 'B', "*.png")
    #获取该路径下的png文件
    A_fnames, B_fnames = glob.glob(A_paths),glob.glob(B_paths)
    #生成Dataset对象
    dataset = tf.data.Dataset.from_tensor_slices((A_fnames, B_fnames))

    def _processimg(imgname):                           #定义函数调整图片大小
        image_string = tf.read_file(imgname)                #读取整个文件 
        image_decoded = tf.image.decode_image(image_string)
        image_decoded.set_shape([None, None, None])#形状变化,否则下面会转化失败
        #变化尺寸
        img =tf.image.resize( image_decoded,RESHAPE)
        image_decoded = (img - 127.5) / 127.5
        return image_decoded

    def _parseone(A_fname, B_fname):                        #解析一个图片文件
        #读取并预处理图片 
        image_A,image_B = _processimg(A_fname),_processimg(B_fname) 
        return image_A,image_B

    dataset = dataset.shuffle(buffer_size=len(B_fnames))
    dataset = dataset.map(_parseone)               #转化为有图片内容的数据集
    dataset = dataset.batch(batch_size)             #将数据集按照batch_size划分
    dataset = dataset.prefetch(1)

    #定义模型
    g = generator_model(RESHAPE)                    #生成器模型
    d = discriminator_model(RESHAPE)                #判别器模型
    d_on_g = g_containing_d_multiple_outputs(g, d,RESHAPE)  #联合模型

    #定义优化器
    d_opt = tf.keras.optimizers.Adam(lr=1E-4, beta_1=0.9, beta_2=0.999, epsilon=1e-08)
    d_on_g_opt = tf.keras.optimizers.Adam(lr=1E-4, beta_1=0.9, beta_2=0.999, epsilon=1e-08)

    #WGAN的损失
    def wasserstein_loss(y_true, y_pred):
        return tf.reduce_mean(y_true*y_pred)

    d.trainable = True
    d.compile(optimizer=d_opt, loss=wasserstein_loss)   #编译模型
    d.trainable = False

代码第70行,用判别器模型对象的compile方法对模型进行编译。之后,将该模型的权重设置成不可训练(见代码第71行)。这是因为,在训练生成器模型时,需要将判别器模型的权重固定。只有这样,在训练生成器模型过程中才不会影响到判别器模型。

八、代码实现:计算特征空间损失,并将其编译到生成器模型的训练模型中

生成器模型的损失值是由WGAN损失与特征空间损失两部分组成。WGAN损失已经由《深度学习之TensorFlow工程化项目实战》一书10.2.7小节的第66行代码实现。本小节将实现特征空间损失,并将其编译到可训练的生成器模型中去。

1. 计算特征空间损失的方法

计算特征空间损失的方法如下:

(1)用VGG模型对目标图片与输出图片做特征提取,得到两个特征数据。

(2)对这两个特征数据做平方差计算。

2. 特征空间损失的具体实现

在计算特征空间损失时,需要将VGG模型嵌入到当前网络中。这里使用已经下载好的预训练模型文件“vgg16_weights_tf_dim_ordering_tf_kernels_notop.h5”。读者可以自行下载,也可以在《深度学习之TensorFlow工程化项目实战》一书的配套资源中找到。

将预训练模型文件放在当前代码的同级目录下。并参照《深度学习之TensorFlow工程化项目实战》一书的6.7.9小节的内容,利用tf.keras接口将其加载。

3. 编译生成器模型的训练模型

将WGAN损失函数与特征空间损失函数放到数组loss中,调用生成器模型的compile方法将损失值数组loss编译进去,实现生成器模型的训练模型。

具体代码如下:

代码2 训练deblur(续)

代码语言:javascript
复制

    #计算特征空间损失
    def perceptual_loss(y_true, y_pred,image_shape):
        vgg = VGG16(include_top=False,
 weights="vgg16_weights_tf_dim_ordering_tf_kernels_notop.h5",
                    input_shape=(image_shape[0],image_shape[1],3) )

        loss_model = KM.Model(inputs=vgg.input, outputs=vgg.get_layer('block3_conv3').output)
        loss_model.trainable = False
        return tf.reduce_mean(tf.square(loss_model(y_true) - loss_model(y_pred)))

    myperceptual_loss = partial(perceptual_loss, image_shape=RESHAPE)
    myperceptual_loss._name_= 'myperceptual_loss'
    #构建损失
    loss = [myperceptual_loss, wasserstein_loss]
    loss_weights = [100, 1]                         #将损失调为统一数量级
    d_on_g.compile(optimizer=d_on_g_opt, loss=loss, loss_weights=loss_weights)
    d.trainable = True

    output_true_batch, output_false_batch = np.ones((batch_size, 1)), -np.ones((batch_size, 1))

    #生成数据集迭代器
    iterator = dataset.make_initializable_iterator()
    datatensor = iterator.get_next()

代码第85行,在计算生成器模型损失时,将损失值函数myperceptual_loss与损失值函数wasserstein_loss一起放到列表里。

代码第86行,定义了损失值的权重比例[100,1]。这表示最终的损失值是:函数myperceptual_loss的结果乘上100,将该积与函数wasserstein_loss的结果相加所得到和。

提示:

权重比例是根据每个函数返回的损失值得来的。

将myperceptual_loss的结果乘上100,是为了让最终的损失值与函数wasserstein_loss的结果在同一个数量级上。

损失值函数myperceptual_loss、wasserstein_loss分别与模型d_on_g对象的输出值generated_image、outputs相对应。模型d_on_g对象的输出节点部分是在10.2.5小节代码第106行定义的。

九、代码实现:按指定次数训练模型

按照指定次数迭代调用训练函数pre_train_epoch,然后在函数pre_train_epoch内遍历整个Dataset数据集,并进行训练。步骤如下:

(1)取一批次数据。

(2)训练5次判别器模型。

(3)将判别器模型权重固定,训练一次生成器模型。

(4)将判别器模型设为可训练,并循环第(1)步,直到整个数据集遍历结束。

具体代码如下:

代码2 训练deblur(续)

代码语言:javascript
复制

    #定义配置文件
    config = tf.ConfigProto()
    config.gpu_options.allow_growth = True
    config.gpu_options.per_process_gpu_memory_fraction = 0.5
    sess = tf.Session(config=config)                #建立会话(session)

    def pre_train_epoch(sess, iterator,datatensor): #迭代整个数据集进行训练
        d_losses = []
        d_on_g_losses = []
        sess.run( iterator.initializer )

        while True:
            try:                                        #获取一批次的数据
                (image_blur_batch,image_full_batch) = sess.run(datatensor)
            except tf.errors.OutOfRangeError:
                break                               #如果数据取完则退出循环

            generated_images = g.predict(x=image_blur_batch, batch_size=batch_size)                             #将模糊图片输入生成器模型

            for _ in range(critic_updates):         #训练5次判别器模型
                d_loss_real = d.train_on_batch(image_full_batch, output_true_batch)                                 #训练,并计算还原样本的loss值

                d_loss_fake = d.train_on_batch(generated_images, output_false_batch)                        #训练,并计算模拟样本的loss值
                d_loss = 0.5 * np.add(d_loss_fake, d_loss_real)#二者相加,再除以2
                d_losses.append(d_loss)

            d.trainable = False                     #固定判别器模型参数
            d_on_g_loss = d_on_g.train_on_batch(image_blur_batch, [image_full_batch, output_true_batch])            #训练并计算生成器模型loss值
            d_on_g_losses.append(d_on_g_loss)

            d.trainable = True                  #恢复判别器模型参数可训练的属性
            if len(d_on_g_losses)%10== 0:
                print(len(d_on_g_losses),np.mean(d_losses), np.mean(d_on_g_losses))
        return np.mean(d_losses), np.mean(d_on_g_losses)
    #初始化SwitchableNorm变量
    K.get_session().run(tf.global_variables_initializer())
    for epoch in tqdm.tqdm(range(epoch_num)):       #按照指定次数迭代训练
        #迭代训练一次数据集
        dloss,gloss = pre_train_epoch(sess, iterator,datatensor)
        with open('log.txt', 'a+') as f:
            f.write('{} - {} - {}\n'.format(epoch, dloss, gloss))
        save_all_weights(d, g, epoch, int(gloss))       #保存模型
    sess.close()    

代码第130行,进行全局变量的初始化。初始化之后,SwitchableNorm算法就可以正常使用了。

提示:

即便是tf.keras接口,其底层也是通过静态图上的会话(session)来运行代码的。

在代码第130行中演示了一个用tf.keras接口实现全局变量初始化的技巧:

(1)用tf.keras接口的后端类backend中的get_session函数,获取tf.keras接口当前正在使用的会话(session)。

(2)拿到session之后,运行tf.global_variables_initializer方法进行全局变量的初始化。

(3)代码运行后,输出如下结果:

代码语言:javascript
复制
1%|          | 6/50 [15:06<20:43:45, 151.06s/it]10 -0.4999978220462799 678.8936
20 -0.4999967348575592 680.67926
……
1%|▏         | 7/50 [17:29<20:32:16, 149.97s/it]10 -0.49999643564224244 737.67645
20 -0.49999758243560793 700.6202
30 -0.4999980672200521 672.0518
40 -0.49999826729297636 666.23425
50 -0.4999982775449753 665.67645
……

同时可以看到,在本地目录下生成了一个weights文件夹,里面放置的便是模型文件。

十、代码实现:用模型将模糊相片变清晰

在权重weights文件夹里找到以“generator”开头并且是最新生成(按照文件的生成时间排序)的文件。将其复制到本地路径下(作者本地的文件名称为“generator_499_0.h5”)。这个模型就是DeblurGAN中的生成器模型部分。

按照10.2.1小节的步骤,在测试集中随机复制几个图片放到本地test目录下。与train目录结构一样:A放置模糊的图片,B放置清晰的图片。

下面编写代码来比较模型还原的效果。具体如下:

代码3 使用deblur模型

代码语言:javascript
复制
    import numpy as np
    from PIL import Image
    import glob
    import os
    import tensorflow as tf                         #载入模块
    deblurmodel = __import__("10-1  deblurmodel")
    generator_model = deblurmodel.generator_model

    def deprocess_image(img):                       #定义图片的后处理函数
        img = img * 127.5 + 127.5
        return img.astype('uint8')

    batch_size = 4
    RESHAPE = (360,640)                                 #定义要处理图片的大小

    path = r'./image/test'
    A_paths, B_paths = os.path.join(path, 'A', "*.png"), os.path.join(path, 'B', "*.png")
    #获取该路径下的png文件
    A_fnames, B_fnames = glob.glob(A_paths),glob.glob(B_paths)
    #生成Dataset对象
    dataset = tf.data.Dataset.from_tensor_slices((A_fnames, B_fnames))

    def _processimg(imgname):                       #定义函数调整图片大小
        image_string = tf.read_file(imgname)            #读取整个文件 
        image_decoded = tf.image.decode_image(image_string)
        image_decoded.set_shape([None, None, None]) #形状变化,否则下面会转化失败
        #变化尺寸
        img =tf.image.resize( image_decoded,RESHAPE)#[RESHAPE[0],RESHAPE[1],3])
        image_decoded = (img - 127.5) / 127.5
        return image_decoded

    def _parseone(A_fname, B_fname):                #解析一个图片文件
        #读取并预处理图片 
        image_A,image_B = _processimg(A_fname),_processimg(B_fname) 
        return image_A,image_B

    dataset = dataset.map(_parseone)            #转化为有图片内容的数据集
    dataset = dataset.batch(batch_size)          #将数据集按照batch_size划分
    dataset = dataset.prefetch(1)

    #生成数据集迭代器
    iterator = dataset.make_initializable_iterator()
    datatensor = iterator.get_next()
    g = generator_model(RESHAPE,False)              #构建生成器模型
    g.load_weights("generator_499_0.h5")            #载入模型文件

    #定义配置文件
    config = tf.ConfigProto()
    config.gpu_options.allow_growth = True
    config.gpu_options.per_process_gpu_memory_fraction = 0.5
    sess = tf.Session(config=config)                #建立session
    sess.run( iterator.initializer )
    ii= 0
    while True:
        try:                                            #获取一批次的数据
            (x_test,y_test) = sess.run(datatensor)
        except tf.errors.OutOfRangeError:
            break                                   #如果数据取完则退出循环
        generated_images = g.predict(x=x_test, batch_size=batch_size)
        generated = np.array([deprocess_image(img) for img in generated_images])
        x_test = deprocess_image(x_test)
        y_test = deprocess_image(y_test)
        print(generated_images.shape[0])
        for i in range(generated_images.shape[0]):  #按照批次读取结果
            y = y_test[i, :, :, :]
            x = x_test[i, :, :, :]
            img = generated[i, :, :, :]
            output = np.concatenate((y, x, img), axis=1)
            im = Image.fromarray(output.astype(np.uint8))
            im = im.resize( (640*3, int( 640*720/1280)   ) )
            print('results{}{}.png'.format(ii,i))
            im.save('results{}{}.png'.format(ii,i)) #将结果保存起来
        ii+=1

代码第44行,在定义生成器模型时,需要将其第2个参数istrain设为False。这么做的目的是不使用Dropout层。

代码执行后,系统会自动在本地文件夹的image/test目录下加载图片,并其放到模型里进行清晰化处理。最终生成的图片如图1所示。

图1 DeblurGAN的处理结果

图1中有3个子图。左、中、右依次为原始、模糊、生成后的图片。比较图1中的原始图片(最左侧的图片)与生成后的图片(最右侧的图片)可以发现,最右侧模型生成的图片比中间的模糊图片更为清晰。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2019-09-02,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 相约机器人 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档