为什么tf.contrib.layers.instance_norm层包含StopGradient操作？_为什么置换层在就地操作时会失败？_为什么在宏##操作的定义中有两个间接层 - 腾讯云开发者社区

本文代码的github连接：https://github.com/princewen/tensorflow_practice/tree/master/chat_bot_seq2seq_attention 1、attention model原理介绍 1.1 attention model 为什么要有attention机制原本的Seq2seq模型只有一个encoder和一个decoder，通常的做法是将一个输入的句子编码成一个固定大小的state，然后作为decoder的初始状态（当然也可以作为每一时刻的输入

您找到你想要的搜索结果了吗？

是的

没有找到

风格迁移背后原理及tensorflow实现

深度残差网络(ResNet)论文学习(附代码实现)

本文结合50层深度残差网络的实现学习何博士的大作-Deep Residual Learning for Image Recognition。理论上，深层网络结构包含了浅层网络结构所有可能的解空间，但是实际网络训练中，随着网络深度的增加，网络的准确度出现饱和，甚至下降的现象，这个现象可以在下图直观看出来：56层的网络比20层网络效果还要差。但是这种退化并不是因为过拟合导致的，因为56层的神经网络的训练误差同样高。

Tensorflow Batch normalization函数小结

[1]stackoverflow上tensorflow实现BN的不同函数的解释: https://stackoverflow.com/questions/48001759/what-is-right-batch-normalization-function-in-tensorflow/48006315#48006315

tensorflow编程: Layers (contrib)

min(max(features, 0), 6)。即对 tf.nn.relu 的优化，防止 relu过后某些极端值依然大于6

ResNet && DenseNet(实践篇)

该文介绍了如何使用ResNet和DenseNet两种网络结构进行图像分类。首先介绍了ResNet网络的基本结构，然后详细讲解了如何使用ResNet搭建网络。接着介绍了DenseNet网络的基本结构，然后详细讲解了如何使用DenseNet搭建网络。最后通过实验验证了这两种网络在图像分类任务上的性能。

手机端运行卷积神经网络实现文档检测功能(二) -- 从 VGG 到 MobileNetV2 知识梳理

前言这是上一篇博客（(http://fengjian0106.github.io/2017/05/08/Document-Scanning-With-TensorFlow-And-OpenCV/)）的后续和补充，这次对边缘检测算法的升级优化，起源于一个意外事件，前一个版本是使用 TensorFlow 1.0 部署的，并且是用 TF-Slim API 编写的代码，最近想使用 TensorFlow 1.7 重新部署一遍，本来以为是一件比较容易的事情，结果实操的时候才发现全是坑，首先遇到的就是废弃 A

大过年的，一起来用Seq2Seq来作对联吧！

Seq2Seq全称Sequence to Sequence，在机器翻译、文章摘要等领域有着广泛的应用。其本身很简单，是一个如下图所示的Encoder-Decoder框架。本文不纠结于Seq2Seq的

《Scikit-Learn与TensorFlow机器学习实用指南》第14章循环神经网络

击球手击出垒球，你会开始预测球的轨迹并立即开始奔跑。你追踪着它，不断调整你的移动步伐，最终在观众的掌声中抓到它。无论是在听完朋友的话语还是早餐时预测咖啡的味道，你时刻在做的事就是在预测未来。在本章中，我们将讨论循环神经网络 -- 一类预测未来的网络（当然，是到目前为止）。它们可以分析时间序列数据，诸如股票价格，并告诉你什么时候买入和卖出。在自动驾驶系统中，他们可以预测行车轨迹，避免发生交通意外。更一般地说，它们可在任意长度的序列上工作，而不是截止目前我们讨论的只能在固定长度的输入上工作的网络。举个例子，它们可以把语句，文件，以及语音范本作为输入，使得它们在诸如自动翻译，语音到文本或者情感分析（例如，读取电影评论并提取评论者关于该电影的感觉）的自然语言处理系统中极为有用。

使用ResNet101作为预训练模型训练Faster-RCNN-TensorFlow-Python3-master[通俗易懂]

使用VGG16作为预训练模型训练Faster-RCNN-TensorFlow-Python3-master的详细步骤→Windows10+Faster-RCNN-TensorFlow-Python3-master+VOC2007数据集。

手机端运行卷积神经网络实现文档检测功能(二) -- 从 VGG 到 MobileNetV2 知识梳理（续）

从 MobileNet V1 到 MobileNet V2 ResNet、Inception、Xception 追求的目标，就是在达到更高的准确率的前提下，尽量在模型大小、模型运算速度、模型训练速度这几个指标之间找一个平衡点，如果在准确性上允许一定的损失，但是追求更小的模型和更快的速度，这就直接催生了 MobileNet 或类似的以手机端或嵌入式端为运行环境的网络结构的出现。 MobileNet V1 (https://arxiv.org/pdf/1704.04861.pdf) 和 MobileNet V

用 Python 可以实现侧脸转正脸？我也要试一下！

作者 | 李秋键、出品丨AI科技大本营近几年来GAN图像生成应用越来越广泛，其中主要得益于GAN 在博弈下不断提高建模能力，最终实现以假乱真的图像生成。GAN 由两个神经网络组成，一个生成器和一个判别器组成，其中生成器试图产生欺骗判别器的真实样本，而判别器试图区分真实样本和生成样本。这种对抗博弈下使得生成器和判别器不断提高性能，在达到纳什平衡后生成器可以实现以假乱真的输出。其中GAN 在图像生成应用最为突出，当然在计算机视觉中还有许多其他应用，如图像绘画，图像标注，物体检测和语义分割。在自然语言处理中应

tf API 研读1：tf.nn，tf.layers， tf.contrib概述

本文介绍了tf API中tf.nn、tf.layers和tf.contrib三个模块的概述，并指出了在使用时需要注意的事项。

TensorFlow实现批量归一化操作的示例

在对神经网络的优化方法中，有一种使用十分广泛的方法——批量归一化，使得神经网络的识别准确度得到了极大的提升。

深度学习三人行(第7期)----深度学习之避免过拟合(正则化)

今天我们一起学习下深度学习中如何避免过拟合，我们多多交流，共同进步。本期主要内容如下：

TF图层指南：构建卷积神经网络

本文介绍了如何利用TensorFlow搭建一个简单的CNN模型来识别MNIST数据集中的手写数字。首先，介绍了CNN模型的基本原理和TensorFlow中的Keras API。然后，使用MNIST数据集训练了一个具有卷积层和全连接层的CNN模型。最后，通过在测试集上评估模型的性能，得到了97.3%的准确率。

精选目标检测3——yolo1、yolo2、yolo3和SSD的网络结构汇总对比

……最近在学习yolo1、yolo2和yolo3，事实上它们和SSD网络有一定的相似性，我准备汇总一下，看看有什么差别。

tensorflow使用L2 regularization正则化修正overfitting过拟合方式

过拟合的原理：在loss下降，进行拟合的过程中（斜线），不同的batch数据样本造成红色曲线的波动大，图中低点也就是过拟合，得到的红线点低于真实的黑线，也就是泛化更差。

[译]标准化Keras：TensorFlow 2.0中的高级API指南

Keras是一个非常受欢迎的构建和训练深度学习模型的高级API。它用于快速原型设计、最前沿的研究以及产品中。虽然现在的TensorFlow已经支持Keras，在2.0中，我们将Keras更紧密地集成到TensorFlow平台。

【抬抬小手学Python】yolov3代码和模型结构图详细注解【图文】

我对他的框图加了注释，便于理解，红色圈为yolo_block,深红色注解为前一模块的输出，请对照代码

快速图像风格转换代码解析

风格转换训练包含了所有转换步骤,有图像风格特征提取,图像内容损失提取,图像风格损失提取,图像内容和风格损失融合等过程,下面针对训练解析各个过程.

【tensorflow速成】Tensorflow图像分类从模型自定义到测试

TensorFlow 是 Google brain 推出的开源机器学习库，与 Caffe 一样，主要用作深度学习相关的任务。

【年度系列】使用LSTM预测股票市场基于Tensorflow

在本文开始前，作者并没有提倡LSTM是一种高度可靠的模型，它可以很好地利用股票数据中的内在模式，或者可以在没有任何人参与的情况下使用。写这篇文章，纯粹是出于对机器学习的热爱。在我看来，该模型已经观察到了数据中的某些模式，因此它可以在大多数时候正确预测股票的走势。但是，这个模型是否可以用于实际，有待用更多回测和实践去验证。

【NLP实战】如何基于Tensorflow搭建一个聊天机器人

实战是学习一门技术最好的方式，也是深入了解一门技术唯一的方式。因此，NLP专栏计划推出一个实战专栏，让有兴趣的同学在看文章之余也可以自动动手试一试。

使用tensorflow 的slim模块fine-tune resnet/densenet/inception网络，解决batchnorm问题

低光照图像增强算法汇总

在现实场景中，由于光线、视角等问题会导致我们拍摄出来的照片比较阴暗，具体的图片如下图中的1、3、5列所示，然后这些阴暗的图片不仅会影响我们的观察，而且会极大的影响计算机视觉处理算法的效果，2、4、6列表示的是使用了低光照图像增强算法之后的效果。本文主要针对低光照的图片展开论述，对经典的一些低光照图像增强算法进行了总结和初略的分析。

TensorFlow keras卷积神经网络添加L2正则化方式

为了避免过拟合问题，一个非常常用的方法是正则化（regularization），正则化的思想就是在损失函数中加入刻画模型复杂程度的指标。

CNN模型-ResNet、MobileNet、DenseNet、ShuffleNet、EfficientNet

下图为我们了展示了2018前常用CNN模型大小与Accuracy的比较，网络上不乏介绍CNN演进的文章[LeNet/AlexNet/Vgg/ Inception/ResNet]，写的也都很好，今天我们为各位读者介绍几个最新的CNN模型，如何搭建以及他们的优势在哪里。

代码+实战：TensorFlow Estimator of Deep CTR —— DeepFM/NFM/AFM/FNN/PNN

深度学习在 ctr 预估领域的应用越来越多，新的模型不断冒出。从 ctr 预估问题看看 f(x) 设计—DNN 篇（https://zhuanlan.zhihu.com/p/28202287）整理了各模型之间的联系之后，一直在琢磨这些东西如何在工业界落地。经过几个月的调研，发现目前存在的一些问题：开源的实现基本都是学术界的人在搞，距离工业应用还有较大的鸿沟模型实现大量调用底层 API，各版本实现千差万别，代码臃肿难懂，迁移成本较高单机，放到工业场景下跑不动针对存在的问题做了一些探索，摸索出一套

使用 TensorFlow 做机器学习第一篇

本文介绍了TensorFlow在机器学习方面的应用，包括CNN、RNN、LSTM、GRU、DNN、CNN、RCNN、YOLO、Inception、ResNet、EfficientNet、GAN、GAN-2、AutoAugment、DataAugment、训练加速、多机多卡训练、模型量化、模型剪枝、模型蒸馏、特征提取、特征选择、Feature Interaction、Embedding、Word2Vec、TextRank、CNN、RNN、LSTM、GRU、Transformer、注意力机制、Seq2Seq、BERT、GPT、Transformer、BERT、CRF、FFM、DeepFM、Wide & Deep、DeepFM、LSTM、GBT、AutoEncoder、GAN、CNN、CNN-LSTM、Attention、Attention-based LSTM、CNN-LSTM、Memory Bank、BERT、BERT-CRF、CNN、CNN-LSTM、RNN、LSTM、GRU、Transformer、BERT、GPT、Deep Learning、机器学习、深度学习、计算机视觉、自然语言处理等技术。

基于slim的残差网络

slim中给出了resnet、vgg卷积网络的快速实现方法，定义的位置为:D:\anaconda\envs\tensorflow\Lib\site-packages\tensorflow\contrib\slim\python\slim\nets，构建残差网络主要使用的模块为resnet_utils.py、resnet_v1.py、resnet_v2.py。下面

tf.contrib.framework.arg_scope

在定义卷积层时，可能总是使用相同的填充类型和相同的初始化器，甚至可能使用相同的卷积大小。对于池化，可能也总是使用相同的2x2池大小，等等。arg_scope是一种避免反复向相同的层类型提供相同参数的方法。

tensorflow: 打印内存中的变量

法一：循环打印模板 for (x, y) in zip(tf.global_variables(), sess.run(tf.global_variables())): print '\n', x, y 实例 # coding=utf-8 import tensorflow as tf def func(in_put, layer_name, is_training=True): with tf.variable_scope(layer_name, reuse=tf.AUT

【深度学习系列】用PaddlePaddle和Tensorflow实现经典CNN网络Vgg

上周我们讲了经典CNN网络AlexNet对图像分类的效果，2014年，在AlexNet出来的两年后，牛津大学提出了Vgg网络，并在ILSVRC 2014中的classification项目的比赛中取得了第2名的成绩（第一名是GoogLeNet，也是同年提出的）。在论文《Very Deep Convolutional Networks for Large-Scale Image Recognition》中，作者提出通过缩小卷积核大小来构建更深的网络。 Vgg网络结构 VGGnet是Oxford的Visu

010

权力的游戏使用Tensorflow中的LSTM和Recurrent单元生成剧集脚本

权力的游戏第8季确实令人失望，似乎导演无法学习前几季的模式，但担心的是，LSTM从不会错过任何模式，并会帮助提供一个更好的脚本，一个AI生成的脚本。

【干货】Batch Normalization: 如何更快地训练深度神经网络

【导读】本文是谷歌机器学习工程师 Chris Rawles 撰写的一篇技术博文，探讨了如何在 TensorFlow 和 tf.keras 上利用 Batch Normalization 加快深度神经网络的训练。我们知道，深度神经网络一般非常复杂，即使是在当前高性能GPU的加持下，要想快速训练深度神经网络依然不容易。Batch Normalization 也许是一个不错的加速方法，本文介绍了它如何帮助解决梯度消失和梯度爆炸问题，并讨论了ReLu激活以及其他激活函数对于抵消梯度消失问题的作用。最后，本文使用Te

tensorflow: bn层

可视化 batch normalization 过程中的 tensor演化（以输入一张[1, 4 , 4, 1]的图片为例）

【TensorFlow1.2.0版发布】14大新功能，增加Intel MKL集成

【新智元导读】TensorFlow 今天发布最新版 1.2.0，公布了14大最新功能。新智元带来最新介绍，包括 API 的重要变化、contrib API的变化和Bug 修复及其他改变。附代码链接。主要的功能和改进 1. Windows上支持Python3.6。 2. 时空域去卷积（spatio temporal deconvolution.）增加了tf.layers.conv3d_transpose层。 3. 增加了tf.Session.make_callable( )，为多次运行一个相同步骤的运行提供

译文 | 简明 TensorFlow 教程：混合模型

确保你已经阅读了第一部分（http://camron.xyz/index.php/2016/08/22/in_a_nutshell_part_one/）在本文中，我们将演示一个宽 N 深度网络，它使

Colab提供了免费TPU，机器之心帮你试了试

我们在网上只发现比较少的信息与资源，最开始介绍 Colab 免费 TPU 的内容还是谷歌开发者 Sam Wittevee 最近的演讲 PPT。因此本文的测试和探索都是基于官方文档和实例所实现的，还有很多 TPU 特性没有考虑到，感兴趣的读者可查阅文末的参考资料，了解更多 Colab 免费 TPU 的特性。

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐