开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

如何在Tensorflow中使RNN单元的权重不可训练？

在Tensorflow中，可以通过设置RNN单元的权重为不可训练来实现。具体的方法是使用tf.stop_gradient函数来停止梯度的传播，从而使权重不可训练。

以下是实现的步骤：

导入Tensorflow库：

import tensorflow as tf

定义RNN单元：

rnn_cell = tf.nn.rnn_cell.BasicRNNCell(num_units=hidden_size)

定义输入数据和初始状态：

inputs = tf.placeholder(shape=(batch_size, sequence_length, input_size), dtype=tf.float32)
initial_state = rnn_cell.zero_state(batch_size, dtype=tf.float32)

使用tf.stop_gradient函数停止梯度传播：

outputs, final_state = tf.nn.dynamic_rnn(rnn_cell, inputs, initial_state=initial_state)
final_state = tf.stop_gradient(final_state)

通过在最后一步使用tf.stop_gradient函数，我们可以将RNN单元的权重设置为不可训练，从而在训练过程中不会更新这些权重。

这样，我们就成功地使RNN单元的权重不可训练了。

请注意，这只是一种方法，具体使用哪种方法取决于您的需求和实际情况。

相关搜索:如何在iOS中使用Tensorflow训练的机器学习模型如何在Python中使用tensorflow训练图像分类器模型，并在Java应用程序中使用经过训练的模型？如何在TensorFlow 2.0中使用Keras API仅恢复模型的零件层的权重？如何在Tensorflow 2.0中冻结隐藏层中的权重来重新训练DNN 如何在Tensorflow rnn教程代码中获得来自训练数据的不同批次？如何在tensorflow中使用带有tf.distribute.MirroredStrategy的keras.utils.Sequence数据生成器进行多gpu模型训练？如何在tensorflow中使用预先训练好的ResNet50？如何在TensorFlow中停止训练某些特定的权重如何在Tensorflow中输入不同输入的不同RNN单元之间共享权重？如何在tensorflow对象检测api中使用Image net上的预训练模型

相关搜索:

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

Seq2Seq模型

前言：此文翻译自TensorFlow tutorial： Sequence-to-Sequence Models 本文的尽量在做到意思正确的情况下，做到不尬翻。但第一次尝试翻译，另加上英语水平有

学界 | 新型循环神经网络IndRNN：可构建更长更深的RNN（附GitHub实现）

选自arXiv 作者：Shuai Li等机器之心编译参与：张倩、黄小天近日，澳大利亚伍伦贡大学联合电子科技大学提出一种新型的循环神经网络 IndRNN，不仅可以解决传统 RNN 所存在的梯度消失和梯度爆炸问题，还学习长期依赖关系；此外，借助 relu 等非饱和激活函数，训练之后 IndRNN 会变得非常鲁棒，并且通过堆叠多层 IndRNN 还可以构建比现有 RNN 更深的网络。实验结果表明，与传统的 RNN 和 LSTM 相比，使用 IndRNN 可以在各种任务中取得更好的结果。同时本文还给出了 In

05

TensorFlow系列专题（七）：一文综述RNN循环神经网络

前馈神经网络不考虑数据之间的关联性，网络的输出只和当前时刻网络的输入相关。然而在解决很多实际问题的时候我们发现，现实问题中存在着很多序列型的数据，例如文本、语音以及视频等。这些序列型的数据往往都是具有时序上的关联性的，既某一时刻网络的输出除了与当前时刻的输入相关之外，还与之前某一时刻或某几个时刻的输出相关。而前馈神经网络并不能处理好这种关联性，因为它没有记忆能力，所以前面时刻的输出不能传递到后面的时刻。

03

RNN循环神经网络、LSTM长短期记忆网络实现时间序列长期利率预测

2017 年年中，R 推出了 Keras 包 _，_这是一个在 Tensorflow 之上运行的综合库，具有 CPU 和 GPU 功能。本文将演示如何在 R 中使用 LSTM 实现时间序列预测。

03

《Scikit-Learn与TensorFlow机器学习实用指南》第14章循环神经网络

击球手击出垒球，你会开始预测球的轨迹并立即开始奔跑。你追踪着它，不断调整你的移动步伐，最终在观众的掌声中抓到它。无论是在听完朋友的话语还是早餐时预测咖啡的味道，你时刻在做的事就是在预测未来。在本章中，我们将讨论循环神经网络 -- 一类预测未来的网络（当然，是到目前为止）。它们可以分析时间序列数据，诸如股票价格，并告诉你什么时候买入和卖出。在自动驾驶系统中，他们可以预测行车轨迹，避免发生交通意外。更一般地说，它们可在任意长度的序列上工作，而不是截止目前我们讨论的只能在固定长度的输入上工作的网络。举个例子，它们可以把语句，文件，以及语音范本作为输入，使得它们在诸如自动翻译，语音到文本或者情感分析（例如，读取电影评论并提取评论者关于该电影的感觉）的自然语言处理系统中极为有用。

02

RNN循环神经网络、LSTM长短期记忆网络实现时间序列长期利率预测|附代码数据

2017 年年中，R 推出了 Keras 包 _，_这是一个在 Tensorflow 之上运行的综合库，具有 CPU 和 GPU 功能

02

RNN循环神经网络、LSTM长短期记忆网络实现时间序列长期利率预测|附代码数据

2017 年年中，R 推出了 Keras 包 _，_这是一个在 Tensorflow 之上运行的综合库，具有 CPU 和 GPU 功能

00

RNN循环神经网络、LSTM长短期记忆网络实现时间序列长期利率预测

本文约1700字，建议阅读5分钟本文将演示如何在 R 中使用 LSTM 实现时间序列预测。全文链接：http://tecdat.cn/?p=25133 2017 年年中，R 推出了 Keras 包

01

循环神经网络

循环神经网络的神经网络体系结构，它针对的不是自然语言数据，而是处理连续的时间数据，如股票市场价格。在本文结束之时，你将能够对时间序列数据中的模式进行建模，以对未来的值进行预测。 1.上下文信息回到学校，我的一个期中考试仅由真的或假的问题组成时。假设一半的答案是“真的”，而另一半则是“假的”。我想出了大部分问题的答案，剩下的是靠随机猜测。我做了一件聪明的事情，也许你也可以尝试一下这个策略。在计数了我的“真”的答案之后，我意识到它与“假”这个答案不成比例。于是我的大部分猜测是“假”的，这样就可以平衡分配。

08

【值得收藏的深度学习思维导图】全面梳理基本概念与11大模型关系

【新智元导读】作者dformoso在Github上放出了自己绘制的深度学习思维导图，共有三张：基本概念、架构和TensorFlow。以图示的方法介绍深度学习必备的基本概念和架构，很好地展示了各个要素

03

谷歌云大会教程：没有博士学位如何玩转TensorFlow和深度学习（附资源）

机器之心原创作者：吴攀、李亚洲当地时间 3 月 8 日-10 日，Google Cloud NEXT '17 大会在美国旧金山举行。谷歌在本次大会上正式宣布了对数据科学社区 Kaggle 的收购并宣布了多个重量级云 API。机器之心作为受邀媒体也在第一时间从现场发回了报道：《现场直击 | 李飞飞首度亮相谷歌云大会：发布全新 API，解读 AI 民主化》和《现场直击 | 谷歌云大会最后一天解读开放性：从 TensorFlow 开源到开放云平台》。而作为开发者，最关心的则莫过于本次大会中各种更加详细和专一的

超级网络

在这篇文章中，我将介绍一下我们最近的文章[1609.09106] HyperNetworks。我作为Google Brain Resident工作在这篇论文上- 一个伟大的研究计划，我们可以从事一年的机器学习研究，并且享受工资和福利！Brain团队正在接受2017年计划的申请：请参阅g.co/brainresidency。

07

深度学习框架哪家强？MXNet称霸CNN、RNN和情感分析，TensorFlow仅擅长推断特征提取

深度学习框架哪家强：TensorFlow？Caffe？MXNet？Keras？PyTorch？对于这几大框架在运行各项深度任务时的性能差异如何，各位读者不免会有所好奇。微软数据科学家Ilia Karmanov最新测试的结果显示，亚马逊MXNet在CNN、RNN与NLP情感分析任务上性能强劲，而TensorFlow仅擅长于特征提取。测试详情更新在Ilia Karmanov的GitHub项目DeepLearningFrameworks（https://github.com/ilkarman/Deep

03

教程 | 使用MNIST数据集，在TensorFlow上实现基础LSTM网络

选自GitHub 机器之心编译参与：刘晓坤、路雪本文介绍了如何在 TensorFlow 上实现基础 LSTM 网络的详细过程。作者选用了 MNIST 数据集，本文详细介绍了实现过程。长短期记忆（LSTM）是目前循环神经网络最普遍使用的类型，在处理时间序列数据时使用最为频繁。关于 LSTM 的更加深刻的洞察可以看看这篇优秀的博客：http://colah.github.io/posts/2015-08-Understanding-LSTMs/。我们的目的这篇博客的主要目的就是使读者熟悉在 Tenso

转载｜使用PaddleFluid和TensorFlow训练RNN语言模型

在图像领域，最流行的 building block 大多以卷积网络为主。上一篇我们介绍了转载｜使用PaddleFluid和TensorFlow实现图像分类网络SE_ResNeXt。卷积网络本质上依然是一个前馈网络，在神经网络基本单元中循环神经网络是建模序列问题最有力的工具，有着非常重要的价值。自然语言天生是一个序列，在自然语言处理领域（Nature Language Processing，NLP）中，许多经典模型都基于循环神经网络单元。可以说自然语言处理领域是 RNN 的天下。

03

最基本的25道深度学习面试问题和答案

近年来，对深度学习的需求不断增长，其应用程序被应用于各个商业部门。各公司现在都在寻找能够利用深度学习和机器学习技术的专业人士。在本文中，将整理深度学习面试中最常被问到的25个问题和答案。如果你最近正在参加深度学习相关的面试工作，那么这些问题会对你有所帮助。

01

【深度学习思维导图】必备的基本概念和架构

概念一节下分为激活函数：反向传播算法、学习率、梯度下降和损失（最小化）目标（最大化）函数。

02

【TensorFlow 谷歌神经机器翻译】从零开始打造属于你的翻译系统

【新智元导读】谷歌今天公布了一个用 TensorFlow 构建神经机器翻译（NMT）系统的教程，全面解释 seq2seq 模型，并演示如何从零开始构建 NMT 翻译模型。这个教程从 NMT 的背景知识讲起，详细讲解如何构建并训练一个 NMT 模型，并提供代码，绝对有用。机器翻译——自动在两种语言之间进行翻译的任务——是机器学习中最活跃的研究领域之一。在多种机器翻译方法中，序列到序列（“seq2seq”）模型最近取得了巨大的成功，并已经成为大多数商业翻译系统的事实上的标准，例如谷歌翻译。这是由于 seq2s

04

TensorFlow 深度学习实战指南：1~5 全

TensorFlow 是 Google 最近发布的新的机器学习和图计算库。其 Python 接口可确保通用模型的优雅设计，而其编译后的后端可确保速度。

01

三天速成！中国香港科技大学TensorFlow课件分享

机器之心整理参与：蒋思源这是一套香港科技大学发布的极简 TensorFlow 入门教程，三天全套幻灯片教程已被分享到 Google Drive。机器之心将简要介绍该教程并借此梳理 TensorFlow 的入门概念与实现。该教程第一天先介绍了深度学习和机器学习的潜力与基本概念，而后便开始探讨深度学习框架 TensorFlow。首先我们将学到如何安装 TensorFlow，其实我们感觉 TensorFlow 环境配置还是相当便捷的，基本上按照官网的教程就能完成安装。随后就从「Hello TensorFlo

三天速成！中国香港科技大学TensorFlow课件分享

该教程第一天先介绍了深度学习和机器学习的潜力与基本概念，而后便开始探讨深度学习框架 TensorFlow。首先我们将学到如何安装 TensorFlow，其实我们感觉 TensorFlow 环境配置还是相当便捷的，基本上按照官网的教程就能完成安装。随后就从「Hello TensorFlow」开始依次讲解计算图、占位符、张量等基本概念。

02

Python 元学习实用指南：1~5

元学习是当前人工智能领域最有前途和趋势的研究领域之一。它被认为是获得广义人工智能（AGI）的垫脚石。在本章中，我们将了解什么是元学习以及为什么元学习是当前人工智能中最令人振奋的研究。我们将了解什么是少拍，单拍和零拍学习，以及如何在元学习中使用它。我们还将学习不同类型的元学习技术。然后，我们将探索学习通过梯度下降学习梯度下降的概念，其中我们了解如何使用元学习器来学习梯度下降优化。继续进行，我们还将学习优化作为少样本学习的模型，我们将了解如何在少样本学习设置中将元学习器用作优化算法。

03

三天速成 TensorFlow课件分享

该教程第一天先介绍了深度学习和机器学习的潜力与基本概念，而后便开始探讨深度学习框架 TensorFlow。首先我们将学到如何安装 TensorFlow，其实我们感觉 TensorFlow 环境配置还是相当便捷的，基本上按照官网的教程就能完成安装。随后就从「Hello TensorFlow」开始依次讲解计算图、占位符、张量等基本概念。

09

业界 | Tensor Core究竟有多快？全面对比英伟达Tesla V100/P100的RNN加速能力

选自xcelerit 机器之心编译参与：蒋思源 RNN 是处理量化金融、风险管理等时序数据的主要深度学习模型，但这种模型用 GPU 加速的效果并不好。本文使用 RNN 与 LSTM 基于 Tenso

09

我们压缩了一批深度学习进阶“传送门”给小白

编译：ShanLIU、Chloe、笪洁琼、Harry 作者：Seth Weidman 阅读这篇文章的必要性：无论是作为行业内的从业者还是一个组织，在开始深度学习应用之前，都需要掌握两件事： 1. 知其然：掌握一个基础概念，知道深度学习的最新发展可以实现什么。 2. 知其所以然：训练一个新模型或在生产环境下运行一个已有模型的技术能力得益于开源社区的优势，我们获得“知其所以然”能力的途径越来越多。网上有大量优质的教程，讲解如何训练、使用深度学习模型的技术细节，例如借助TensorFlow这样的开源软件库来

03

详解循环神经网络(Recurrent Neural Network)

今天的学习资料是这篇文章，写的非常详细，有理论有代码，本文是补充一些小细节，可以二者结合看效果更好： https://zybuluo.com/hanbingtao/note/541458 在文末有关于 RNN 的文章汇总，之前写的大多是概览式的模型结构，公式，和一些应用，今天主要放在训练算法的推导。本文结构：模型训练算法基于 RNN 的语言模型例子代码实现 ---- 1. 模型和全连接网络的区别更细致到向量级的连接图为什么循环神经网络可以往前看任意多个输入值循环神经网络种类繁多，今天只看

06

一门面向所有人的人工智能公开课：MIT 6.S191，深度学习入门

选自Medium 机器之心编译参与：黄小天、李泽南对初学者来说，有没有易于上手，使用流行神经网络框架进行教学的深度学习课程？近日，麻省理工学院（MIT）正式开源了在线介绍性课程「MIT 6.S19

09

一门面向所有人的人工智能公开课：MIT 6.S191，深度学习入门

选自Medium 机器之心编译参与：黄小天、李泽南对初学者来说，有没有易于上手，使用流行神经网络框架进行教学的深度学习课程？近日，麻省理工学院（MIT）正式开源了在线介绍性课程「MIT 6.S19

在深度学习TensorFlow 框架上使用 LSTM 进行情感分析

在这篇教程中，我们将介绍如何将深度学习技术应用到情感分析中。该任务可以被认为是从一个句子，一段话，或者是从一个文档中，将作者的情感分为积极的，消极的或者中性的。这篇教程由多个主题组成，包括词向量，循环神经网络和 LSTM。文章的最后给出完整的代码可以通过回复公众号"LSTM"获取。在讨论具体的概念之前，让我们先来谈谈为什么深度学习适合应用在自然语言处理中。深度学习在自然语言处理中的应用自然语言处理是教会机器如何去处理或者读懂人类语言的系统，目前比较热门的方向，包括如下几类：对话系统 - 比较著名的

07

TensorFlow 1.x 深度学习秘籍：6~10

在本章中，我们将讨论循环神经网络（RNN）如何在保持顺序顺序重要的领域中用于深度学习。我们的注意力将主要集中在文本分析和自然语言处理（NLP）上，但我们还将看到用于预测比特币价值的序列示例。

01

教程 | 如何快速训练免费的文本生成神经网络

选自minimaxir 作者：Max Woolf 机器之心编译参与：Geek AI、路本文介绍了如何免费使用 Google Colaboratory 在 GPU 上快速训练文本生成神经网络，包括两

05

《机器学习实战：基于Scikit-Learn、Keras和TensorFlow》第15章使用RNN和CNN处理序列

第10章使用Keras搭建人工神经网络第11章训练深度神经网络第12章使用TensorFlow自定义模型并训练第13章使用TensorFlow加载和预处理数据第14章使用卷积神经网络实现深度计算机视觉第15章使用RNN和CNN处理序列 [第16章使用RNN和注意力机制进行自然语言处理] [第17章使用自编码器和GAN做表征学习和生成式学习] [第18章强化学习] [第19章规模化训练和部署TensorFlow模型]

01

入门 | TensorFlow的动态图工具Eager怎么用？这是一篇极简教程

项目链接：https://github.com/madalinabuzau/tensorflow-eager-tutorials

05

LSTM、GRU与神经图灵机：详解深度学习最热门的循环神经网络

选自MachineLearningMastery 作者：Jason Brownlee 机器之心编译参与：熊猫循环神经网络是当前深度学习热潮中最重要和最核心的技术之一。近日，Jason Brownl

入门 | TensorFlow的动态图工具Eager怎么用？这是一篇极简教程

项目链接：https://github.com/madalinabuzau/tensorflow-eager-tutorials

00

ensorFlow 智能移动项目：6~10

如果图像分类和物体检测是明智的任务，那么用自然语言描述图像绝对是一项更具挑战性的任务，需要更多的智能-请片刻考虑一下每个人如何从新生儿成长（他们学会了识别物体并检测它们的位置）到三岁的孩子（他们学会讲述图片故事）。用自然语言描述图像的任务的正式术语是图像标题。与具有长期研究和发展历史的语音识别不同，图像字幕（具有完整的自然语言，而不仅仅是关键词输出）由于其复杂性和 2012 年的深度学习突破而仅经历了短暂而令人兴奋的研究历史。

02

TensorFlow中生成手写笔迹的Demo

这项操作现在在github上已经可以使用了。

07

TensorFlow 机器学习秘籍第二版：9~11

在本章中，我们将介绍循环神经网络（RNN）以及如何在 TensorFlow 中实现它们。我们将首先演示如何使用 RNN 来预测垃圾邮件。然后，我们将介绍一种用于创建莎士比亚文本的 RNN 变体。我们将通过创建 RNN 序列到序列模型来完成从英语到德语的翻译：

01

谷歌开放GNMT教程：如何使用TensorFlow构建自己的神经机器翻译系统

选自谷歌机器之心编译参与：机器之心编辑部近日，谷歌官方在 Github 开放了一份神经机器翻译教程，该教程从基本概念实现开始，首先搭建了一个简单的NMT模型，随后更进一步引进注意力机制和多层 LSTM 加强系统的性能，最后谷歌根据 GNMT 提供了更进一步改进的技巧和细节，这些技巧能令该NMT系统达到极其高的精度。机器之心对该教程进行简要的描述，跟详细和精确的内容请查看项目原网站。 GitHub 链接：https://github.com/tensorflow/nmt 机器翻译，即跨语言间的自动翻译，

06

【算法】什么是神经网络?

本文结构：什么是神经网络什么是神经元神经网络的计算和训练代码实现 1. 什么是神经网络神经网络就是按照一定规则将多个神经元连接起来的网络例如全连接(full connected, FC)神经网络，它的规则包括：有三种层：输入层，输出层，隐藏层。同一层的神经元之间没有连接。 full connected的含义：第 N 层的每个神经元和第 N-1 层的所有神经元相连，第 N-1 层神经元的输出就是第 N 层神经元的输入。每个连接都有一个权值。不同的神经网络，具有不同的连接规则 2. 什么

09

精通 TensorFlow 1.x：6~10

在涉及有序数据序列的问题中，例如时间序列预测和自然语言处理，上下文对于预测输出非常有价值。可以通过摄取整个序列而不仅仅是最后一个数据点来确定这些问题的上下文。因此，先前的输出成为当前输入的一部分，并且当重复时，最后的输出结果是所有先前输入的结果以及最后一个输入。循环神经网络（RNN）架构是用于处理涉及序列的机器学习问题的解决方案。

01

教程 | 如何使用TensorFlow构建、训练和改进循环神经网络

选自SVDS 作者：Matthew Rubashkin、Matt Mollison 机器之心编译参与：李泽南、吴攀来自 Silicon Valley Data Science 公司的研究人员为我们展示了循环神经网络（RNN）探索时间序列和开发语音识别模型的能力。目前有很多人工智能应用都依赖于循环深度神经网络，在谷歌（语音搜索）、百度（DeepSpeech）和亚马逊的产品中都能看到RNN的身影。然而，当我们开始着手构建自己的 RNN 模型时，我们发现在使用神经网络处理语音识别这样的任务上，几乎没有简单直

09

循环神经网络的增强方法：注意力机制以及更多

AI 科技评论按：一提起 RNN，我们最容易想到的实现就是 LSTM + attention。LSTM 作为经典的网络结构可谓是老当益壮，而另一方面注意力机制过于常见，我们甚至会觉得它是「理所当然的」。但其实注意力机制其实并不是唯一一种网络增强的方式。这篇 Distill.pub 博客的文章就带我们重温了包括注意力在内的多种网络增强方式，它们侧重的方向不一样，也就方便研究/开发人员们按照自己的实际需求进行选取。 AI 科技评论编译如下。

01

《机器学习实战：基于Scikit-Learn、Keras和TensorFlow》第16章使用RNN和注意力机制进行自然语言处理

自然语言处理的常用方法是循环神经网络。所以接下来会从 character RNN 开始（预测句子中出现的下一个角色），继续介绍RNN，这可以让我们生成一些原生文本，在过程中，我们会学习如何在长序列上创建TensorFlow Dataset。先使用的是无状态RNN（每次迭代中学习文本中的随机部分），然后创建一个有状态RNN（保留训练迭代之间的隐藏态，可以从断点继续，用这种方法学习长规律）。然后，我们会搭建一个RNN，来做情感分析（例如，读取影评，提取评价者对电影的感情），这次是将句子当做词的序列来处理。然后会介绍用RNN如何搭建编码器-解码器架构，来做神经网络机器翻译（NMT）。我们会使用TensorFlow Addons项目中的 seq2seq API 。

02

来份TensorRT的教程，要实战的哟！

对于Lady来说，我信了你的邪！我决定把之前发布的关于TensorRT的视频教程再综合地整理一遍。

02

Keras作为TensorFlow的简化界面：教程

周日 2016年4月24日由弗朗索瓦Chollet 在教程中。

你真的会正确地调试TensorFlow代码吗？

当谈到在 TensorFlow 上写代码时，我们总会将它和 PyTorch 进行对比，然后讨论 TensorFlow 框架是多么的复杂以及 tf.contrib 的某些部分为什么那么糟糕。此外，我还认识许多数据科学家，他们只用预先写好的、可以克隆的 GitHub 库和 TensorFlow 交互，然后成功使用它们。对 TensorFlow 框架持有这种态度的原因各不相同，想要说清楚的话恐怕还得另外写个长篇，现在我们要关注的是更实际的问题：调试用 TensorFlow 写的代码，并理解其主要特性。

03

什么是神经网络

本文结构：什么是神经网络什么是神经元神经网络的计算和训练代码实现 ---- 1. 什么是神经网络神经网络就是按照一定规则将多个神经元连接起来的网络例如全连接(full connected, FC)神经网络，它的规则包括：有三种层：输入层，输出层，隐藏层。同一层的神经元之间没有连接。 full connected的含义：第 N 层的每个神经元和第 N-1 层的所有神经元相连，第 N-1 层神经元的输出就是第 N 层神经元的输入。每个连接都有一个权值。不同的神经网络，具有不同的连接规则 --

05

深度学习：7种范例教程分享

来源商业新知网，原标题：MIT高赞深度学习教程：一文看懂CNN、RNN等7种范例（TensorFlow教程）

03

Seq2Seq、SeqGAN、Transformer…你都掌握了吗？一文总结文本生成必备经典模型（一）

机器之心专栏本专栏由机器之心SOTA！模型资源站出品，每周日于机器之心公众号持续更新。本专栏将逐一盘点自然语言处理、计算机视觉等领域下的常见任务，并对在这些任务上取得过 SOTA 的经典模型逐一详解。前往 SOTA！模型资源站（sota.jiqizhixin.com）即可获取本文中包含的模型实现代码、预训练模型及 API 等资源。本文将分 2 期进行连载，共介绍 10 个在文本生成任务上曾取得 SOTA 的经典模型。第 1 期：Seq2Seq（RNN）、Seq2Seq（LSTM）、Seq2Seq+

01

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭