开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

带theano后端的keras在cpu上运行lstm的速度要慢得多

带有Theano后端的Keras在CPU上运行LSTM的速度相对较慢。Theano是一种基于Python的科学计算库，用于高效地定义、优化和评估数学表达式。它可以在CPU和GPU上运行，但在CPU上的性能相对较差。

LSTM（长短期记忆网络）是一种常用于处理序列数据的深度学习模型。它在自然语言处理、语音识别和时间序列预测等领域具有广泛的应用。

尽管Theano后端在GPU上的性能较好，但在CPU上运行LSTM时会遇到性能瓶颈。这是因为LSTM模型的计算复杂度较高，而CPU的计算能力有限。

为了提高在CPU上运行LSTM的速度，可以考虑以下几点：

使用GPU加速：将计算迁移到GPU上可以显著提高LSTM的训练和推理速度。可以使用支持GPU加速的深度学习框架，如TensorFlow或PyTorch，并选择适当的后端（如TensorFlow的TensorFlow-GPU）。
优化代码：通过优化代码和算法，可以减少LSTM模型的计算负载，从而提高在CPU上的运行速度。例如，可以减少模型的复杂度、调整超参数、使用更高效的优化算法等。
并行计算：利用多线程或多进程进行并行计算，可以充分利用CPU的多核心能力，提高LSTM的运行速度。可以使用Python中的多线程或多进程库，如multiprocessing或concurrent.futures。
硬件升级：如果需要在CPU上高效地运行LSTM模型，可以考虑升级到性能更强的CPU或使用专门用于深度学习任务的CPU。

腾讯云提供了一系列与云计算和人工智能相关的产品和服务，可以帮助开发者高效地进行模型训练和推理。以下是一些推荐的腾讯云产品和产品介绍链接：

腾讯云AI引擎：提供了丰富的人工智能能力和算法模型，包括自然语言处理、图像识别、语音识别等。详情请参考：腾讯云AI引擎
腾讯云弹性计算：提供了高性能的云服务器实例，可以满足各种计算需求。详情请参考：腾讯云弹性计算
腾讯云GPU计算：提供了GPU加速的云服务器实例，适用于深度学习和图形渲染等计算密集型任务。详情请参考：腾讯云GPU计算

请注意，以上推荐的产品和链接仅供参考，具体选择应根据实际需求和情况进行。

相关搜索:EmguCv :为什么我在Emgu.Cv 4.5.1上运行带有Cuda支持的Yolo比CPU慢得多？MATLAB Parfor在18核PC上的运行速度比在10核PC上要慢得多代码在生产服务器上的运行速度要慢得多优化在Oracle上运行速度慢的SELECT查询,该查询在SQL Server上快速运行在Windows Server 2016上枚举WMI的速度要慢得多在图形处理器上运行的CatBoost性能比在CPU上运行的性能差得多。在我2018年的18核iMac上，Python或PHP中的线程处理速度要慢100倍如何加快在服务器上的虚拟机上运行速度非常慢的Matlab矩阵乘法？带有Keras的Python神经网络在CPU上运行，但在GPU上崩溃带自定义层的PyTorch网络在CPU上运行良好，但在迁移到GPU时会获得cudaErrorIllegalAddress。

相关搜索:

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

Keras系列（一）：介绍

下面有请铁柱介绍Keras： Keras是什么 Keras是深度学习建模的一个上层建筑，其后端可以灵活使用CNTK、TensorFlow或者Theano。...CPU 或 GPU 上都可以顺利运行，做到无缝切换。...例如，对于特定任务，某个后端的速度更快，那么我们就可以无缝切换过去。...Theano由蒙特利尔大学的MILA 实验室开发，TensorFlow 由 Google 开发，CNTK 由微软开发。你用 Keras 写的每一段代码都可以在这三个后端上运行，无需任何修改。...在 CPU 上运行时，Tensor Flow 本身封装了一个低层次的张量运算库，叫作 Eigen；在 GPU 上运行时，TensorFlow封装了一个高度优化的深度学习运算库，叫作 NVIDIA CUDA

1K4 0

评测 | CNTK在Keras上表现如何？能实现比TensorFlow更好的深度学习吗？

Keras 可以通过设置 flag 自由切换后端（backend）引擎 Theano/TensorFlow；而不需要更改前端代码。...）（在主机上运行）来管理并运行 Docker 容器中的所有例子，它同时支持 CNTK 和 TensorFlow 后端，并用 logger 收集生成的日志。...fasttext 是一种较新的算法，可以计算词向量嵌入（word vector Embedding）的平均值（不论顺序），但是即使在使用 CPU 时也能得到令人难以置信的速度和效果，如同 Facebook...由于模型简单，这两种框架的准确率几乎相同，但在使用词嵌入的情况下，TensorFlow 速度更快。（不管怎样，fasttext 明显比双向 LSTM 方法快得多！）...撇开随机错误，有可能 CNTK 在 Keras 上的运行还没有完全优化（实际上，1bit-SGD 的设置不起作用（https://github.com/Microsoft/CNTK/issues/1975

1.3K5 0

Keras学习笔记（六）——如何在 GPU 上运行 Keras?以及如何在多 GPU 上运行 Keras 模型?，Keras会不会自动使用GPU？

如何在 GPU 上运行 Keras? 如果你以 TensorFlow 或 CNTK 后端运行，只要检测到任何可用的 GPU，那么代码将自动在 GPU 上运行。...如果你以 Theano 后端运行，则可以使用以下方法之一：方法 1: 使用 Theano flags。...= 'gpu' theano.config.floatX = 'float32' 如何在多 GPU 上运行 Keras 模型?...我们建议使用 TensorFlow 后端来执行这项任务。有两种方法可在多个 GPU 上运行单个模型：数据并行和设备并行。在大多数情况下，你最需要的是数据并行。...= shared_lstm(tweet_b) # 在 CPU 上连接结果 with tf.device_scope('/cpu:0'): merged_vector = keras.layers.concatenate

3K2 0

Keras作为TensorFlow的简化界面：教程

请注意，本教程假定您已经配置Keras使用TensorFlow后端（而不是Theano）。这里是如何做到这一点的说明。...关于原生TensorFlow优化器和Keras优化器相对性能的说明：在使用TensorFlow优化器对“Keras方式”进行优化时，速度差异很小。...CPU创建的device scope而独立于CPU上。...with tf.device('/cpu:0'): preds = 0.5 * (output_0 + output_1) # 我们只运行`preds`张量，所以只有两个 # 在GPU上的副本运行...事实上，你甚至可以用Theano训练你的Keras模型，然后切换到TensorFlow Keras后端并导出你的模型。这是如何工作的。

4K10 0

Keras: 基于Python的深度学习库

Keras 是一个用 Python 编写的高级神经网络 API，它能够以TensorFlow, CNTK或者 Theano作为后端运行。Keras 的开发重点是支持快速的实验。...能够以最小的时延把你的想法转换为实验结果，是做好研究的关键。如果你在以下情况下需要深度学习库，请使用 Keras: 允许简单而快速的原型设计（由于用户友好，高度模块化，可扩展性）。...同时支持卷积神经网络和循环神经网络，以及两者的组合。在 CPU 和 GPU 上无缝运行。...Losses 评估标准 Metric 优化器 Optimizers 激活函数 Activations 回调 Callbacks 常用数据集 Datasets 应用 Applications 后端...Sequence to sequence - 预测 Stateful LSTM LSTM for 文本生成 GAN 辅助分类器阅读网站：https://keras123.com/

7803 0

最受欢迎开源深度学习框架榜单：这个排名让人想起~~

Chollet在推文中补充，Kears的使用在产业界和整个数据科学圈中最占主流，产业既包括大公司也包括创业公司。不过，在研究社区，Keras的份额要小很多。...；而Caffe和CNTK在小型CNN上同样表现不俗；对于带LSTM的RNN，CNTK速度最快，比其他工具好上5到10倍。...而Keras，则是谷歌在2017年宣布，将Keras作为TensorFlow的高级API。这意味着Keras被包含在TensorFlow版本中及时更新。...除了TensorFlow，Keras也可以使用Theano或者CNTK作为后端。其他框架和公司合纵连横——中国框架何时才能上榜？...ONNX是一个表示深度学习模型的开放格式。它使用户可以更轻松地在不同框架之间转移模型。例如，它允许用户构建一个PyTorch模型，然后使用MXNet运行该模型来进行推理。

1.8K7 0

ArXiv最受欢迎开源深度学习框架榜单：TensorFlow第一，PyTorch第四

Chollet在推文中补充，Kears的使用在产业界和整个数据科学圈中最占主流，产业既包括大公司也包括创业公司。不过，在研究社区，Keras的份额要小很多。...；而Caffe和CNTK在小型CNN上同样表现不俗；对于带LSTM的RNN，CNTK速度最快，比其他工具好上5到10倍。...而Keras，则是谷歌在2017年宣布，将Keras作为TensorFlow的高级API。这意味着Keras被包含在TensorFlow版本中及时更新。...除了TensorFlow，Keras也可以使用Theano或者CNTK作为后端。其他框架和公司合纵连横——中国框架何时才能上榜？...ONNX是一个表示深度学习模型的开放格式。它使用户可以更轻松地在不同框架之间转移模型。例如，它允许用户构建一个PyTorch模型，然后使用MXNet运行该模型来进行推理。

1.1K9 0

中国的开源框架，何时能在最受欢迎开源深度学习框架榜单上显露名字呢？

Chollet在推文中补充，Kears的使用在产业界和整个数据科学圈中最占主流，产业既包括大公司也包括创业公司。不过，在研究社区，Keras的份额要小很多。...；而Caffe和CNTK在小型CNN上同样表现不俗；对于带LSTM的RNN，CNTK速度最快，比其他工具好上5到10倍。...而Keras，则是谷歌在2017年宣布，将Keras作为TensorFlow的高级API。这意味着Keras被包含在TensorFlow版本中及时更新。...除了TensorFlow，Keras也可以使用Theano或者CNTK作为后端。其他框架和公司合纵连横——中国框架何时才能上榜？...ONNX是一个表示深度学习模型的开放格式。它使用户可以更轻松地在不同框架之间转移模型。例如，它允许用户构建一个PyTorch模型，然后使用MXNet运行该模型来进行推理。

6738 0

2017 深度学习框架发展大盘点——迎来 PyTorch，告别 Theano

这对不支持 Python 的调度栈来说至关重要。理论上，在改变模型源代码之后，你想要运行旧模型时它也能有所帮助。...为何要共同打造 ONNX 开放平台？目前的开发现状如下：大体上，每个框架都会针对某个特定属性进行优化，比如训练速度、对网络架构的支持、能在移动设备上推理等等。...，并且与所有 TensorFlow 功能深度兼容；通用实现，兼容多种运行后端，包括 Theano 和 TensorFlow 等（将来可能会支持更多其他的后端）。...稀疏性在 NLP 领域的深度神经网络中非常常见，而量化对于运行时性能评估至关重要。虽然在单个 GPU 上进行调度很容易，但在多个 GPU 上操作要复杂得多。...之所以会出现这种现象，是因为小型计算设备在大规模图像、视频、文本和语音处理上具有明显的短板，无论在速度还是可靠性上都远远不及大型数据中心。

1.1K6 0

keras中文文档

新版本的Keras提供了Lambda层，以实现一些简单的计算任务。 ... 如果你已经基于Keras0.3编写了自己的层，那么在升级后，你需要为自己的代码做以下调整，以在Keras1.0上继续运行。...pip install keras 对于在Windows上使用Keras的同学，请移步 Keras安装和配置指南 ---- 在Theano和TensorFlow间切换 Keras默认使用Theano作为后端来进行张量操作...我们建议你在使用前稍微了解一下Theano或TensorFlow，Bing/Google一下即可，如果我们要反baidu，那就从拒绝使用baidu开始，光撂嘴炮是没有用的。...这两个表达方法本质上没有什么区别。 Keras默认的后端是Theano，所以所有层的默认数据组织形式是'th'，你按这个方式组织数据即可。利用Keras自带的数据库模块下载的数据库也长这个样子。...这种模型编译速度快，操作上也比较简单。第二种模型称为Graph，即图模型，这个模型支持多输入多输出，层与层之间想怎么连怎么连，但是编译速度慢。

4.5K5 0

深度学习框架哪家强？MXNet称霸CNN、RNN和情感分析，TensorFlow仅擅长推断特征提取

例如，对于CNTK，我们使用optimized_rnnstack而不是Recurrence(LSTM())函数。虽然它不太灵活，但是速度要快得多。...由于在目标检测各种图像大小的组合上运行cudnnFind会出现较大的性能下降，所以穷举搜索算法应该是不能在目标检测的任务上使用了。 3、使用Keras时，选择与后端框架相匹配的[NCHW]排序很重要。...对卷积操作启用WINOGRAD，自然而然的就将keras变成改成以TF作为后端。...因此我这里分享了一个脚本关于RNN 1、大多数框架（例如Tensorflow）上，都有多个RNN实现/内核; 一旦降低到cudnn LSTM / GRU级别，执行速度是最快的。...但是，这种实现不太灵活（例如，可能希望层归一化），并且接下来如果在CPU上运行推理可能会出现问题。 2、在cuDNN这个层面，大部分框架的运行时间是非常相似的。

1.2K3 0

深度学习三大框架对比

训练速度快，组件模块化，可以方便的拓展到新的模型和学习任务上。...1.Blob表示网络中的数据，包括训练数据，网络各层自身的参数，网络之间传递的数据都是通过Blob来实现的，同时Blob数据也支持在CPU与GPU上存储，能够在两者之间做同步。...1、概念 Keras由纯Python编写而成并基于Tensorflow、Theano以及CNTK后端，相当于Tensorflow、Theano、CNTK的上层接口，号称10行代码搭建神经网络，具有操作简单...这种模型编译速度快，操作也比较简单。 2) 函数式模型（Model）：多输入多输出，层与层之间任意连接。这种模型编译速度慢。...用TensorFLow backend后端时速度比纯TensorFLow下要慢很多。

4K11 0

2021十大 Python 机器学习库

易于训练它很容易在 CPU 和 GPU 上进行训练以进行分布式计算并行神经网络训练从某种意义上说，TensorFlow 提供了流水线，我们可以在多个 GPU 上训练多个神经网络，这使得模型在大规模系统上非常高效...Keras 还提供了一些用于编译模型、处理数据集、图形可视化等最佳实用程序在后端，Keras 在内部使用 Theano 或 TensorFlow。也可以使用一些最流行的神经网络，如 CNTK。...当我们将 Keras 与其他机器学习库进行比较时，它的速度相对较慢。因为它通过使用后端基础设施创建计算图，然后利用它来执行操作。...Keras 中的所有模型都是可移植的 Keras 的特点支持 CPU 和 GPU 它可以在 CPU 和 GPU 上流畅运行模型全面 Keras 支持神经网络的几乎所有模型——全连接、卷积、池化、循环...的特点与 NumPy 紧密集成能够在 Theano 编译的函数中使用完整的 NumPy 数组高效的使用 GPU 执行数据密集型计算的速度比在 CPU 上快得多高效的符号微分 Theano 可以为具有一个或多个输入的函数求导

7031 0

肝！十大 Python 机器学习库

易于训练它很容易在 CPU 和 GPU 上进行训练以进行分布式计算并行神经网络训练从某种意义上说，TensorFlow 提供了流水线，我们可以在多个 GPU 上训练多个神经网络，这使得模型在大规模系统上非常高效...Keras 还提供了一些用于编译模型、处理数据集、图形可视化等最佳实用程序在后端，Keras 在内部使用 Theano 或 TensorFlow。也可以使用一些最流行的神经网络，如 CNTK。...当我们将 Keras 与其他机器学习库进行比较时，它的速度相对较慢。因为它通过使用后端基础设施创建计算图，然后利用它来执行操作。...Keras 中的所有模型都是可移植的 Keras 的特点支持 CPU 和 GPU 它可以在 CPU 和 GPU 上流畅运行模型全面 Keras 支持神经网络的几乎所有模型——全连接、卷积、池化、循环...的特点与 NumPy 紧密集成能够在 Theano 编译的函数中使用完整的 NumPy 数组高效的使用 GPU 执行数据密集型计算的速度比在 CPU 上快得多高效的符号微分 Theano 可以为具有一个或多个输入的函数求导

1.1K1 0

从三大神经网络，测试对比TensorFlow、MXNet、CNTK、Theano四个框架

本文通过五个任务分别测试了 MLP、CNN 和 RNN 模型，机器之心不仅对该试验进行了介绍，同时还使用 Keras（TensorFlow 后端）在 MNIST 数据集上试运行了 CNN。...相比于直接使用 TensorFlow 搭建卷积神经网络，将 Keras 作为高级 API，并使用 TensorFlow 作为后端要简单地多。...Keras 配置文件中有一个参数决定了使用哪一个深度学习框架作为后端，因此我们可以构建一个相同的模型在不同的深度学习框架（如 TensorFlow、CNTK、Theano）上直接运行。...早先已经有一些文章比较了 Keras 所支持后端框架的相对性能，但是对比的时间都比较早，且主要是以 TensorFlow 和 Theano 作为后端的对比。...CNTK 在 Babi RNN 和 MNIST RNN 测试上要比 TensorFlow 和 Theano 好得多，但是在 CNN 测试上要比 TensorFlow 差一些。

1.5K7 0

keras doc 7 Pooling Connceted Recurrent Embedding Activation

='th') 为空域信号施加最大值池化参数 pool_size：长为2的整数tuple，代表在两个方向（竖直，水平）上的下采样因子，如取（2，2）将使图片在两个维度上均变为原长的一半 strides：...='th') 为空域信号施加平均值池化参数 pool_size：长为2的整数tuple，代表在两个方向（竖直，水平）上的下采样因子，如取（2，2）将使图片在两个维度上均变为原长的一半 strides：...若设为‘cpu’，则RNN将使用较少、较大的矩阵乘法来实现，从而在CPU上会运行更快，但会更消耗内存。...如果设为‘mem’，则RNN将会较多的小矩阵乘法来实现，从而在GPU并行计算时会运行更快（但在CPU上慢），并占用较少内存。...要启用状态RNN，请在实例化层对象时指定参数stateful=True，并指定模型使用固定大小的batch：通过在模型的第一层传入batch_input_shape=(...)来实现。

7003 0

Keras vs PyTorch：谁是「第一」深度学习框架？

Keras 是能够在 TensorFlow、CNTK、Theano 或 MXNet 上运行的高级 API（或作为 TensorFlow 内的 tf.contrib）。...Keras 是在 TensorFlow 上运行的，这意味着它可以通过 TensorFlow for Mobile 和 TensorFlow Lite 享有更多选择来部署到移动平台。...在大多数情况下，基准测试中的速度差异不应该成为框架选择的主要标准——特别是在学习阶段。GPU 时间比其数据科学家的时间显然便宜得多。...而且，在学习过程中，性能瓶颈大多是由失败的实现、未优化的网络和数据加载造成的，而不是框架本身的运行速度。当然，为了完整地进行比较，我们还是要介绍这一方面。...github.com/ilkarman/DeepLearningFrameworks/ PyTorch 和 TensorFlow 一样快，在循环神经网络上或许更快，相比之下，Keras 通常速度较慢。

6632 0

Keras vs PyTorch：谁是「第一」深度学习框架？

Keras 是能够在 TensorFlow、CNTK、Theano 或 MXNet 上运行的高级 API（或作为 TensorFlow 内的 tf.contrib）。...Keras 是在 TensorFlow 上运行的，这意味着它可以通过 TensorFlow for Mobile 和 TensorFlow Lite 享有更多选择来部署到移动平台。...在大多数情况下，基准测试中的速度差异不应该成为框架选择的主要标准——特别是在学习阶段。GPU 时间比其数据科学家的时间显然便宜得多。...而且，在学习过程中，性能瓶颈大多是由失败的实现、未优化的网络和数据加载造成的，而不是框架本身的运行速度。当然，为了完整地进行比较，我们还是要介绍这一方面。...github.com/ilkarman/DeepLearningFrameworks/ PyTorch 和 TensorFlow 一样快，在循环神经网络上或许更快，相比之下，Keras 通常速度较慢。

5722 0

8种主流深度学习框架介绍

也就是说，我们需要先定义图形，然后运行计算，如果我们需要对架构进行更改，则需要重新训练模型。选择这样的方法是为了提高效率，但是许多现代神经网络工具已经能够在学习过程中改进，并且不会显著降低学习速度。...caffeR为Caffe提供了一系列封装功能，允许用户在R语言上运行Caffe，包括数据预处理和网络设置，以及监控和评估训练过程。...等框架，但自发布之日起，其受到的关注度就在不断上升，目前在GitHub上的热度已经超过Theano、Caffe、MXNet等框架。...因Theano出现的时间较早，后来涌现出一批基于Theano的深度学习库，并完成了对Theano的上层封装以及功能扩展。在这些派生库中，比较著名的就是本书要学习的Keras。...事实上，它是唯一支持所有R函数的构架。本地分布式训练：支持在多CPU/GPU设备上的分布式训练，使其可充分利用云计算的规模优势。

3.3K1 0

这是一份你们需要的Windows版深度学习软件安装指南

在完成配置深度学习框架后，本文分别利用这三个框架作为 Keras 后端在 CPU 和 GPU 上训练了一个标准的卷积神经网络，完成该简单的卷积网络也就意味着我们完成了深度学习环境的配置。...的安装因为 Theano 是安装 Keras 时自动安装的，为了快速地在 CPU 模式、GPU 模式和带 cuDNN 的 GPU 模式之间转换，我们需要创建以下三个系统环境变量（sysenv variable...使用带 Theano 后端的 Keras 为了有一个能进行对比的基线模型，首先我们使用 Theano 后端和 CPU 训练简单的卷积神经网络： (dlwin36) $ set KERAS_BACKEND...16 秒，相对于使用 CPU 要 250 秒左右取得了很大的提高（在同一个批量大小的情况下）。...Theano 后端在该任务上快 3 倍左右，它们都是用了 GPU 和 cuDNN 加速。

6862 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭