开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

为什么深度使用堆栈会导致简单解释器的超线性时间行为？

深度使用堆栈会导致简单解释器的超线性时间行为的原因是由于堆栈的操作和管理会引起额外的时间开销。以下是完善且全面的答案：

在计算机科学中，堆栈（Stack）是一种常见的数据结构，用于存储和管理函数调用、局部变量和临时数据等。在解释器中，堆栈通常用于存储函数调用的上下文信息，包括函数参数、局部变量和返回地址等。

当一个解释器执行一个函数调用时，它会将函数的参数和局部变量等信息压入堆栈中，并跳转到函数的入口点开始执行。当函数执行完毕后，解释器会从堆栈中弹出该函数的上下文信息，并返回到调用该函数的位置继续执行。

然而，深度使用堆栈会导致简单解释器的超线性时间行为，主要有以下几个原因：

堆栈操作的时间复杂度：堆栈的操作包括压栈和弹栈，这些操作的时间复杂度通常为O(1)，即常数时间。但是，当堆栈的深度增加时，每个函数调用都需要进行堆栈操作，这将导致总体的时间复杂度变为O(n)，其中n为函数调用的深度。因此，随着函数调用的深度增加，解释器的执行时间也会线性增加。
堆栈空间的分配和释放：堆栈空间的分配和释放也会引起额外的时间开销。每次函数调用时，解释器需要为函数的参数和局部变量分配一定的堆栈空间，并在函数执行完毕后释放这些空间。当函数调用的深度增加时，频繁的堆栈空间分配和释放操作将导致时间复杂度的增加。
堆栈溢出的可能性：堆栈的大小是有限的，当函数调用的深度超过了堆栈的容量时，就会发生堆栈溢出。堆栈溢出会导致程序崩溃或异常终止，进而影响解释器的正常执行。因此，在设计解释器时需要合理估计函数调用的深度，以避免堆栈溢出的问题。

为了解决深度使用堆栈导致的超线性时间行为，可以采取以下措施：

优化堆栈操作：可以通过优化堆栈操作的实现方式来减少时间开销。例如，使用数组实现堆栈可以提高堆栈操作的效率，或者使用尾递归优化等技术来减少函数调用的深度。
减少堆栈空间的分配和释放：可以通过减少函数参数和局部变量的使用，或者使用静态分配等技术来减少堆栈空间的分配和释放操作。
合理估计函数调用的深度：在设计解释器时，需要合理估计函数调用的深度，并根据实际情况调整堆栈的容量，以避免堆栈溢出的问题。

总之，深度使用堆栈会导致简单解释器的超线性时间行为，主要是由于堆栈操作和管理引起的额外时间开销。通过优化堆栈操作、减少堆栈空间的分配和释放、合理估计函数调用的深度等措施，可以减少超线性时间行为的影响。

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

【让高中生掌握深度学习】掀起DL炼金术之争的Ali，这次要像教物理那样教深度学习

我的团队里的工程师经常“直接”使用来自其他研究人员的超参数值，他们对需要自己调参的任务十分害怕.... 我对着这封邮件想了好几天，还是没能给出一个有建设性的答案。...在这些光学理论被统一进一个金字塔形的抽象堆栈之前，每一个理论都必须从光的基本概念开始推导。这导致出现一系列不切实际的假设。牛顿的射线光学将光线模拟为可能被固体物质吸引或排斥的粒子雾。...让我们从简单的事情开始吧。我们有很多关于深度网络的训练如何工作的思维模型。我收集了一些值得解释一番的现象。让我们看看这些思维模型是如何解释这些现象的。...但之后的一些小的数值错误，或者不好的步长大小，都会破坏SGD的效果。一些从业人员已经观察到，如何累积梯度的微小变化会导致测试集性能出现很大差异。...例如，当你使用GPU而不是CPU进行训练，就会出现这种情况。你认为这是值得解释的合理观察吗？还是你认为这是一个建立在错误观念之上的观察，可能是不真实的？

79810 0

像教光学一样在高中教深度学习？怼过LeCun的Google大牛认为这事有出路

我的团队中的工程师经常直接使用一些来自其他研究人员的超参数值，但他们对需要自己调整参数的任务却十分害怕”。我对着这封电子邮件想了好几天，还是没有给出一个建设性的答案。...目标：一种用于描述深度学习每层行为的模块化语言如果我们能够像谈论光线穿过光学元件时其元件的作用一样讨论深度学习每一层的作用，那么深度网络的设计工作就会十分容易。...我们通常把卷积层说成对输入进行滤波器匹配的部分，随后的池化层是用来进行非线性操作的。但这是一个相对较底层的描述，类似于用麦克斯韦方程描述镜头的作用。...我们有很多关于深度网络训练工作的思维模型。我也收集了一些值得解释的现象。让我们看看这些思维模型是如何解释这些现象的。在走得太远之前，这样的设想肯定是要进行的。光学用了300年的时间来做到这一点。...一些从业人员已经观察到梯度累计过程中的微小变化是怎样导致模型在测试集性能上出现太大差异的。例如，当你使用GPU而不是CPU进行训练时，就会出现这种情况。你认为这是一个值得思考的合理观察吗？

3353 0

机器学习和深度学习的区别

SVM是通过超平面来分割不同类距离超平面距离最优化的统计学模型……这些模型的物理解释非常明确，有着清晰的含义。当然，向量的维度数量和维度值是一定要由我们人类来归纳量化的。...深度学习与此不同的是，它通过大量的线性分类器或非线性分类器、可导或不可导的激励函数、以及池化层等功能对观测对象的特征进行自动化的提取。...所以深度学习的模型训练得再好也只能当成一个黑匣子来使用，它之所以能够被认定为科学的方式还是因为它的泛化性能够在验证集上通过来做保障这一点。...目前深度学习的工作还差强人意的原因有这样几个： 1、计算的复杂性太高，计算成本太高，也就导致训练的时间太长，商用价值无法在很多场景抵偿商用成本。...不过说到底，距离理想的人工智能的状态，硬伤还是在问题1上，这恐怕需要大量的时间积累，理论的积累，经验的积累，人才的积累，总有一天我们会等到人工智能奇点爆炸的时刻的。

6396 0

程序设计语言概述_c语言程序设计基本概念

（例如，C是过程式，Haskell是函数式，JAVA是面向对象，Python是简单的大杂烩，shell是调用命令的，lua是调用c程序的，PHP是写页面的，ProLog是线性逻辑推理的。...虚继承链条的增加，会导致间接访问的层次增加。例如两个菱形继承的串联。头文件，库，源代码跨平台 1. C++确实在源代码的层次是可能跨平台的。 2. 也可以通过相同的头文件去访问不同平台的库。 3....编译器的编译线程和执行线程是分开的，应用程序不会等待编译的执行。 3. 分析框架Profiler会观察程序行为，对频繁执行的function进一步优化。...例如类层次结构，多态的优化。（大多数虚调用都有其固定的一个目标，JIT因此生成的直接调用代码比虚表调用代码的效率会更高。）动态编译的缺点有什么？ 1. 大量的初始编译会影响程序启动时间。 2....运行时候的编译，行为分析都需要花费时间。 3. 运行效率达到稳定需要时间。 4. 实时GUI型的程序不能忍受“动态编译”和“GC”带来的延迟。 JAVA如何解决实时的需求？

1.4K4 0

深度学习知识点盘点（一）

为什么深度学习会兴起原因1. 在大规模的数据集上深度学习的性能比传统机器学习的更好 ?...这张图是吴恩达在解释的时候画的，意思是在数据集规模比较小的时候，传统机器学习的表现非常好，但是在数据集规模变得非常巨大之后，深度学习相对传统机器学习的优势就变得非常明显了。...在深度学习领域的算法创新，如ReLU 之前一直使用的激活函数都是sigmoid函数，但是它有一些固有缺点，在ReLu函数被设计出来之后，深度学习的性能和训练时间得到了大幅提升，使他变得更加popular...激活函数 为什么激活函数需要是非线性的因为如果激活函数是线性的话，无论神经网络有多少层，它都是在计算线性函数，最终结果都是线性的，100层和10层没有任何区别。...tanh函数比较平坦的地方，导致梯度下降变得很慢。

5671 0

机器学习可解释性系列 - 是什么&为什么&怎么做

：是什么：什么叫可解释性； 为什么：为什么要对模型结果进行解释；怎么做：如何有效的进行可解释性工作；是什么机器学习介绍可解释性之前，我们先来简单看看什么是机器学习，此处我们主要讨论有监督机器学习...，比如速度、稳定性、可复制性等等，即便性能上略逊于人类，但是瑕不掩瑜，但是模型也有它的劣势，那就是计算机通常无法有效的解释模型的预测行为，这里的解释指的是说给人类听，一个深度神经网络可能由几百层网络、百万个参数组成...如果换成深度神经网络来做预测，或者先对数据做了PCA等处理后再做预测，结果往往是人类没法直接理解的，那么从解释性上看，明显第一个模型的解释性更好； 为什么 进行可解释性的原因：知其然更要知其所以然：人类的好奇心驱使下...：公平性、隐私、可靠性、因果关系、信任；怎么做可解释性方法分类针对不同类型的模型可以使用不能的可解释性方法：本质的：本质上可解释模型（比如短决策树、简单线性模型等），这一类模型由于自身的简单性，...；后续后续会继续出可解释性相关文档，预计包括自身可解释模型（线性回归、逻辑回归、决策树等）、模型无关的解释方法、工作中的真实项目中的解释性工作；最后本文基于《可解释性的机器学习》，作者 Christoph

1.1K7 3

何时不应使用深度学习？

文章指出经过适当训练甚至只经过几个简单训练的深度学习可以打败简单线性模型。这个来来回回的辩论发生在越来越多生物信息研究者采用深度学习来解决问题的时候。这到底是炒作还是线性模型真的是我们所需要的？...另一方面，在很多情况下，使用深度学习从实践的角度来看是没有意义的，因为更简单的模型工作得更好深度学习远不止.fit()这么简单另外还有一个深度学习模式的缺失，我认为是因为翻译自其他机器学习领域导致的...知道如何优化参数，如何有效地分配数据来使用它们，在合理的时间内获得良好的结合是至关重要的。这也正是为什么随机梯度这么关键却仍然有很多人不了解，问题的原因即出自于此。...这就是为什么来自其他领域和/或使用 Scikit 学习的工具的人在他们找不到具有 .fit（）方法的非常简单的 API 时会感到困惑（虽然有一些工具，如Skflow，尝试将简单的网络装入 .fit（）...您可能会惊喜地发现，线性SVM真的是您需要的。解释和传达模型参数对一般观众的重要性深网另一个令人诟病的原因是其徒有高预测能力却很难解释清楚。

4431 0

学习率调度器和自适应优化器简史

第一个流行的学习率调度器: ReduceLROnPlateau 所有优化器都有一个学习率超参数，这是影响模型性能的最重要的超参数之一。在最简单的情况下，学习率是固定的。...一个包含热重启的学习率调度器偶尔重新提高学习率。下面一个简单的线性例子展示了这是如何做到的: ? 热重启通常会导致模型发生发散（diverge）。这是故意的。...余弦退火比线性退火具有更好的收敛行为，原因尚未完全清楚。这个学习率调度器是 fastai 框架几年来使用的默认调度器。...当学习率非常高时，动量是反向的，这就是为什么动量在优化器中以和学习率相反的方式退火。单周期学习率调度器或多或少地使用了余弦退火热重启学习率调度器所使用的机制，只是形式因素不同。...这就是为什么很多 PyTorch 的快速深度学习训练指南把 OneCycleLR 作为他们的顶级 PyTorch 训练技巧之一。

2.1K3 2

深度、卷积、和递归三种模型中，哪个将是人类行为识别方面的佼佼者？

深度、卷积、递归模型对人类行为进行识别（可穿戴设备数据）摘要普适计算领域中人类活动识别已经开始使用深度学习来取代以前的依靠手工提取分类的分析技术。...然而对于更复杂的行为，例如在医学应用中，这种手动调教方法还是存在显著挑战。有些工作还进一步进行，这也许可以解释一些明显的惯性在通过深度学习技术领域的主要技术途径。...图1 本文中使用的模型 2. 普适计算中的深度学习通过穿戴设备感应器获得的运动数据是多元时间序列数据，这些数据都有相关的高维时空频率（20Hz-200Hz）。...3.1深度前馈网络（DNN）我们使用了深度前馈网络，它相当于五个有着softmax-group的隐层的神经网络。DNN代表网络输入数据的一个非线性转换序列。...Daphnet Gait 数据集（DG）Bachlin等人记录了帕金森病（PD）对于10个参与者的影响，这意味着开展活动，可能会导致步态冻结。

1.9K9 0

为什么基于树的模型在表格数据上仍然优于深度学习

我个人不太喜欢应用太多的预处理技术，因为这可能会导致失去数据集的许多细微差别，但论文中所采取的步骤基本上会产生相同的数据集。但是需要说明的是，在评估最终结果时要使用相同的处理方法。...论文还使用随机搜索来进行超参数调优。这也是行业标准，但根据我的经验，贝叶斯搜索更适合在更广泛的搜索空间中进行搜索。了解了这些就可以深入我们的主要问题了——为什么基于树的方法胜过深度学习?...我们展示了默认超参数的这种差异，这是神经网络的典型行为，但是实际上很难（尽管并非不可能）找到成功学习这些模式的超参数。...这就是为什么花大量时间在EDA/领域探索上是如此重要。这将有助于理解特性，并确保一切顺利运行。论文的作者测试了模型在添加随机和删除无用特性时的性能。...根据作者的说法，采用特征的线性组合(这就是使ResNets不变的原因)实际上可能会错误地表示特征及其关系。

3571 0

100+数据科学面试问题和答案总结 - 机器学习和深度学习

也就是说，超参数会影响我们参数的训练，所以被称之为超参数。超参数：定义关于模型的更高层次的概念，如复杂性或学习能力。不能直接从标准模型培训过程中的数据中学习，需要预先定义。...当学习率太低时，模型的训练将进展得非常缓慢，因为我们只对权重进行最小的更新。在到达最小值点之前需要进行多次更新。如果学习率设置得太高，由于权重的剧烈更新，会导致损失函数产生不希望看到的发散行为。...单层感知器只能对输出为二元(0,1)的线性可分离类进行分类，而多层感知器可以对非线性类进行分类。除了输入层，其他层中的每个节点都使用非线性激活函数。...这会导致长时间的训练，糟糕的表现和低准确性。 101、什么是反向传播并解释它的工作原理。反向传播算法是一种用于多层神经网络的训练算法。...没有它神经网络将只能学习线性关系，即输入数据的线性组合。 105、什么是自动编码器? 自动编码器是一种简单的学习网络，旨在以最小的误差将输入转换为输出。这意味着我们希望输出尽可能接近输入。

9362 0

25个机器学习面试题，你能回答几个？

(提示：考虑一下非线性函数的情况?) 5、神经网络可以作为降维的工具吗?请详细解释一下。 (提示：自编码器) 6、似乎很多人都忽视了截距项在线性回归模型中的作用，请告诉我一个截距项的功能。...(提示：噪声(「垃圾」)收集器) 7、 Lasso 正则化可以将系数降低到正好为零。岭回归可以将系数降低到非常小的非零值。你能从两个简单的函数「|x| 和 x²」的图像中直观地解释他们的不同之处吗?...(提示：矩阵乘法的时间复杂度...) ? 10、难道你不认为时间序列是一个非常简单的线性回归问题，它仅仅有一个因变量和一个自变量(时间)?...12、决策树和神经网络都是非线性分类器，也就是说，通过复杂的决策边界来分割解空间。那么，直观地看，为什么我们认为使用决策树模型比深度神经网络要容易得多呢? 13、反向传播是深度学习的关键算法。...请给出简单的数学证明，说明为什么在这种情况下，使用最小二乘法构建一个回归模型并不是一个好的选择。 (提示：从矩阵代数的角度思考...) 19、请解释，为什么 k 折交叉验证对于时序模型效果并不好。

1.2K1 0

ICLR 2019 | 如何理解深度神经网络的泛化性能？谷歌认为可以从「泛化鸿沟」入手

使用边际分布来预测深度网络的泛化鸿沟！...该领域在推导出更好的 DNN 泛化边界（泛化鸿沟的上限）方面已经取得了很大的进展，但它们仍然倾向于高估实际泛化鸿沟，这使得它们无法解释为什么一些模型泛化得如此之好。...由 w·x-b=0 定义的超平面为该线性分类器的「决策边界」，即超平面上的每个点 x 在这个分类器下都是等可能的。...我们在 ICLR 2019 会议上的论文《使用边际分布来预测深度网络的泛化鸿沟》（「Predicting the Generalization Gap in Deep Networks with Margin...这些模型是 CNNs（其架构类似于 Network-in-Network）和 ResNet-32 的变体，具有不同的常用正则化技术和超参数设置，从而产生广泛的泛化行为。

4403 0

ICLR 2019 | 如何理解深度神经网络的泛化性能？谷歌认为可以从「泛化鸿沟」入手

使用边际分布来预测深度网络的泛化鸿沟！...该领域在推导出更好的 DNN 泛化边界（泛化鸿沟的上限）方面已经取得了很大的进展，但它们仍然倾向于高估实际泛化鸿沟，这使得它们无法解释为什么一些模型泛化得如此之好。...由 w·x-b=0 定义的超平面为该线性分类器的「决策边界」，即超平面上的每个点 x 在这个分类器下都是等可能的。...我们在 ICLR 2019 会议上的论文《使用边际分布来预测深度网络的泛化鸿沟》（「Predicting the Generalization Gap in Deep Networks with Margin...这些模型是 CNNs（其架构类似于 Network-in-Network）和 ResNet-32 的变体，具有不同的常用正则化技术和超参数设置，从而产生广泛的泛化行为。

1.4K1 0

从业多年，总结几点关于机器学习的经验教训

在训练模型时，不处理异常值可能会带来模型的高偏差。缺失值插补：解决错误/缺失值的明显方法是简单地丢弃它们。替代方案是插补，即通过相应属性的均值，中值或模式替换缺失/不正确的值。...为ML模型设置不同的超参数值可以产生不同的结果。例如，SVM的线性内核将无法对不可线性分离的数据进行分类。...如果最大深度或分割数量设置得太高，则基于树的分类器可能过度拟合，或者如果它们的最大特征数量设置得太低则可能不合适。找到超参数的最佳值是一个非常复杂的优化问题。...使用交叉验证：设置单独的测试集，将剩余数据拆分为k个部分，并使用每个部分迭代k次以进行验证（即调整超参数），剩余的用于训练。深度学习：灵丹妙药？...2、解释性：正如我们之前看到的，许多用例不仅需要预测，还需要解释预测背后的原因： 为什么贷款被拒绝？或者为什么保险单价格会上涨？基于树和基于系数的算法直接允许可解释性，但神经网络不能够解释。

6333 1

Quant 4.0：你的量化研究处于哪个时代？

具体而言，我们可以预期发现的有效阿尔法的数量与团队规模近似呈线性趋势，但投资组合收益的增长明显低于阿尔法数量和团队规模的扩张，这导致利润率越来越小。...在使用相对简单的因子下，深度学习仍然有潜力通过其强大的端到端学习能力和灵活的模型拟合能力，学习出一个表现与Quant2.0一样好的预测模型。...首先，金融时间序列预测必须避免使用未来信息，因此我们更倾向于前向验证（随着时间的推移将时间序列分成训练、验证和测试块），而不是模型超参数优化中的交叉验证。...不幸的是，搜索时间可能会随着生成公式的长度和复杂性呈指数增长，并迫使我们考虑更有效的替代方案。...其次，神经网络的梯度搜索可能会卡在局部最优点，导致模型不稳定问题。最后，神经网络由于其灵活性可能会遭受更严重的过拟合，并且由于数据具有极大的噪声，这种情况在量化中会变得更糟。

1K2 1

想让机器学习与商业结合，最重要的是什么？

别预测了，直接解释原因！一些项目并不旨在创建一个实时预测模型，而是解释假设或分析哪些因素可以解释特定行为，因为大多数机器学习算法是基于相关性，而不是因果性。...为机器学习模型设置正确的超参数值十分重要。举例而言，一个支持向量机的线性内核不能对无法线性分离的数据进行分类。...再比如，如果最大深度和分裂数量设置得过高，一个树型分类器可能出现过度拟合的情况；而最大特征数量设置过低，其可能无法充分拟合。为超参数找到最优数值是一个极为复杂的优化问题。以下是几点建议： 1....可解释性如上文提到，相当一部分实际案例不仅需要做出预测，还需要解释预测背后的原因：为什么贷款申请被拒绝？为什么保险政策价格提高？尽管基于树型结构和基于系数的算法可以解释，神经网络却不行。...别泄露数据处理一个预测航班到达时间延误的项目时，如果使用数据集里所有可用的特征时，模型的精确度可以达到99%。不过，希望你会意识到，你可能用启程延误时间来推测进港延误时间。这是数据泄露的典型案例。

6151 0

为什么基于树的模型在表格数据上仍然优于深度学习

我个人不太喜欢应用太多的预处理技术，因为这可能会导致失去数据集的许多细微差别，但论文中所采取的步骤基本上会产生相同的数据集。但是需要说明的是，在评估最终结果时要使用相同的处理方法。...论文还使用随机搜索来进行超参数调优。这也是行业标准，但根据我的经验，贝叶斯搜索更适合在更广泛的搜索空间中进行搜索。了解了这些就可以深入我们的主要问题了——为什么基于树的方法胜过深度学习?...我们展示了默认超参数的这种差异，这是神经网络的典型行为，但是实际上很难（尽管并非不可能）找到成功学习这些模式的超参数。...这就是为什么花大量时间在EDA/领域探索上是如此重要。这将有助于理解特性，并确保一切顺利运行。论文的作者测试了模型在添加随机和删除无用特性时的性能。基于他们的结果，发现了2个很有趣的结果。...根据作者的说法，采用特征的线性组合(这就是使ResNets不变的原因)实际上可能会错误地表示特征及其关系。

4391 0

脑影像中的深度学习研究：前景与挑战

在此总结了流行的DL模型的基本机制，并就其相应的神经影像学应用提供了建议。多层感知器模型通过简单统计梯度下降训练的多层感知器(MLP)模型是第一个提出的用可训练的多层神经元代替工程特征的解决方案。...G无法直接获取真实数据；它学习的唯一方法是通过与D的互动，获得合成样本和从真实数据中提取的样本。通过知道数据是来自真实堆栈还是来自G这一简单的基本事实，向D提供了一个错误信号。...第一个是模型设计的困难。尽管一些自微分平台极大地简化了模型设计过程，但各种超参数，如宽度、深度、损失函数和优化器通常是根据经验确定的。需要基本的DL理论、标准和手册来指导DL模型的设计。...可解释的局部替代物通过在被解释的输入样本周围用更简单的模型(例如，线性模型)局部逼近DL，然后产生可解释的更简单模型的直观总结，从而产生DL的解释。...shaply方法的发现为形态学衰老机制提供了更可靠的解释。遮挡分析是一种广泛使用的体系结构独立方法，其中当遮挡输入特征中的面片或单个特征时，特定类型的扰动分析会重复测试对神经网络输出的影响。

1.1K3 0

DeepMind到底是如何教AI玩游戏的？这篇在Medium上获得1700个赞的文章，把里面的原理讲清楚了

相反，我们常使用函数逼近器来估计动作值函数强化学习中经常使用的都是线性函数近似器，但是有时也会使用非线性函数近似器，如神经网络。我们将权重为θ的神经网络函数近似器称为Q网络。...如果在每个时间步长后更新权重，分别用行为分布ρ和模拟器 ε 中的单个样本替换期望，我们就会得到熟悉的Q-Learning算法[26]。...为什么说我们使用的方法是混合的呢？因为我们会根据网络学到了多少，来换着使用方法。我们依据代理会选择哪个最优动作来改变概率。这是怎么做到的？...此外，试验结果表明，无模型强化学习算法（如Q-learning算法）与非线性函数的近似函数[25]，或者与离策略学习[1]结合可能会导致Q神经网络出现发散。...NFQ也已成功应用于使用纯视觉输入的简单控制任务中[12]。在此类任务中，首先使用深度自编码器学习任务的低维表示，然后将NFQ应用于该表示[12]。

1.5K6 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭