专栏首页arxiv.org翻译专栏张量处理单元的学习性能模型(CS PF)
原创

张量处理单元的学习性能模型(CS PF)

确的硬件性能模型对于有效的代码生成至关重要。它们可以被编译器用来做出启发式的决定,被作为最小化目标的超级优化器,或者被自动调谐器用来找到一个特定程序的最优配置。然而,它们很难开发,因为当代的处理器很复杂,而且最近深度学习加速器的激增增加了开发负担。我们演示了一种从张量计算图程序语料库中学习张量处理单元性能模型的方法。我们在语料库的核级子图上训练一个神经网络,发现学习的模型与用于生产XLA编译器的高度优化的分析成本模型具有竞争力。

原文标题:A Learned Performance Model for the Tensor Processing Unit

原文:Accurate hardware performance models are critical to efficient code generation. They can be used by compilers to make heuristic decisions, by superoptimizers as an minimization objective, or by autotuners to find an optimal configuration of a specific program. However, they are difficult to develop because contemporary processors are complex, and the recent proliferation of deep learning accelerators has increased the development burden. We demonstrate a method of learning performance models from a corpus of tensor computation graph programs for the Tensor Processing Unit (TPU). We train a neural network over kernel-level sub-graphs from the corpus and find that the learned model is competitive to a heavily-optimized analytical cost model used in the production XLA compiler.

原文作者:Samuel J. KaufmanPhitchaya Mangpo PhothilimthanaYanqi ZhouMike Burrows

原文链接:https://arxiv.org/abs/2008.01040

原创声明,本文系作者授权云+社区发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 分发战略对分布式账本安全的影响(CS DC)

    本文对基于分布式账本技术的安全攻击进行了仿真研究。我们特别关注这些系统的底层对等层的攻击,该层负责传播包含将在所有参与者之间传播的数据和事务的消息。特别地,我们...

    邱邱邱
  • 对人工智能的工作过程进行精准分析的指标(CS AI)

    在基准数据集上比较模型的性能是衡量和推动人工智能发展的重要组成部分。模型在基准数据集上的性能通常是基于单个或一小组性能指标来评估的。虽然这样可以进行快速比较,但...

    邱邱邱
  • 扫描电子衍射层析成象的压力(CS NA)

    在一系列现代技术中,应变工程被用来获得理想的材料性能。然而,由于缺乏合适的实验技术和数据分析工具,直接纳米尺度测量这些材料内部的三维应变张量场受到了限制。扫描电...

    邱邱邱
  • R Programming-week1 Reading Data

    There are a few principal functions readingdata into R.

    统计学家
  • 释义与参照:同一枚硬币的两面(CS.CL)

    我们研究了两种不同的NLP任务之间的潜在协同作用,这两种任务都面临词汇变异性:识别谓词释义和事件共引用解析。首先,我们使用来自事件共参考数据集的注释作为远程监控...

    用户7236395
  • 一个有效的许可区块链与可证明的信誉机制(Computers and Society)

    许可区块链,只允许已知节点参与,已广泛应用在政府、公司、研究所等等。我们研究了将许可的区块链应用于横向战略联盟领域的案例,以确保联盟中任何不遵守规则的参与者在事...

    用户6869393
  • ACPI几个关键概念汇总整理(英文)

    ACPI System Locality Distance Information Table (SLIT): The relative distance be...

    Linux阅码场
  • 追踪接触者以控制COVID-19大流行(CS SI)

    控制 COVID-19大流行需要大量减少接触,主要是通过实施行动控制达到强制隔离的水平。 这导致了经济的大部分崩溃。这种疾病的携带者大约在接触病毒后3天具有传染...

    用户7095611
  • 统计学习导论 Chapter8 -- Tree-Based Methods

    Book: An Introduction to Statistical Learning with Applications in R http:...

    用户1148525
  • hadoop-core-site.xml配置文件详解

    用户7649162

扫码关注云+社区

领取腾讯云代金券