首页
学习
活动
专区
工具
TVP
发布

数据派THU

专栏作者
2139
文章
1934513
阅读量
188
订阅数
独家 | 兼顾速度和存储效率的PyTorch性能优化(2022)
作者:Jack Chih-Hsu Lin翻译:陈之炎校对:王紫岳 本文约4600字,建议阅读9分钟18个必须知道的PyTorch提速秘籍:工作原理和方法。 调整深度学习管道如同找到合适的齿轮组合(图片来源:Tim Mossholder) 为什么要阅读本博? 深度学习模型的训练/推理过程涉及到多个步骤。在时间和资源受限的情况下,实验迭代速度越快,越能优化模型的预测性能。本博收集整理了些许能够最大限度提高内存效率以及最小化运行时间的PyTorch的技巧和秘籍。但为了更好地利用这些技巧,我们还需要了解它的工
数据派THU
2022-09-07
1.2K0
【硬核书】人工智能用于计算机架构原理、实践和前景
来源:专知本文为书籍,建议阅读5分钟本书鼓励新的从业者拥抱日益自动化的架构设计。 https://www.morganclaypool.com/doi/10.2200/S01052ED1V01Y202009CAC055 人工智能已经在多个领域取得了关键进展,但它对计算机架构的影响才刚刚开始。特别是,最近的工作已经探索了更广泛的应用,以设计,优化和计算机结构的模拟。值得注意的是,基于机器学习的策略往往超越了之前最先进的分析、启发式和人工专家方法。这本书回顾了机器学习在系统范围内的模拟和运行时优化的应用,以及
数据派THU
2022-08-29
2670
【伯克利博士论文】高效、可扩展的视觉识别神经体系结构
来源:专知本文为论文,建议阅读5分钟在架构设计的各种目标中,效率和可扩展是两个重要的概念。 ConvNets和其他神经体系结构在计算机视觉方面的成功应用是过去十年人工智能革命的核心。对于可扩展视觉架构的强烈需求是既小又大。小型模型代表了对效率的需求,因为视觉识别系统通常部署在边缘设备上;大型模型强调了对可扩展性的追求——利用日益丰富的计算和数据实现更高精度的能力。这两个方向的研究都是卓有成效的,产生了许多有用的设计原则,对更多性能模型的追求从未停止。同时,文献中非常快的发展速度有时会掩盖某些方法取得良好结
数据派THU
2022-08-29
3060
独家 | 孟庆国:电子政务框架的顶层设计思路(附PPT下载)
本文长度为7500字,建议阅读12分钟 本文为你分享国家电子政务发展历程,及现阶段电子政务框架的顶层设计思路。 本文整理自2017年6月27日,由清华-青岛数据科学研究院主办,清数大数据产业联盟承办和中国科学技术产业化促进会指导发起的清华大数据“应用·创新”系列讲座之政府政务大数据。本期邀请的嘉宾是清华大学公共管理学院孟庆国教授,孟教授从国家层面的角度分享了政务数据信息共享开放的顶层设计。 以下是孟庆国教授关于政府政务的大数据的演讲内容精华: 后台回复关键词“清华大数据”,下载完整版PPT。 一、
数据派THU
2018-01-29
2.5K23
【独家】一文读懂大数据计算框架与平台
1. 前言 计算机的基本工作就是处理数据,包括磁盘文件中的数据,通过网络传输的数据流或数据包,数据库中的结构化数据等。随着互联网、物联网等技术得到越来越广泛的应用,数据规模不断增加,TB、PB量级成为常态,对数据的处理已无法由单台计算机完成,而只能由多台机器共同承担计算任务。而在分布式环境中进行大数据处理,除了与存储系统打交道外,还涉及计算任务的分工,计算负荷的分配,计算机之间的数据迁移等工作,并且要考虑计算机或网络发生故障时的数据安全,情况要复杂得多。 举一个简单的例子,假设我们要从销售记录中统计各种
数据派THU
2018-01-29
5.2K0
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档