首页
学习
活动
专区
工具
TVP
发布

数据派THU

专栏作者
2139
文章
1950823
阅读量
188
订阅数
独家 | 在一个4GBGPU上运行70B大模型推理的新技术
大语言模型通常需要较大的GPU内存。那能不能在单个GPU上运行推理?如果可以,那么所需的最小GPU内存又是多少?
数据派THU
2024-01-07
7010
【ICML2021】随机森林机器遗忘
来源:专知 本文约1000字,建议阅读5分钟 在本文中,我们引入了数据移除(DaRE)森林,这是随机森林的一种变体,可以在最少的再训练的情况下删除训练数据。 考虑到用户数据删除请求、删除噪声的示例或删除损坏的训练数据,这只是希望从机器学习(ML)模型中删除实例的几个原因。然而,从ML模型中有效地删除这些数据通常是困难的。在本文中,我们引入了数据移除(DaRE)森林,这是随机森林的一种变体,可以在最少的再训练的情况下删除训练数据。森林中每棵DaRE树的模型更新都是精确的,这意味着从DaRE模型中删除实例产生
数据派THU
2023-03-29
1960
【2022新书】有趣的数据结构
来源:专知本文为书籍介绍,建议阅读5分钟理解数据结构如何起作用对于有效地使用它们至关重要。 这本通俗易懂且有趣的书通过数据结构的视角深入介绍了计算思维——数据结构是任何编程工作的关键组成部分。通过图表、伪代码和幽默的类比,你将了解数据结构如何驱动算法操作,不仅可以了解如何构建数据结构,还可以了解如何以及何时使用它们。 本书将为你提供15种以上关键数据结构的实现和使用的强大背景知识,从栈、队列、缓存到布隆过滤器、跳跃表和图。通过在咖啡馆排队来掌握链表,通过编目夏季奥运会的历史来掌握散列表,通过整齐地整理厨房
数据派THU
2022-09-02
3630
【2022新书】可扩展系统的基础设计:分布式架构
来源:专知本文为书籍推荐,建议阅读5分钟这本实用的书涵盖了一些设计方法和技术,这些方法和技术使得快速且经济有效地扩展应用程序成为可能。 在许多系统中,随着用户基数的增长,可扩展性成为主要的驱动因素。吸引人的特点和高实用性带来了成功,也带来了更多的处理请求和更多的数据管理。但是当在轻负荷下有意义的设计决策突然变成技术债务时,组织就会到达一个临界点。这本实用的书涵盖了一些设计方法和技术,这些方法和技术使得快速且经济有效地扩展应用程序成为可能。 作者Ian Gorton带领软件架构师和开发人员了解基本分布式系统
数据派THU
2022-08-29
2830
用什么tricks能让模型训练得更快?先了解下这个问题的第一性原理
来源:机器之心本文约5200字,建议阅读10+分钟深度学习是门玄学?也不完全是。 每个人都想让模型训练得更快,但是你真的找对方法了吗?在康奈尔大学本科生、曾在 PyTorch 团队实习的 Horace He 看来,这个问题应该分几步解决:首先,你要知道为什么你的训练会慢,也就是说瓶颈在哪儿,其次才是寻找对应的解决办法。在没有了解基本原理(第一性原理)之前就胡乱尝试是一种浪费时间的行为。 在这篇文章中,Horace He 从三个角度分析可能存在的瓶颈:计算、内存带宽和额外开销,并提供了一些方式去判断当前处于哪
数据派THU
2022-04-13
5290
独家 | Deepnote测评:数据科学家的新IDE
Deepnote是一个免费的在线数据科学集成开发环境(onlinedata science notebook),主要关注多人协作(实时的、像谷歌文档一样的协作类型)以及工作中所有概念的抽象——环境和基础配置。
数据派THU
2020-11-03
1.3K0
独家 | 如何用简单的Python为数据科学家编写Web应用程序?(附代码&链接)
作者:拉胡尔·阿加瓦尔(Rahul Agarwal), Walmart 实验室的数据科学家
数据派THU
2019-12-05
1.8K0
数据蒋堂 | 大清单报表应当怎么做?
本文共1200字,建议阅读9分钟。 在数据查询时,有时会碰到数据量很大的清单报表。
数据派THU
2019-11-11
7310
没有更多了
社区活动
RAG七天入门训练营
鹅厂大牛手把手带你上手实战,赢鹅厂证书、公仔好礼!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档