首页
学习
活动
专区
工具
TVP
发布

数据派THU

专栏作者
2138
文章
1932190
阅读量
188
订阅数
50个常用的 Numpy 函数详解
来源:CDA数据分析师 本文约7500字,建议阅读15分钟 在本文中,将介绍NumPy在数据科学中最重要和最有用的一些函数。 Numpy是python中最有用的工具之一。它可以有效地处理大容量数据。使用NumPy的最大原因之一是它有很多处理数组的函数。在本文中,将介绍NumPy在数据科学中最重要和最有用的一些函数。 创建数组 1、Array 它用于创建一维或多维数组 numpy.array(object, dtype=None, *, copy=True, order='K'
数据派THU
2023-05-18
8090
60行NumPy手搓GPT
本文约24000字,建议阅读30分钟 本文我们将仅仅使用60行Numpy[6],从0-1实现一个GPT。 本文原载于尹志老师博客:https://jiqihumanr.github.io/2023/04/13/gpt-from-scratch/[1]。 本文还是来自Jay Mody[2],那篇被Andrej Karpathy手动点赞[3]的GPT in 60 Lines of NumPy[4](已获原文作者授权)。 LLM大行其道,然而大多数GPT模型都像个黑盒子一般隐隐绰绰,甚至很多人都开始神秘化这个技术
数据派THU
2023-05-11
5870
美化Matplotlib的3个小技巧
来源:DeepHub IMBA 本文约2300字,建议阅读5分钟 本文中,我们将介绍3个可以用于定制Matplotlib图表的技巧 Matplotlib是Python的数据可视化库的基础。它是其他可视化工具(如Seaborn)的基础。 Matplotlib提供了很大的灵活性,因此您可以自定义或调整几乎所有的图表。但是想要完全控制可视化就需要编写更多的代码。 在本文中,我们将介绍3个可以用于定制Matplotlib图表的技巧: 减少x轴或y轴上的刻度数 添加一个辅助y轴 共享x轴的子图坐标对齐 本文中我们将
数据派THU
2022-10-09
2.1K0
使用内存映射加快PyTorch数据集的读取
来源:DeepHub IMBA本文约1800字,建议阅读9分钟本文将介绍如何使用内存映射文件加快PyTorch数据集的加载速度。 在使用Pytorch训练神经网络时,最常见的与速度相关的瓶颈是数据加载的模块。如果我们将数据通过网络传输,除了预取和缓存之外,没有任何其他的简单优化方式。 但是如果数据本地存储,我们可以通过将整个数据集组合成一个文件,然后映射到内存中来优化读取操作,这样我们每次文件读取数据时就不需要访问磁盘,而是从内存中直接读取可以加快运行速度。 什么是内存映射文件 内存映射文件(memory-
数据派THU
2022-08-29
8160
JAX介绍和快速入门示例
来源:DeepHub IMBA本文约3300字,建议阅读10+分钟本文中,我们了解了 JAX 是什么,并了解了它的一些基本概念。 JAX 是一个由 Google 开发的用于优化科学计算Python 库: 它可以被视为 GPU 和 TPU 上运行的NumPy , jax.numpy提供了与numpy非常相似API接口。 它与 NumPy API 非常相似,几乎任何可以用 numpy 完成的事情都可以用 jax.numpy 完成。 由于使用XLA(一种加速线性代数计算的编译器)将Python和JAX代码JI
数据派THU
2022-06-16
1.7K0
TensorFlow和Pytorch中的音频增强
来源:Deephub Imba本文约2100字,建议阅读9分钟本文将介绍如何将增强应用到 TensorFlow 中的数据集的两种方法。 对于图像相关的任务,对图像进行旋转、模糊或调整大小是常见的数据增强的方法。因为图像的自身属性与其他数据类型数据增强相比,图像的数据增强是非常直观的,我们只需要查看图像就可以看到特定图像是如何转换的,并且使用肉眼就能对效果有一个初步的评判结果。尽管增强在图像域中很常见,但在其他的领域中也是可以进行数据增强的操作的,本篇文章将介绍音频方向的数据增强方法。 在这篇文章中,将介绍
数据派THU
2022-04-11
1K0
独家 | 主成分分析用于可视化(附链接)
作者:Adrian Tam, Ray Hong, Jinghan Yu, Brendan Artley 翻译:汪桉旭校对:吴振东 本文约3300字,建议阅读5分钟本文教你了解了如何使用主成分分析来可视化数据。 标签:主成分分析 主成分分析是一种无监督的机器学习技术。可能它最常见的用处就是数据的降维。主成分分析除了用于数据预处理,也可以用来可视化数据。一图胜万言。一旦数据可视化,在我们的机器学习模型中就可以更容易得到一些洞见并且决定下一步做什么。 在这篇教程中,你将发现如何使用PCA可视化数据,并且使用可视化
数据派THU
2022-03-14
5320
2022年,我该用JAX吗?GitHub 1.6万星,这个年轻的工具并不完美
来源:机器之心本文约4600字,建议阅读10+分钟你有在使用JAX吗? 近年来,谷歌于 2018 年推出的 JAX 迎来了迅猛发展,很多研究者对其寄予厚望,希望它可以取代 TensorFlow 等众多深度学习框架。但 JAX 是否真的适合所有人使用呢?这篇文章对 JAX 的方方面面展开了深入探讨,希望可以给研究者选择深度学习框架时提供有益的参考。 自 2018 年底推出以来,JAX 的受欢迎程度一直在稳步提升。2020 年,DeepMind 宣布使用 JAX 来加速其研究。越来越多来自谷歌大脑(Google
数据派THU
2022-03-04
5420
Pandas进阶修炼120题,给你深度和广度的船新体验
本文为你介绍Pandas基础、Pandas数据处理、金融数据处理等方面的一些习题。
数据派THU
2020-07-17
6K0
60分钟入门PyTorch,官方教程手把手教你训练第一个深度学习模型(附链接)
近期的一份调查报告显示:PyTorch 已经力压 TensorFlow 成为各大顶会的主流深度学习框架。想发论文,不学 PyTorch 怎么行?那么,入门 PyTorch 深度学习需要多久?PyTorch 的一份官方教程表示:只需要 60 分钟。
数据派THU
2019-10-22
1.1K0
独家 | 10 个简单小窍门带你提高Python数据分析速度(附代码)
提示和技巧总是非常有用的,在编程领域更是如此。有时候,小小的黑科技可以节省你大量的时间和精力。一个小的快捷方式或附加组件有时会是天赐之物,可以成为实用的效率助推器。所以,我在这里介绍下自己编程时最喜欢使用的一些提示和技巧,在这篇文章中汇总起来呈现给大家。有些可能是大家熟悉的,而有些可能是新鲜的,我相信它们会为你下一次处理数据分析的项目时提供便利。
数据派THU
2019-07-17
9040
独家 | 构建端到端数据科学项目,从我的Data Scientist Ideal Profiles项目中学习(附链接)
翻译:张睿毅 校对:吴金笛 本文约1500字,建议阅读5分钟。 本文为你介绍了构建数据科学项目中重要的思维能力及训练建议。 Joseph Barrientos 拍照于 Unsplash (链接:ht
数据派THU
2019-06-18
5190
独家 | 基于Python实现交互式数据可视化的工具(用于Web)
这学期(2018学年春季学期)我教授了一门关于数据可视化的数据科学硕士课程。我们的数据科学硕士项目是一个为期15个月的强化项目,这个项目已经成功地培养了许多优秀的数据科学家。
数据派THU
2019-05-15
2K0
深度好文 | Matplotlib 可视化最有价值的 50 个图表(附完整 Python 源代码)
在数据分析和可视化中最有用的 50 个 Matplotlib 图表。 这些图表列表允许您使用 python 的 matplotlib 和 seaborn 库选择要显示的可视化对象。
数据派THU
2019-05-09
1.6K0
教你用Python解锁“吃鸡”的正确姿势!
本文用Python分析吃鸡比赛的真实数据,解答至关重要的9个问题,助你提高吃鸡概率。
数据派THU
2018-08-14
9860
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档