首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Numpy库

它提供了多维数组对象以及各种派生对象(如掩码数组和矩阵),并包含大量用于快速数组操作的数学函数库。 基础知识 数组创建 NumPy的主要数据结构是ndarray,即同质的多维数组。...dtype:数据类型,NumPy支持多种数据类型。 数组索引与切片 NumPy支持对数组进行索引和切片操作,可以方便地访问和修改数组中的特定部分: 一维数组索引:使用正整数或负整数进行索引。...二维及多维数组索引:可以使用元组进行多维索引。 切片:使用冒号(:)进行切片,可以指定起始位置、结束位置和步长。...处理NaN值的函数:如nanmax()、nanmin()等,用于处理包含NaN值的数组操作。 如何在NumPy中实现矩阵分解算法?...调换x,y坐标:可以使用NumPy对图像进行坐标变换,例如交换图像的x坐标和y坐标。 添加mask:通过逻辑运算符对像素值进行掩码处理,可以实现特定区域的图像处理。

9510

数据科学 IPython 笔记本 7.5 数据索引和选择

作为一维数组的序列 Series建立字典式接口上,并通过与 NumPy 数组相同的基本机制,提供数组式的项目选择,即切片,掩码和花式索引。...例如,如果你的Series拥有显式的整数索引,那么索引操作如data[1]将使用显式索引,而切片操作如data[1:3]将使用隐式的 Python 风格索引。...使用iloc索引器,我们可以索引底层数组,好像它是一个简单的 NumPy 数组(使用隐式的 Python 风格索引),但结果中保留了DataFrame索引和列标签: data.iloc[:3, :2]...任何熟悉的 NumPy 风格的数据访问模式,都可以在这些索引器中使用。...,我建议花一些时间使用简单的DataFrame,并探索各种索引方法所允许的索引,切片,掩码和花式索引。

1.7K20
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    数据科学 IPython 笔记本 9.9 花式索引

    译者:飞龙 协议:CC BY-NC-SA 4.0 在前面的章节中,我们看到了如何使用简单的索引(例如,arr [0]),切片(例如,arr [:5])和布尔掩码来访问和修改数组的片段( 例如,arr...探索花式索引 花式索引在概念上很简单:它意味着传递索引数组来同时访问多个数组元素。...使用花式索引修改值 正如可以使用花式索引来访问数组的某些片段,它也可以用于修改数组的某些部分。...另一种本质上类似的方法是ufunc的reduceat()方法,你可以阅读 NumPy 文档。 示例:数据分箱 你可以使用这些想法有效地分割数据来手动创建直方图。...在数据密集型应用中有效使用 Python 的关键是,了解一般的便利例程,如np.histogram以及它们何时适用,但也知道如何在需要更精准的行为时使用更低级别的功能。

    63120

    Transformers 4.37 中文文档(二十)

    attention_mask(形状为(batch_size, sequence_length)的Numpy数组或tf.Tensor,可选)— 避免在填充标记索引上执行注意力的掩码。...attention_mask(形状为(batch_size, sequence_length)的Numpy 数组或tf.Tensor,可选)— 用于避免在填充标记索引上执行注意力的掩码。...attention_mask(形状为(batch_size, num_choices, sequence_length)的Numpy数组或tf.Tensor,可选)— 用于避免在填充标记索引上执行注意力的掩码...attention_mask(形状为(batch_size, sequence_length)的Numpy数组或tf.Tensor,可选)- 用于避免在填充标记索引上执行注意力的掩码。...可以是 jax.numpy.float32, jax.numpy.float16 (在 GPU 上), 和 jax.numpy.bfloat16 (在 TPU 上) 中的一个。

    35910

    【数据分析 | Numpy】Numpy模块系列指南(一),从设计架构说起

    数值计算、数学运算、逻辑运算等 索引和切片 Indexing and Slicing 用于访问和修改数组中的元素,可以通过索引、切片和布尔掩码进行操作。...处理形状不同的数组、矩阵运算等 线性代数 Linear Algebra 提供了线性代数运算的函数,如矩阵乘法、特征值分解、奇异值分解等。...处理结构化数据、数据库操作等 掩码数组 Masked Arrays 在数组中使用掩码标记无效或缺失的数据,进行计算时可以自动忽略掩码元素。...size 数组中元素的总数,等于各个维度大小的乘积。 itemsize 数组中每个元素的字节大小。例如,int64类型的元素占8个字节。...创建数组 当使用NumPy库处理数据时,有多种方法可以创建数组。

    19110

    【数据分析 | Numpy】Numpy模块系列指南(一),从设计架构说起

    数值计算、数学运算、逻辑运算等索引和切片 Indexing and Slicing 用于访问和修改数组中的元素,可以通过索引、切片和布尔掩码进行操作。...处理形状不同的数组、矩阵运算等线性代数 Linear Algebra 提供了线性代数运算的函数,如矩阵乘法、特征值分解、奇异值分解等。...处理结构化数据、数据库操作等 掩码数组 Masked Arrays 在数组中使用掩码标记无效或缺失的数据,进行计算时可以自动忽略掩码元素。...例如,int64类型的元素占8个字节。nbytes 数组中所有元素的总字节数,等于itemsize * size。 real 复数数组的实部。...data 数组的缓冲区,包含数组的实际元素。 创建数组当使用NumPy库处理数据时,有多种方法可以创建数组。

    19000

    Transformers 4.37 中文文档(三十)

    该论文的摘要如下: 开放域问答依赖于高效的段落检索来选择候选上下文,传统的稀疏向量空间模型,如 TF-IDF 或 BM25,是事实上的方法。...attention_mask(形状为(n_passages, sequence_length)的Numpy数组或tf.Tensor,可选)- 避免在填充标记索引上执行注意力的掩码。...attention_mask(形状为(batch_size, sequence_length)的Numpy数组或tf.Tensor,可选)- 用于避免在填充标记索引上执行注意力的掩码。...attention_mask(形状为(batch_size, sequence_length)的Numpy数组或tf.Tensor,可选)- 用于避免在填充标记索引上执行注意力的掩码。...attention_mask(形状为(batch_size, sequence_length)的Numpy数组或tf.Tensor,可选)- 避免在填充标记索引上执行注意力的掩码。

    59610

    张量的基础操作

    张量转换为 numpy 数组 Tensor.numpy 函数可以将张量转换为 ndarray 数组,但是共享内存,可以使用 copy 函数避免共享。...= tensor.numpy() print("Numpy array:", numpy_array) numpy 转换为张量 使用 from_numpy 可以将 ndarray 数组转换为 Tensor...在进行张量拼接时,需要特别注意以下几点: 确保所有张量在非拼接轴上的尺寸是相同的。 当使用 torch.stack() 时,被堆叠的张量必须具有相同的形状。...如果指定步长为2,如 t1[2:8:2],则会隔一个元素取一个,返回索引为2、4、6的元素形成的新张量。 高级索引:包括布尔索引和掩码索引等。...布尔索引允许根据一个布尔张量来选择数据,而掩码索引则使用一个具有相同形状的张量作为掩码来选择数据。

    19010

    Transformers 4.37 中文文档(五十五)

    attention_mask(形状为(batch_size, sequence_length)的Numpy 数组或tf.Tensor,可选)— 避免对填充标记索引执行注意力的掩码。...attention_mask(形状为(batch_size, sequence_length)的Numpy数组或tf.Tensor,可选) — 用于避免在填充标记索引上执行注意力的掩码。...attention_mask(形状为(batch_size, sequence_length)的Numpy 数组或tf.Tensor,可选)— 用于避免在填充标记索引上执行注意力的掩码。...attention_mask(形状为(batch_size, sequence_length)的Numpy数组或tf.Tensor,可选)— 用于避免在填充标记索引上执行注意力的掩码。...attention_mask(形状为(batch_size, sequence_length)的Numpy数组或tf.Tensor,可选)- 避免在填充标记索引上执行注意力的掩码。

    26910

    Transformers 4.37 中文文档(五十六)

    attention_mask(形状为(batch_size, sequence_length)的Numpy数组或tf.Tensor,可选)— 避免对填充标记索引执行注意力的掩码。...head_mask(形状为(num_heads,)或(num_layers, num_heads)的Numpy数组或tf.Tensor,可选)— 用于使自注意力模块的选定头部失效的掩码。...attention_mask(形状为(batch_size, sequence_length)的Numpy数组或tf.Tensor,可选)— 用于避免在填充令牌索引上执行注意力的掩码。...head_mask(形状为(num_heads,)或(num_layers, num_heads)的Numpy数组或tf.Tensor,可选)— 用于使自注意力模块的选定头部无效的掩码。...attention_mask(形状为(batch_size, sequence_length)的Numpy数组或tf.Tensor,可选) — 用于避免在填充标记索引上执行注意力的掩码。

    13310

    威斯康辛大学《机器学习导论》2020秋季课程完结,课件、视频资源已开放

    1.3 机器学习的类别:讨论了机器学习的三大类,监督学习、无监督学习和强化学习 1.4 符号:介绍了将在本课程中使用的机器学习形式和符号 1.5 ML 应用:走向机器学习程序的主要步骤,以及机器学习组件的分类...) 3.2 Python 设置:演示如何在 MacOS 上使用 Miniconda 安装 Python,另外提供了有关 conda 软件包管理器的简短演示 3.3 运行 Python 代码:演示运行 Python...代码的不同方式,包括 REPL、IPython、.py 脚本和 Visual Studio Code L04: Python 中的科学计算 4.1 NumPy 基础知识介绍 4.2 NumPy 数组的创建及索引...4.3 NumPy 数组的数学运算和通用函数 4.4 NumPy 的广播机制 4.5 NumPy 高级索引–内存视图和副本 4.6 NumPy 随机数生成器 4.7 重塑 NumPy 数组 4.8 NumPy...比较运算符和掩码 4.9 NumPy 线性代数基础 4.10 Matplotlib L05: 使用 Scikit-Learn 进行机器学习  5.1 从表格文本文件读取数据集 5.2 基本数据处理

    44410

    Transformers 4.37 中文文档(六十二)

    我们在一百种语言上训练了基于 Transformer 的掩码语言模型,使用了超过两太字节的经过滤波的 CommonCrawl 数据。...文本分类 一篇关于如何在 AWS 上使用 Habana Gaudi 对 XLM RoBERTa 进行多类别分类微调的博客文章 XLMRobertaForSequenceClassification...attention_mask(形状为(batch_size, sequence_length)的Numpy数组或tf.Tensor,可选)- 避免在填充标记索引上执行注意力的掩码。...attention_mask(形状为(batch_size, sequence_length)的Numpy数组或tf.Tensor,可选)— 用于避免在填充标记索引上执行注意力的掩码。...attention_mask(形状为(batch_size, sequence_length)的Numpy数组或tf.Tensor,可选)- 用于避免在填充标记索引上执行注意力的掩码。

    24610

    Numpy 修炼之道 (11)—— 掩码数组

    推荐阅读时间:8min~10min 文章内容:Numpy掩码数组(Numpy异常值、缺失值处理) 简介 有时候数据集中存在缺失、异常或者无效的数值,我们可以标记该元素为被屏蔽(无效)状态。...999999) >>> mx.mask array([False, False, False, True, False], dtype=bool) 只访问有效数据 当只想访问有效数据时,我们可以使用掩码的逆作为索引...可以使用numpy.logical_not函数或简单使用~运算符计算掩码的逆: >>> x = ma.array([[1, 2], [3, 4]], mask=[[0, 1], [1, 0]]) >>>...由于MaskedArray是numpy.ndarray的子类,它会继承其用于索引和切片的机制。...,访问单个条目将返回numpy.void对象(如果没有掩码),或者如果至少一个字段具有与初始数组相同的dtype的0d掩码数组的字段被屏蔽。

    1.7K40

    NumPy 1.26 中文官方指南(四)

    这被称为高级索引或“花式索引”。 沿轴 数组a的操作沿轴 n的行为就好像它的参数是数组a的切片数组,每个切片在轴n上具有连续索引。...与 Python 列表相反,ndarrays 是同质的。类型可能很复杂,如结构化数组,但所有元素都具有该类型。 NumPy 的对象数组,其中包含指向 Python 对象的引用,起到异构数组的作用。...矩阵 NumPy 的二维矩阵类不应再使用;请使用常规 ndarrays。 ndarray NumPy 的基本结构。...对于 N 维数组,其strides属性是一个 N 元素元组;从索引i向轴n上的索引i+1前进意味着在地址上添加a.strides[n]个字节。...性能改进 NumPy 数组整数除法性能改进 优化np.save和np.load在小数组上的性能 更改 numpy.piecewise 的输出类现在与输入类匹配 启用 Accelerate

    12810

    【踩坑】pytorch中的索引与copy_结合不会复制数据及其解决方案

    PyTorch和Numpy中的情况:在通过索引访问张量的内容时,PyTorch 遵循 Numpy 的行为,即基本索引返回视图,而高级索引返回副本。通过基本索引或高级索引进行的赋值都是原地操作。...切片():切片由中括号和冒号组成,如[:10]、[2:10]、[2:]。基本索引:使用整数或切片来访问数组的元素。高级索引:指的是使用整数数组、布尔数组或者其他序列来访问数组的元素。...相比于基本索引,高级索引可以访问到数组中的任意元素,并且可以用来对数组进行复杂的操作和修改。​...(a) # 输出: tensor([10, 2, 3, 4])高级索引返回副本高级索引包括使用布尔数组、整数数组或多维索引。...PyTorch和NumPy一样,高级索引会返回一个新的张量,即副本,不与原始数据共享内存。因此,对副本的修改不会影响原始张量。

    16410

    Transformers 4.37 中文文档(二十六)

    attention_mask(形状为(batch_size, sequence_length)的Numpy数组或tf.Tensor,可选)— 用于避免在填充标记索引上执行注意力的掩码。...attention_mask(形状为(batch_size, sequence_length)的Numpy数组或tf.Tensor,可选)- 用于避免在填充标记索引上执行注意力的掩码。...attention_mask(形状为(batch_size, num_choices, sequence_length)的Numpy数组或tf.Tensor,可选)- 用于避免在填充标记索引上执行注意力的掩码...attention_mask(形状为(batch_size, sequence_length)的Numpy 数组或tf.Tensor,可选) - 用于避免在填充标记索引上执行注意力的掩码。...attention_mask(形状为(batch_size, sequence_length)的Numpy数组或tf.Tensor,可选)- 用于避免在填充标记索引上执行注意力的掩码。

    29510

    Transformers 4.37 中文文档(三十三)4-37-中文文档-三十三-

    attention_mask(形状为(batch_size, sequence_length)的Numpy数组或tf.Tensor,可选)— 用于避免在填充标记索引上执行注意力的掩码。...lengths(形状为(batch_size,)的tf.Tensor或Numpy数组,可选)— 每个句子的长度,可用于避免在填充标记索引上执行注意力。...head_mask(形状为(num_heads,)或(num_layers, num_heads)的Numpy数组或tf.Tensor,可选)— 用于使自注意力模块的选定头部失效的掩码。...attention_mask(形状为(batch_size, sequence_length)的Numpy 数组或tf.Tensor,可选) - 用于避免在填充标记索引上执行注意力的掩码。...attention_mask(形状为(batch_size, sequence_length)的Numpy数组或tf.Tensor,可选)- 用于避免在填充标记索引上执行注意力的掩码。

    28910

    数据科学 IPython 笔记本 7.7 处理缺失数据

    在掩码方法中,掩码可以是完全独立的布尔数组,或者它可以在数据表示中占用一个比特,在本地表示值的空状态。...这些方法都没有权衡:使用单独的掩码数组需要分配额外的布尔数组,这会增加存储和计算的开销。标记值减少了可以表示的有效值的范围,并且可能需要 CPU 和 GPU 算法中的额外(通常是非最优的)逻辑。...此外,对于较小的数据类型(例如 8 位整数),牺牲一个位用作掩码,将显着减小它可以表示的值的范围。 NumPy 确实支持掩码数组吗?...检测控制 Pandas 数据结构有两种有用的方法来检测空数据:isnull()和notnull()。任何一个都返回数据上的布尔掩码。...数据索引和选择”中所述,布尔掩码可以直接用作Series或DataFrame的索引: data[data.notnull()] ''' 0 1 2 hello dtype: object

    4.1K20
    领券