首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

NumPy基础

数组拼接和分裂    三、数组计算:通用函数四、聚合五、数组计算:广播六、比较、掩码布尔逻辑1. 比较2. 操作布尔数组3....将布尔数组作为掩码    七、花哨索引八、数组排序 [ NumPy version: 1.18.1 ]  import numpy as np 一、创建数组  # 1.从python列表创建数组 #...:  数组归一化二维函数可视化  六、比较、掩码布尔逻辑  1....将布尔数组作为掩码  # 利用比较运算符得到布尔数组,通过索引将特定值选出,即掩码操作 x < 5         #输出布尔数组 x[x < 5]     #输出满足条件值 # 构建掩码 rainy...np.sort(x) # 用排好数组替代原始数组 x.sort() # 函数argsort返回是原始数组排好索引值 i = np.argsort(x) # 索引值可用于通过花哨索引创建有序数组

1.2K30
您找到你想要的搜索结果了吗?
是的
没有找到

MOMENT:CMU发布首个开源时间序列基础大模型

在预训练期间,通过使用特殊掩码嵌入[MASK]来替换 patches 嵌入,从而均匀随机地对 patches 进行掩码。...具体来说,研究者在所有91个时间序列数据集上运行分类实验,每个时间序列长度不超过512个时间步长。对于异常检测,在选择时间序列子集时,优先考虑了 UCR 异常归档中不同领域和数据源覆盖情况。...在 UCR 异常检测档案中44个时间列上,MOMENT 在零样本和线性探测配置下,始终优于 TimesNet 和 GPT4TS,以及两种专为异常检测定制最先进深度学习模型。 插补。...研究者使用时间序列堆栈和这些策略来预训练三种不同大小转换器模型。...在论文中,研究者强调对时间序列数据进行大规模、多数据集预训练,对隐含时间序列特征(如趋势和频率)进行编码,并展示了这种方法好处。

78110

Python入门教程(六):Numpy计算之布尔运算

什么是布尔掩码布尔掩码是基于规则来抽取,修改,计数或者对一个数组中值进行其他操作,例如,统计数组中有多少大值于某一个值给定值,或者删除某些超出门限异常值。...计算上述问题呢,我们可以使用通用传统计算方式实现,即对所有数据循环,当碰到数据落在我们希望区间时计数器加1。这种方法从计算结果角度看,不仅浪费时间而且效率极低。...(2 * x) == (x ** 2) # array([False, True, False, False, False], dtype=bool) 如下表所示,我们对不同类型布尔运算进行了总结。...下表总结了逐位布尔运算和其对应通用函数。 ? 利用这些工具,就可以回答那些天气数据问题了。以下数据是结合使用掩码和聚合实现计算结果。...布尔数组可以作为掩码,可以通过该掩码选择数据子数组。

3.9K20

数据科学 IPython 笔记本 9.8 比较,掩码布尔逻辑

9.8 比较,掩码布尔逻辑 本节是《Python 数据科学手册》(Python Data Science Handbook)摘录。...译者:飞龙 协议:CC BY-NC-SA 4.0 本节介绍如何使用布尔掩码,来检查和操作 NumPy 数组中值。...在 NumPy 中,布尔掩码通常是完成这些类型任务最有效方法。 示例:统计雨天 想象一下,你有一系列数据表示某一城市一年中每天降水量。...挖掘数据 一种方法是手动回答这些问题:遍历数据,每当我们看到某个所需范围内值时,递增计数器。由于本章讨论原因,从编写代码时间和计算结果时间角度来看,这种方法效率非常低。...更强大模式是将布尔数组用作掩码,来选择数据本身特定子集。

97810

张量基础操作

例如,零阶张量是一个标量,一阶张量是一个向量,二阶张量是一个矩阵,三阶及以上张量则可以看作是高维数组。 在不同上下文中,张量意义可能会有所不同: 数据表示:在深度学习中,张量通常用于表示数据。...如果指定步长为2,如 t1[2:8:2],则会隔一个元素取一个,返回索引为2、4、6元素形成新张量。 高级索引:包括布尔索引和掩码索引等。...布尔索引允许根据一个布尔张量来选择数据,而掩码索引则使用一个具有相同形状张量作为掩码来选择数据。...负数步长:在Python传统列表中,步长可以为负数,表示倒排列。但在张量中,步长必须大于0,否则会报错。这意味着不能使用负数步长来逆序索引张量元素。...布尔索引:布尔索引是使用一个与目标张量形状相同布尔张量来选择元素。在布尔张量中,True值对应位置元素会被选中并组成一个新张量。

8310

select、poll、epoll之间区别总结

(5)__pollwait主要工作就是把current(当前进程)挂到设备等待队列中,不同设备有不同等待队列,对于tcp_poll来说,其等待队列是sk->sk_sleep(注意把进程挂到等待队列中并不代表进程已经睡眠了...(6)poll方法返回时会返回一个描述读写操作是否就绪mask掩码,根据这个mask掩码给fd_set赋值。...当设备驱动发生自身资源可读写后,会唤醒其等待队列上睡眠进程。...如果超过一定超时时间(schedule_timeout指定),还是没人唤醒,则调用select进程会重新被唤醒获得CPU,进而重新遍历fd,判断有没有就绪fd。...虽然都要睡眠和交替,但是select和poll在“醒着”时候要遍历整个fd集合,而epoll在“醒着”时候只要判断一下就绪链表是否为空就行了,这节省了大量CPU时间

97320

Numpy广播功能

数组计算:广播广播介绍广播规则广播实际应用比较,掩码布尔逻辑比较操作操作布尔数组将布尔数组作为掩码 《Python数据科学手册》读书笔记 数组计算:广播 另外一种向量化操作方法是利用 NumPy...b array([, , ]) 广播允许这些二进制操作可以用于不同大小数组。...如果两个数组维度数不同,那么小维度数组形状将会在最左边补1 如果两个数组形状在任何一个维度都不匹配,那么数组形状将会沿着维度为1维度扩展以匹配另外一个数组形状 如果两个数组形状在任何一个维度都不匹配并且没有任何一个维度等于...np.bitwise_or ~ np.bitwise_not 将布尔数组作为掩码 一种更强大模式是使用布尔数组作为掩码, 通过该掩码选择数据子数据集。..., 即掩码操作: # 将小于5值从数组中筛选出来 x[x < ] array([, , , , , ]) and和or对整个对象执行单个布尔运算,而&和|对一个对象内容执行多个布尔运算,对于Numpy

1.8K20

几个高效Pandas函数

这篇文章将会配合实例,讲解10个重要pandas函数。其中有一些很常用,相信你可能用到过。还有一些函数出现频率没那么高,但它们同样是分析数据得力帮手。...Query Query是pandas过滤查询函数,使用布尔表达式来查询DataFrame列,就是说按照列规则进行过滤操作。...「掩码」(英语:Mask)在计算机学科及数字逻辑中指的是一串二进制数字,通过与目标数字按位操作,达到屏蔽指定位而实现需求。 6....比如说dataframe中某一行其中一个元素包含多个同类型数据,若想要展开成多行进行分析,这时候explode就派上用场,而且只需一行代码,非常节省时间。...Nunique 注意:nunique()与unique()方法不同。 Nunique用于计算行或列上唯一值数量,即去重后计数。

1.5K60

100万token,一次能分析1小时YouTube视频,「大世界模型」火了

视频模型出现在一定程度上缓解了这个问题,其能提供语言和静态图像中所缺少时间信息,这种信息对 LLM 非常有价值。随着技术进步,模型开始变得对文本知识和物理世界有了更好理解,从而帮助人类。...(b) 为了克服视觉 - 语言训练带来挑战,该研究采取了以下措施,包括使用掩码序列以混合不同长度序列、损失加权以平衡语言和视觉、以及使用模型生成问答数据来处理长序列对话。...(c) 通过 RingAttention、掩码序列打包等方法,可以训练数百万长度多模态序列。...LWM 模型整体架构如下图 4 所示,总体上讲是一个数百万长度 token 序列上自回归 transformer。...输入和输出顺序反映了不同训练数据格式,包括图像 - 文本、文本 - 图像、视频、文本 - 视频和纯文本格式。

18110

PyTorch入门笔记-masked_select选择函数

masked_select torch.masked_select(input,mask,out=None) 函数返回一个根据布尔掩码 (boolean mask) 索引输入张量 1D 张量,其中布尔掩码和输入张量就是...) - 要进行索引布尔掩码 out(Tensor, optional) - 指定输出张量。...比如执行 torch.zeros([2, 2], out = tensor_a),相当于执行 tensor_a = torch.zeros([2, 2]); 「masked_select 函数最关键参数就是布尔掩码...比如对于两个张量来说: 如果两个张量维度不同,则将维度小张量进行扩展,直到两个张量维度一样; 如果两个张量在对应维度上长度相同或者其中一个张量长度为 1,那么就说这两个张量在该维度上是相容...布尔张量第二个维度上长度为 1,同样在第二个维度上也相同; 布尔张量两个维度上都是相容,因此布尔张量可以进行广播; 在布尔张量第二个维度上进行复制,最终布尔张量为: 将输入张量和广播后布尔张量一一对应

3.8K20

6-比较掩码布尔

比较 布尔逻辑 本节介绍了使用布尔掩码来检查和操作NumPy数组中值。...在NumPy中,布尔掩码通常是完成这些类型任务最有效方法。 计算下雨天例子 在这里,我们将使用Pandas加载2014年西雅图市每日降雨量统计信息(每天降水量) #!...挖掘详细数据 一种解决方法是手动解决这些问题:遍历数据,每当我们看到某个所需范围内值时就增加一个计数器。出于本章所讨论原因,从时间和计算结果角度来看,这种方法都效率很低。...它们语法与NumPy版本语法不同,特别是在多维数组上使用时,将失败或产生意外结果。对于这些示例,请确保使用np.sum(),np.any()和np.all()!...一种更强大模式是使用布尔数组作为掩码,以选择数据本身特定子集。

1.4K00

Deep learning with Python 学习笔记(6)

在处理两个不同独立序列(比如两条不同 IMDB 评论)之间,RNN 状态会被重置,因此,你仍可以将一个序列看作单个数据点,即网络单个输入。...Keras 中所有循环层一样,SimpleRNN 可以在两种不同模式下运行:一种是返回每个时间步连续输出完整序列,即形状为 (batch_size, timesteps, output_features...dropout 正则化堆叠 GRU 模型,性能再次提高,但是依旧不是很好 注意:想要在循环网络中使用 dropout,你应该使用一个不随时间变化 dropout 掩码与循环 dropout 掩码...可见,逆序数据之后,模型性能与正几乎没有改变,这证明一个假设:虽然单词顺序对于理解语言很重要,但使用哪种顺序并不重要。重要是,在逆序序列上训练RNN学到表示不同于在原始序列上学到表示。...RNN 正是利用这个想法来提高正 RNN 性能,它从两个方向查看数据,从而得到更加丰富表示,并捕捉到仅使用正 RNN 时可能忽略一些模式 ?

65320

数据科学 IPython 笔记本 7.7 处理缺失数据

掩码方法中,掩码可以是完全独立布尔数组,或者它可以在数据表示中占用一个比特,在本地表示值空状态。...这些方法都没有权衡:使用单独掩码数组需要分配额外布尔数组,这会增加存储和计算开销。标记值减少了可以表示有效值范围,并且可能需要 CPU 和 GPU 算法中额外(通常是非最优)逻辑。...也就是说,附加了一个独立布尔掩码数组数组,用于将数据标记为“好”或“坏”。Pandas 可能源于此,但是存储,计算和代码维护开销,使得这个选择变得没有吸引力。...他们是: isnull(): 生成表示缺失值布尔掩码 notnull(): isnull()反转 dropna(): 返回数据过滤后版本 fillna(): 返回数据副本,填充了缺失值 我们将结束本节...检测控制 Pandas 数据结构有两种有用方法来检测空数据:isnull()和notnull()。任何一个都返回数据上布尔掩码

4K20

SIGIR2023 | 基于MAE序列推荐新范式

这一任务要求模型能够在用户商品序列中捕捉商品转移特征,以此提取随时间变化用户兴趣。...为了进一步优化数据增强鲁棒性并解决前文提到问题,MAERec 采用了一种可学习掩码(learning to mask)自适应掩码机制。...该方法基于商品表征及全局商品-商品图计算一组图局部相关性分数,同时嵌入耿贝尔分布噪声,以此作为掩码概率,并构建基于互信息最大化掩码损失函数来根据下游推荐任务动态调整掩码策略。...,结果如下: (不同序列长度(稀疏度)下模型效果) (不同噪声比例下模型效果) 文中还进行了其他多项实验,表明了模型各核心组件有效性,详细结果及分享请参考原文。...这将有助于解决顺序推荐中训练和测试数据之间数据分布转移问题,并强化模型在包含新商品列上表现能力。

26310

中秋节祝福程序源代码分享:土地分类数据阈值筛选和重投影分类

参与国数量随着时间推移而增加,目前包括33个(EEA)成员国和6个合作国(EEA39),总面积超过580万平方公里。...CLC基本技术参数(即44个等级命名、25公顷最小测绘单位(MMU)和100米最小测绘宽度)从一开始就没有改变,因此,不同清册结果是可以比较。 每项资产所涵盖时间段为。...投影坐标与基础坐标系之间转换,以2x3仿射转换矩阵形式,按行主指定。...还原器输入权重将是输入掩码与输入像素所覆盖输出像素部分乘积。 参数。 this:image(图像)。 输入图像。 reducer (减速器)。 要应用还原器,用于合并像素。...bestEffort(布尔值,默认:false)。 如果在默认分辨率下使用输入图像需要太多像素,那么就从一个允许操作成功金字塔级别的已经被还原输入像素开始。

7910

Python 数据处理:Pandas库使用

你可以传入排好字典键以改变顺序: # 在这个例子中,sdata中跟states索引相匹配那3个值会被找出来并放到相应位置上, # 但由于 "California" 所对应sdata值找不到...,它含有一组有序列,每列可以是不同值类型(数值、字符串、布尔值等)。...NumPyMaskedArray 类似于“二维ndarray”情况,只是掩码值在结果DataFrame会变成NA/缺失值 如果设置了DataFrameindex和columnsname属性...: 方法 描述 isin 计算一个表示“Series各值是否包含于传入值序列中”布尔型数组 match 计算一个数组中各值到另一个不同值数组整数索引;对于数据对齐和连接类型操作十分有用 unique...后面的频率值是每个列中这些值相应计数。

22.6K10

一文搞懂select、poll和epoll区别

同时处理流越多,无差别轮询时间越长 - O(n)。 当socket较多时,每次select都要通过遍历FD_SETSIZE个socket,不管是否活跃,这会浪费很多CPU时间。...(5)__pollwait主要工作就是把current(当前进程)挂到设备等待队列中,不同设备有不同等待队列,对于tcp_poll来说,其等待队列是sk->sk_sleep(注意把进程挂到等待队列中并不代表进程已经睡眠了...(6)poll方法返回时会返回一个描述读写操作是否就绪mask掩码,根据这个mask掩码给fd_set赋值。...当设备驱动发生自身资源可读写后,会唤醒其等待队列上睡眠进程。...,当设备就绪,唤醒等待队列上等待者时,就会调用这个回调函数,而这个回调函数会把就绪fd加入一个就绪链表)。

72720

python3--IO模型,阻塞,非阻塞,多路复用,异步,selectors模块

“线程池”旨在减少创建和销毁线程频率,其维持一定合理数量 线程,并让空闲线程重新承担新执行任务。“连接池”维持连接缓存池,尽量重用已有的连接、减少创建和关闭连接 频率。...任务完成响应延迟增大了,因为每过一段时间才去轮询一次read操作,而任务可能在两次轮询之间任意时间完成。    这会导致整体数据吞吐量降低。...timeout参数为超时时间,该结构会被内核修改,其值为超时剩余时间。...(6)poll方法返回时会返回一个描述读写操作是否就绪mask掩码,根据这个mask掩码给fd_set赋值。...当设备驱动发生自身资源可读写后,会唤醒其等待队列上睡眠进程。

1.1K20

树上莫队算法

我们从一道题目入手[SDOI2018]原题识别 SPOJ Count on a tree II 题目意思很明确:给定一个$n$个节点树,每个节点表示一个整数,问$u$到$v$路径上有多少个不同整数...像这种不带修改数颜色题首先想到肯定是树套树莫队,那么如何把在序列上莫队搬到树上呢?...算法 欧拉 我们考虑用什么东西可以把树上问题转化到序列上,dfs是可以,但是这道题不行(无法搞lca贡献) 有一种神奇东西,叫做欧拉。...我们考虑我们要解决问题:求$x$到$y$路径上有多少个不同整数 这里我们设$st[i]$表示访问到$i$时加入欧拉时间,$ed[i]$表示回溯经过$i$时加入欧拉时间 不妨设$st[x]<...,y) \not = x$,此时$x,y$位于不同子树内,我们只需要按照上面的方法统计$ed[x]$到$st[y]$这段区间内点。

62430
领券