在2Dnumpy数组中创建作为group-by样式查找的字典的最快方法？

在2D NumPy数组中创建作为group-by样式查找的字典的最快方法是使用numpy.unique函数和numpy.split函数结合。

首先，使用numpy.unique函数找到数组中的唯一值，并返回一个有序的数组。然后，使用numpy.split函数将原始数组拆分成多个子数组，其中每个子数组都包含相同的唯一值。接下来，使用字典推导式将唯一值作为键，将对应的子数组作为值创建字典。

下面是一个示例代码：

import numpy as np

def create_groupby_dict(arr):
    unique_vals = np.unique(arr[:, 0])  # 找到第一列的唯一值
    split_arrs = np.split(arr[:, 1:], np.where(np.diff(arr[:, 0]) != 0)[0]+1)  # 根据第一列的唯一值进行拆分
    groupby_dict = {val: split_arr for val, split_arr in zip(unique_vals, split_arrs)}  # 创建字典
    return groupby_dict

# 示例用法
arr = np.array([[1, 2, 3],
                [1, 4, 5],
                [2, 6, 7],
                [2, 8, 9]])

result = create_groupby_dict(arr)
print(result)

输出结果为：

{1: array([[2, 3],
           [4, 5]]), 
 2: array([[6, 7],
           [8, 9]])}

在这个例子中，我们创建了一个2D NumPy数组arr，并且以第一列的值进行分组。最终，我们得到一个字典，其中键为唯一的第一列的值，值为相应的子数组。

请注意，这种方法假设数组已经按照group-by的列进行排序。如果数组未排序，可以使用numpy.argsort函数对数组进行排序，以确保正确的分组。

这里没有提及任何云计算品牌商的相关产品和链接地址。如果您有关于其他云计算问题的咨询，欢迎继续提问。

相关·内容

Kylin、Druid、ClickHouse该如何选择？

Kylin小结适用于聚合查询场景；因为数据预聚合，Kylin可以说是最快的查询引擎（group-by查询这样的复杂查询，可能只需要扫描1条数据）；Kylin查询效率取决于是否命中CuboId，查询波动较大...pv的索引通过索引在pv列中查找到相应的行，并做agg 后续计算 3....Druid小结 Druid适用于聚合查询场景但是不适合有超高基维度的场景；存储全维度group-by后的数据，相当于只存储了Kylin Cube的Base-CuboID；每个维度都有创建索引，所以每个查询都很快...mark’s number集合（即数据block集合）在上一步骤中的block中，在date和city列中查找对应的值的行号集合，并做交集，确认行号集合将行号转换为mark’s number和offset...对于反向查找，只有在查找条件匹配最左前缀的时候，才能剪枝掉大量数据，其它时候并不高效。 2.

1.1K2 0

Klin、Druid、ClickHouse核心技术对比

KYLIN小结：适用于聚合查询场景；因为数据预聚合，Kylin可以说是最快的查询引擎（group-by查询这样的复杂查询，可能只需要扫描1条数据）；kylin查询效率取决于是否命中CuboId，查询波动较大...pv的索引通过索引在pv列中查找到相应的行，并做agg 后续计算 DRUID小结：Druid适用于聚合查询场景但是不适合有超高基维度的场景；存储全维度group-by后的数据，相当于只存储了KYLIN...Cube的Base-CuboID；每个维度都有创建索引，所以每个查询都很快，并且没有类似KYLIN的巨大的查询效率波动。...mark’s number集合（即数据block集合）在上一步骤中的 block中，在date和city列中查找对应的值的行号集合，并做交集，确认行号集合将行号转换为mark’s number 和...对于反向查找，只有在查找条件匹配最左前缀的时候，才能剪枝掉大量数据，其它时候并不高效。

1.4K1 0

Kylin、Druid、ClickHouse 核心技术对比

Kylin小结：适用于聚合查询场景；因为数据预聚合，Kylin可以说是最快的查询引擎（group-by查询这样的复杂查询，可能只需要扫描1条数据）；kylin查询效率取决于是否命中CuboId，查询波动较大...pv的索引通过索引在pv列中查找到相应的行，并做agg 后续计算 Druid小结：Druid适用于聚合查询场景但是不适合有超高基维度的场景；存储全维度group-by后的数据，相当于只存储了KYLIN...Cube的 Base-CuboID；每个维度都有创建索引，所以每个查询都很快，并且没有类似KYLIN的巨大的查询效率波动。...mark's number集合（即数据block集合）在上一步骤中的 block中，在date和city列中查找对应的值的行号集合，并做交集，确认行号集合将行号转换为mark's number 和...对于反向查找，只有在查找条件匹配最左前缀的时候，才能剪枝掉大量数据，其它时候并不高效。

1.8K2 0

大话 Druid 存储结构

为了方便阐述数据格式，本文以一个广告效果分析作为例子进行分析，图1中是样例数据，请一定注意它是聚合后的数据，而不是原始数据。 ?...字典字典是将列的所有值去重，然后按照字典顺序排序的值组成的数组，虽然字典中只存储了排序后的维度值，但是它还隐含了另一个信息，那就是每个维度值的编码值，编码值就等于数组的下标。...编码后的维度值 Druid是一个预聚合的方案，但是其聚合不是按照一个维度的group-by聚合，而是按照所有维度的group-by聚合，对于图1中的数据已经是按照聚合过了。...为了保证单一值在磁盘中能快速定位，在整个维度范围内这些整数需要是定长的，因为定长元素组成的数组可以通过计算直接定位到某一个元素。...Druid对线性非定长存储结构有这大量的应用，它遵循图6的总结，只是在元数据部分稍有不同，现总结如下： version：占用 1byte allowReverseLookup：1byte ，是否允许反向查找

6033 0

做olap一定要要了解的Druid存储结构

为了方便阐述数据格式，本文以一个广告效果分析作为例子进行分析，图1中是样例数据，请一定注意它是聚合后的数据，而不是原始数据。 ?...02 字典字典是将列的所有值去重，然后按照字典顺序排序的值组成的数组，虽然字典中只存储了排序后的维度值，但是它还隐含了另一个信息，那就是每个维度值的编码值，编码值就等于数组的下标。...03 编码后的维度值 Druid是一个预聚合的方案，但是其聚合不是按照一个维度的group-by聚合，而是按照所有维度的group-by聚合，对于图1中的数据已经是按照聚合过了。...为了保证单一值在磁盘中能快速定位，在整个维度范围内这些整数需要是定长的，因为定长元素组成的数组可以通过计算直接定位到某一个元素。...Druid对线性非定长存储结构有着大量的应用，它遵循图6的总结，只是在元数据部分稍有不同，现总结如下： version：占用 1byte allowReverseLookup：1byte ，是否允许反向查找

1.6K3 0

GitHub 热榜：这款 Python 工具火了，可对社群结构进行可视化、检测

这一次，功能是针对图聚类问题的社群结构进行检测、可视化。 ? 该项目的帖子在 reddit 上一经发布，就被顶到了 “机器学习板块” 的榜首。 ?...最终，让整个社群网络呈现出一种模块聚集的结构，实现整个社群网络的模块度的最大化。所以首先，我们需要构建一个表示无向图的邻接矩阵，可以加权，也可以不加权，矩阵为 2Dnumpy 数组。...： adj_matrix (numpy.ndarray)：图的邻接矩阵； frames (list)：算法每次迭代的字典列表；每个字典都有俩个键：“C” 包含节点到社群的查找表，“Q” 表示图的模块度数值...我们可以看到 Louvain 算法的动态过程：首先扫描数据中的所有节点，将每个节点看做一个独立的社群；接下来，遍历每个节点的邻居节点，判断是否将该节点加入邻居节点所在的社群，以提升模块度；这一过程重复迭代...，直到每一个节点的社群归属稳定；最后，将所有在同一个社群的节点压缩成一个新节点，计算新节点的权重，直到整个图的模块度稳定。

7891 0

标记扩展(Markup Extension)

此扩展最常用于样式和模板。 x:Array 通过标记扩展提供对 XAML 中对象的数组的一般支持。需要注意的是，在 XAML 2009 中，x:Array定义为语言基元而不是标记扩展。...查找该资源的行为类似于加载时查找，将查找当前 XAML 页面先前的标记以及其他应用程序源中加载的资源，并将生成该资源值作为运行时对象中的属性值。...RelativeSource 在设置 XAML 中创建的 Binding 元素的 RelativeSource 属性时使用。.... /> ComponentResourceKey 定义和引用从外部程序集加载的资源的键。这使资源查找能够在程序集中指定目标类型，而不是在程序集中或类上指定显式资源字典。...ThemeDictionary 为集成第三方控件的自定义控件创作者或应用程序提供一种方法，用于加载要在设置控件样式时使用的特定于主题的资源字典。

3883 0

60道硬核 Python 面试题，论面霸是如何炼成的

Python中的序列是索引的，它由正数和负数组成。正的数字使用'0'作为第一个索引，'1'作为第二个索引，以此类推。...列出Django中的继承样式。在Django中，有三种可能的继承样式：抽象基类：当您只希望父类包含您不想为每个子模型键入的信息时，使用此样式。...Django使用SQLite作为默认数据库，它将数据作为单个文件存储在文件系统中。...以下哪个语句创建字典？..._instance class MyClass(Singleton): a = 1 共享属性创建实例时把所有实例的dict指向同一个字典,这样它们具有相同的属性和方法.

1.9K7 0

2021-05-28

，公开数组接口的任何对象，__array__方法返回数组的对象，或任何（嵌套）序列。...np.array()的作用就是按照一定要求将object转换为数组。 ② dtype：可选参数，用来表示数组元素的类型。如果没有给出，那么类型将被确定为保持序列中的对象所需的最小类型。...Python 类特殊方法__getitem__ 凡是在类中定义了这个__getitem__ 方法，那么它的实例对象（假定为p），可以像这样 p[key] 取值，当实例对象做p[key] 运算时，会调用类中的方法...字典in 操作符作用：用于判断键是否存在于字典中，如果键在字典 dict 里返回 true，否则返回 false。语法： key in dict 参数：key -- 要在字典中查找的键。...返回值：如果键在字典里返回true，否则返回false。 10. np.empty()函数作用：创建一个没有任何具体值的ndarray数组，是创建数组最快的方法。

5800 0

寻找性能更优秀的不可变小字典

Dictionary 是一个很常用的键值对管理数据结构。但是在性能要求严苛的情况下，字典的查找速度并不高。所以，我们需要更快的方案。...因此，如果我们有办法使用连续数字作为下标，以及一个数组。就可以在 C# 中自己实现跳表。...知识要点使用表达式创建委托 PropertyInfo 有一个 int MetadataToken 属性，根据目前的观察，可以知道在一个类型中的属性其 MetadataToken 似乎是连续的，因此可以取模后作为跳表的...所谓的跳表，可以简单理解为，使用数组的下标来定位数组中的特定元素。实现代码这里，我们直接给出基准测试中使用的代码。...数组跳表是非直接方案中最快的。

3950 0

【数据结构】实现字典API：有序数组和无序链表

所以代码默认不能选择 -1作为 Key或者Value (在实际场景中，我们会将int类型的Key替换为实现Compare接口的类的对象，同时将“失败”时的返回值从-1设为null，这时是没有这个问题的)...对查找表经常进行的操作有：查询某个特定的数据是否在查找表中检索某个特定的数据元素的各种属性在查找表中插入一个数据元素从查找表中删除某个数据元素若对查找表只做1,2两种查找的操作，这样的查找表被称为...“静态查找表” 若在查找过程中同时还进行了3,4操作，这样的查找表被称为“动态查找表” 有序数组实现字典有序数组实现字典思路字典，有最关键的两个类型的值： Key和Value。...在每次操作中同步两个数组的状态以有序数组的插入键值对的操作为例（put） ?...换句话说，从0增长的字典长度赶上了当前数组的长度。因为java的数组长度在创建后不可调，所以我们要新建一个更大的数组，将原来的数组元素拷贝到新数组里面去。

1.2K5 0

Python 升级之路( Lv3 ) 序列

前面学习的很多字符串的方法，在列表中也有类似的用法，几乎一模一样。...# 1. append()方法原地修改列表对象，是真正的列表尾部添加新的元素，速度最快，推荐使用 a = [20, 40] # 此列表创建可以重写为列表文字 a.append(80) print(...也可以使用生成器对象的 __next__() 方法进行遍历，或者直接作为迭代器对象来使用。...直到找到为空的bucket将键值对放进去. 流程图如下：字典扩容 python会根据散列表的拥挤程度扩容。“扩容”指的是:创造更大的数组，将原有内容拷贝到新数组中。...假设数组长度为8，我们可以拿计算出的散列值的最右边3位数字作为偏移量，即 101 ，十进制是数字5。我们查看偏移量5，对应的 bucket 是否为空。如果为空，则返回 None 。

2.9K2 1

怎样在JavaScript中创建和填充任意长度的数组

没有空洞的数组往往表现得更好在大多数编程语言中，数组是连续的值序列。在 JavaScript 中，Array 是一个将索引映射到元素的字典。...密集数组往往表现更好，因为它们可以连续存储（内部）。一旦出现了空洞，内部表示就必须改变。我们有两种选择：字典。查找时会消耗更多时间，而且存储开销更大。连续的数据结构，对空洞进行标记。...在某些引擎中，例如V8，如果切换到性能较低的数据结构，这种改变将会是永久性的。即使所有空洞都被填补，它们也不会再切换回来了。...空洞的默认值一般不会是元素的初始“值”。常见的默认值是零。在 `Array` 构造函数后面加上 `.fill()` 方法 .fill()方法会更改当前的 Array 并使用指定的值去填充它。...提示：一般来说数组的性能无关紧要对于大多数情况，我不会过分担心性能。即使是带空洞的数组也很快。使代码易于理解更有意义。另外引擎优化的方式和位置也会发生变化。今天最快的方案可能明天就不是了。

3.2K3 0

使用泛型委托，构筑最快的通用属性访问器

/artech/archive/2011/03/26/Propertyaccesstest.html ，文中的测试结果说明，使用委托是最快的方式，但是原文进做了原理性说明，代码不通用，于是参照原文的方法...听说.net的字典查找性能不够高，继续写段测试代码跑跑看：（注：测试代码增加了相应的NoCache方法，代码如下： public static GetPropertyValue CreateGetPropertyValueDelegateNoCache...，另外也证明了，字典的查找性能的确不高。...这个测试中字典元素的数量是较少的，有朋友提示，可能是计算字典的Key的哈希耗费了较多性能，于是将缓存字典的长度改小成DGP-{0}-{1} 和 DSP-{0}-{1}，再次进行测试： =========...obj 有效，除非这是静态属性，它并不能作为一个通用类型的属性访问器，所以将它缓存意义不大，但可以作为优化属性访问的一个手段。

9049 0

iOS开发——字典的升序排列以及字符串拼接

32位小写字符串，作为签名值sign。...首先我们定义一个数组，存储字典中的所有key值: NSArray *keyArray = [params allKeys]; 接下来我们定义一个排序数组，存储排序好之后的key值 NSArray...obj2) { return [obj1 compare:obj2 options:NSNumericSearch]; }]; sortedArrayUsingComparator方法是苹果为我们提供的一个数组排序方法...而这时，我们排序好的key值，已经按顺序存储在sortArray数组中，这时我们再创建一个数组，来按升序存储key对应的Value，通过遍历sortArray的方法。...，分别对应升序排序的key和value，所以再创建一个keyValue的数组来存储每一个key和value的格式。

1.5K2 0

Swift基础集合类型

收藏品的可变性如果您创建一个数组、集合或字典，并将其分配给变量，则创建的集合将是可变的。这意味着您可以在集合创建后通过添加、删除或更改集合中的项目来更改（或突变）。...如果您将数组、集合或字典分配给常量，则该集合是不可变的，其大小和内容无法更改。注意在集合不需要更改的所有情况下，创建不可变集合是良好做法。...这样做使您更容易对代码进行推理，并使Swift编译器能够优化您创建的集合的性能。数组(Arrays) 数组将相同类型的值存储在有序列表中。相同的值可以在不同位置多次出现在数组中。...当您需要根据它们的标识符查找值时，您可以使用字典，就像使用现实世界的字典来查找特定单词的定义一样。...在字典上迭代您可以使用for-in循环迭代字典中的键值对。

1050 0

Python3外置模块使用

[TOC] 0x00 快速入门 (1)外置模块一览表描述：Python外置模块可以说是Python的强大之处的存在，使得Python语言扩展性高，使用方法众多并且使用也非常简单，在我们日常的运维开发学习中尤为重要...]) #方法用于添加一个新的工作表，sheetname为工作表名称，默认是sheet1 format=obj.add_format([properties]) #方法用于在工作表中创建一个新的格式对象来格式化单元格...chart=obj.add_chart(options) #用于在工作表中创建一个图表对象，内部是通过insert_chart()方法来实现的，参数为dict类型是为图标指定一个字典属性 obj.close...#简化不同数据类型的写入过程，write方法已作为其他更加具体的数据类型方法的别名 write_row('A1',写入的数据(单个字符/数组),格式化类型) #从A1开始写入一行 write_cloumn...：雷达样式的图表 #插入到指定位置 chart.add_series(options) #用于添加一个数据系列的图表参数options为字典类型，用于设置图表系列选项的字典 #常用方法： categories

3.5K3 0

Python3外置模块使用

4.6K2 0

.NET中的泛型集合

所以如果知道我们将要用这个集合装多少个元素的话，可以在创建的时候指定初始值，这样就避免了重复的创建新数组和拷贝值。...我通常倾向于将接口作为方法和属性的返回类型，而不是保证一个特定的实现类。在API中公开易变集合之前，你也应该深思熟虑，特别是当集合代表的是对象或类型的状态时。...在C#中，你不能直接创建非零下限的数组——需要使用Array.CreateInstance来创建，它可以分别指定下限、长度和元素类型。...它不仅知道如何创建数组及其索引，还可以在foreach循环中直接支持它们；在使用表达式对编译时已知为数组的类型进行迭代时，将使用Length属性和数组索引器，而不会创建迭代器对象。...注意，字典的主要目的在于为值提供有效的键查找。

1812 0

Swift教程(四)--集合类型

数组是有序的值的集合。集合是唯一值的无序集合。字典是无序的键值对集合。集合类型的可变性如果你创建一个数组、集合或者一个字典，并且赋值给一个变量，那么创建的集合就是可变的。...在集合不需要改变的情况下创建不可变集合是个不错的选择。这样做可以允许 Swift 编译器优化你创建的集合的性能。数组（arrays）数组以有序的方式来储存相同类型的值。...enumerated()方法返回数组中每一个元素的元组，包含了这个元素的索引和值。...要以特定的顺序遍历集合的值，使用 sorted()方法，它把集合的元素作为使用 < 运算符排序了的数组返回。...每一个值都与唯一的键相关联，它就好像这个值的身份标记一样。不同于数组中的元素，字典中的元素没有特定的顺序。当你需要查找基于特定标记的值的时候使用字典，很类似现实生活中字典用来查找特定字的定义。

1.1K3 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

在2Dnumpy数组中创建作为group-by样式查找的字典的最快方法？

相关·内容

Kylin、Druid、ClickHouse该如何选择？

Klin、Druid、ClickHouse核心技术对比

Kylin、Druid、ClickHouse 核心技术对比

大话 Druid 存储结构

做olap一定要要了解的Druid存储结构

GitHub 热榜：这款 Python 工具火了，可对社群结构进行可视化、检测

标记扩展(Markup Extension)

60道硬核 Python 面试题，论面霸是如何炼成的

2021-05-28

寻找性能更优秀的不可变小字典

【数据结构】实现字典API：有序数组和无序链表

Python 升级之路( Lv3 ) 序列

怎样在JavaScript中创建和填充任意长度的数组

使用泛型委托，构筑最快的通用属性访问器

iOS开发——字典的升序排列以及字符串拼接

Swift基础集合类型

Python3外置模块使用

Python3外置模块使用

.NET中的泛型集合

Swift教程(四)--集合类型

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐