有没有一种使用元组来迭代非常大的os.scandir()对象的高效内存的方法？_有没有一种内存高效的方法来改变固有实现的行为？_有没有一种内存高效的方法来转换输入流编码？ - 腾讯云开发者社区

python、python-3.x、performance、copy、scandir

我在python3中使用os.scandir()生成该目录中文件的完整列表，然后根据现有的元组检查每个文件名，如果匹配，则将该文件复制到一个单独的目录(也在远程服务器上)。我用来检查正确文件名的元组的长度约为100,000个项目。此外，元组中的每个项目都只是实际文件名的部分匹配--例如，一个元组项目可能是'2019007432‘，我希望它与诸如’2019007432_ o

浏览 21提问于2020-07-24得票数 0

3回答

Glob.glob(“**/*..jpg”)作为迭代器还是延迟加载？

python

我想知道是否可以使用glob.glob("**/*.jpg")来获取多个文件夹中的所有图像，但作为迭代器，以避免填充内存。目前，我在glob中使用以下代码： print(file)for model_folder in os.scandir(folder): for model_folder_content

浏览 6提问于2021-09-12得票数 2

回答已采纳

2回答

红黑树的迭代算法

.net、algorithm、red-black-tree

有没有人可以向我推荐一种插入和删除红黑树的迭代算法？.Net/C#中所有可用的算法都是基于递归的，我不能相信递归可以处理非常大量的数据(因此需要大量的递归深度来插入/删除)。有没有人有基于迭代的？注意: Goletas.Collection使用了一种迭代算法来处理AVL树，这对于大量

浏览 1提问于2010-09-21得票数 3

回答已采纳

3回答

优化用于邻居检查的numpy数组的迭代

python、arrays、numpy、optimization

有没有一种方法可以通过邻居检查来优化以下迭代： for j in range(1, A.shape[1]): if v == something: print(v) 其中A是由0和1组成的(非常大的)数值数组，v和something是元组(例

浏览 1提问于2018-02-10得票数 0

回答已采纳

1回答

在.NET中高效地生成一个非常大的Excel文件？

c#、asp.net、excel、out-of-memory

我需要从一个ASP.NET MVC站点生成一个非常大的Excel文件，但是使用Open XML SDK遇到了内存限制。有没有一种内存高效的方法来生成这样的文件？作为参考，我正在尝试生成一个大约500,000行，每行20列的电子表格。数据集本身可以很好地装入内存，但是Open XML SDK很快就会耗尽我的所有可用内存。

浏览 1提问于2014-09-13得票数 4

2回答

如何在boost R-树上迭代？

c++、boost、iterator、boost-geometry、r-tree

我似乎找不到一种高效的方法来迭代一个。到目前为止，我提出的唯一方法是使用一个非常大的边界框来执行查询，这样所有元素的副本都返回到一个向量中，但是这显然既不节省空间，也不节省时间。理想情况下，我只想使用STL风格的迭代器以通常的方式在树上迭代，但这似乎是不可能的</em

浏览 1提问于2014-11-20得票数 2

回答已采纳

3回答

这段代码如何对字典进行排序？

python

我正在寻找字典排序的方法，在上偶然发现了这段代码x = {1: 2, 3: 4, 4:3, 2:1, 0:0}这段代码是如何工作的？当我在字典上调用iteritem()时，我得到的结果是：我知道这是一个参考，但是你如何使用它呢？和afaik，在排序

浏览 2提问于2012-10-09得票数 1

2回答

我正在运行一个创建大量特征向量(作为numpy数组)并将它们堆叠到单个数组中的过程。这个过程目前非常占用内存，我正在寻找一种更高效的方式来运行它。，然后删除中间的features对象比一次生成所有特征并一次连接它们更有效。我相信这是因为np.concatenate在内存中分配了一个新对象。(尝试一次生成所有特征向量，然后拼接会耗尽内存)。也就是说，在接近循环末尾运行连接时，仍然需要大约30 GB<e

浏览 2提问于2020-05-05得票数 0

2回答

如何比较两个忽略C#中某些键的JSON？

c#、json、json.net

我有两个需要比较的JSON对象。但是，我想排除某些属性。有没有一种高效的方法来做到这一点，而不是迭代所有的键？我使用的是JSON.NET，它有JToken.DeepEquals()并且很棒，但是它不允许我排除某些键。谢谢!

浏览 0提问于2015-03-10得票数 5

1回答

有没有一种高效的方法来迭代avro模式？

javascript、reactjs、schema、avro

我希望能够迭代和访问avro模式的“name”字段值，但是由于avro期望其模式数据的特殊方式，在没有获得额外值的情况下无法找到一种有效的方法。我可以递归地迭代它，就像它是一个js对象一样；但是，我最终得到了某些不希望包含在我的结果中的字段。例如，在下面的代码中，我想要返回的唯一值是'foobar‘，但是我也得到了'Foo’，因为这是一个对象数

浏览 0提问于2019-07-14得票数 0

回答已采纳

1回答

在保留对象的同时更改python迭代器

python、sqlalchemy

我有一个可迭代的SQLAlchemy查询，假设它是一个名为query的对象。当你遍历它的时候，你会得到这样的结果：当您在查询对象上联接表，然后遍历它时，您得到的是元组： (Table1('Column1', 'Column2'), Table2('Column3', '

浏览 0提问于2012-11-20得票数 0

回答已采纳

1回答

如何使用scala sorm遍历大量记录

database、scala、iterator、sorm

我希望迭代sorm中特定表的所有记录，但我希望以一种内存高效的方式来实现。我今天使用的代码是： //do有没有办法流式传输这些记录？

浏览 1提问于2014-08-12得票数 3

1回答

替换大型熊猫数据帧中的NaN值时遇到Python内存错误

python、pandas、memory、dataframe

我有一个非常大的熊猫数据帧:大约300,000列和17,520行。熊猫数据帧被称为result_full。我正在尝试用numpy.nan替换所有的字符串"NaN"这就是我得到MemoryError的地方，有没有一种内存高效的方法来把这些字符串放到我的数据

浏览 0提问于2017-06-01得票数 1

5回答

使用Entity Framework和LINQ查询大型数据集时如何避免内存溢出

c#、linq、entity-framework

我有一个处理所有数据库方法的类，包括实体框架相关的东西。当需要数据时，其他类可能会调用此类中的方法，例如使用LINQ to EF查询数据库，然后调用类可以迭代数据。但由于其他类无法访问EF中的实体，因此我需要对查询执行"ToList()“操作，并将整个数据集提取到内存中。如果这个集合非常

浏览 2提问于2011-05-08得票数 17

回答已采纳

1回答

从可迭代的映射中产生单个值

python、iterator

我有一个将一个迭代器的元素映射到另一个迭代器的函数。然后，我想从这个对象的平面化版本中获得单个项目。下面的代码模拟了我想要的： a = [1, 2 ,3 , 4]c = itertools.chain(*b) # next(c) returns`1`, `1`, `2`, etc 但是，如果a非常大，或者我的map生成的值很大，我不想在内存中

浏览 12提问于2020-06-19得票数 0

回答已采纳

1回答

如何使用numpy数组在python中进行SIMD处理？

python、numpy、parallel-processing、multiprocessing

我有两个长度为numpy的二维正方形N阵列。我的问题是，我想并行这个函数，但是，我不知道如何去做它。根据我目前的理解，pool.apply_async()-method接收一个可迭代的，然后通过单独的进程将其分解为计算。给它提供一个元组列表是否合理，其中一个元组中的每个元素都是一个numpy数组

浏览 5提问于2020-06-22得票数 0

回答已采纳

8回答

限制大型* Django QuerySet中的内存使用*

python、django、memory-management、django-queryset

model_instance in SomeModel.objects.all():(请注意，它实际上是一个过滤器()，不是所有的()，但我仍然选择了一组非常大的对象我遇到的问题是，在运行了一段时间之后，这个线程就被我的托管提供商杀死了，因为我占用了太多的内存。我假设发生了所有这些内存使用，因为即使我的查询返回的QuerySet<e

浏览 4提问于2011-01-31得票数 33

回答已采纳

2回答

字符串到List<String>的高效内存映射

java、hashmap

我使用hashmap结构来存储父文档(键)和与该父文档相关的所有子文档(值)的列表之间的映射。这需要在以后迭代以处理映射。列表中的键和每个值通常是75-100个字符的文件名。所以这会在内存中产生巨大的对象加载。有没有更好的方法在内存高效的情况下存储这个映射？

浏览 1提问于2015-11-08得票数 2

1回答

在内存中管理非常大的xml

java、xml、parsing、memory-management

我们有一个现有的系统，其中有一个HTTP XML api，用户可以在其中查询系统中包含的对象。对象以类似于文件夹的分层方式进行分类。系统可能包含非常多的对象。API使用对象的属性构建XML模型(而不是直接的对象到XML映射)，并通过HTTP API返回该模型。如果用户查询系统的根目录，它将返回系统中每个对象的属性，并且在内存中维

浏览 0提问于2016-05-12得票数 0

3回答

从多维对象中获取要列出的值

javascript、typescript

: { "max": 2, }}} 我有比迭代这个对象和收集结果更好的方法吗？在其他语言中，有一些特殊的功能。我不想使用迭代，因为这个对象非常大

浏览 7提问于2022-09-11得票数 1

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云