python中并行处理在访问数据库时的内存消耗_在Python中并行处理不同参数的函数_在Celery Python中，任务到并行处理任务的输出。 - 腾讯云开发者社区

mysql、mahout、evaluation、recommendation-engine、mahout-recommender

我修改了NearestNUserNeighborhoud，为属于信任网络的用户增加了一些额外的价值。信任网络位于数据库(MySQL)中。当我向某个用户推荐项目时，它运行良好，并提供了建议。然而，当我评估RMSE时，当它对用户的数据库/信任网络中的用户进行比较时，是非常缓慢的。(它运行了上千条select语句) 第一个数据模型位于csv文件上，它位于表单userid、itemid、数据库中的rating.Whereas上，在form受信者中。您建议在合理的时间内评估RMSE吗？

浏览 1提问于2014-08-01得票数 0

回答已采纳

1回答

确定要从数据库中提取多少文档用于内存利用率

python、sql、mongodb、memory-management、mongoengine

我使用python 2.7和mongodb作为我的数据库。(实际上，我使用哪个数据库并不重要) 在我的数据库中，我有数百万个文档，有时我需要遍历所有文档。在一个查询中提取所有文档是不现实的，因为这将耗尽内存，相反，我会在每次迭代中提取1000个文档并迭代它们，当我完成时，我将再提取1000个文档，依此类推。我想知道是否有任何公式来计算从数据库中提取每次迭代的最佳次数。我在网上找不到能回答我问题的东西。基本上我的问题是，在每次迭代中从数据库中找到最佳数字的最佳方法是什么。

浏览 2提问于2015-07-21得票数 0

1回答

Neo4j批处理使用REST接口锁定数据库？

neo4j、py2neo

当对Neo4j的HTTP请求中的几个查询进行批处理时，这是否会导致图形数据库在转移到下一个请求之前执行HTTP请求中的所有查询？这是否可能意味着一个足够大的批将锁定整个数据库，以便执行批处理中的所有查询？或者它们在某种程度上是并行运行的？批处理是使用REST接口(和py2neo)还是使用批处理插入器(所以是非事务性的)还是正常的事务插入？谢谢

浏览 3提问于2014-05-22得票数 1

回答已采纳

2回答

sqlite ramdrive 1m行单文件与多文件之间的差异

database、sqlite

如果一个sqlite db文件有1个million+行，而10000行有多个文件，两者都存储在内存ramdrive /dev/shm中，这有什么区别吗？我想知道是否应该对我巨大的1m行数据库进行分区(按类别划分，或者可能按a-z字母和25个表/文件进行分区)，或者这是否对性能没有影响，因为它已经在内存中了这将严格用作繁重/非常频繁的只读缓存，因此文件锁定或频繁更新或任何类似的事情都不是问题。如果相关，只按PK id运行1次查询(SELECT * WHERE id IN (1,2,3) )

浏览 2提问于2013-06-12得票数 0

1回答

并行访问SQL Server

ado.net、task-parallel-library

我正在尝试使用任务并行库从UI线程卸载昂贵的ADO.NET数据库访问(以前，我正在重写的程序会简单地冻结，偶尔更新VB6文本框中的进度，直到数据库中的数据完全加载为止)。我有一个复杂的依赖结构(26个单独的任务)，我试图弄清楚其中有多少值得并行化。我想知道像这样的IO访问是否可以通过性能奖励并行化。如果不是这样，我就会按顺序加载数据，并在每次加载足够的信息来执行该任务时更新UI，但通过一次加载两个东西而不是只加载一个东西来获得额外的提振会更好(即使我没有获得两倍的加速)。

浏览 0提问于2010-12-21得票数 2

回答已采纳

1回答

VGG16模型冻结计算机

python-3.x、keras、deep-learning、vgg-net、transfer-learning

我目前正在尝试使用keras库中的vgg16模型，但是每当我通过执行以下操作来创建VGG16模型的对象时 from keras.applications.vgg16 import VGG16 model = VGG16() 我收到以下消息3次。 tensorflow/core/framework/allocator.cc.124 allocation of 449576960 exceeds 10% of system memory 接着，我的电脑就死机了。我在linux mint 18上使用64位、4 4gb的RAM，并且我无法访问GPU。这个问题是不是和我的内存有关？作为一种临时解决方

浏览 28提问于2019-07-06得票数 2

3回答

在Python中使用线程时要注意的注意事项？

python、multithreading

我对Python中的线程非常陌生，有几个初学者的问题。当使用Python模块启动超过50个线程时，我就开始获得threading。线程本身非常苗条，不太需要内存，因此线程的开销似乎是导致内存问题的原因。我能做些什么来增加内存容量或者使Python允许更多的线程吗？使用threading模块可以在Python代码中运行的最大线程数是多少？你做了什么把戏来达到这个数字吗？在使用threading模块时，还有其他需要注意的注意事项吗？

浏览 4提问于2010-05-30得票数 4

回答已采纳

1回答

在Android中从firebase下载多个文件时如何管理内存

java、android、firebase-realtime-database、firebase-storage

我在Firebase存储中有一个图像目录，我正在尝试将该目录中的所有文件下载到我的应用程序中。每个图像在数据库中都有一个相应的字段来存储其名称，下载大部分都是成功的，但是当您尝试与ui交互或在等待一段时间后崩溃时，应用程序会冻结并得到一个应用程序没有响应提示。下面是用于将图像下载到应用程序存储目录的代码 private void downloadAllTopicsAndFirstItems(Activity activity) { databaseReference.child(FIREBASE_TOPIC_NODE).addValueEventListener(new ValueE

浏览 4提问于2021-10-04得票数 0

回答已采纳

2回答

异步MVC控制器

asp.net-mvc、asynchronous、controller、task-parallel-library、async-await

我正在学习ASP.NET MVC中的AsyncController，并将其与第三方公共语言一起使用，但我正在努力了解它的需求，我可以理解您何时想要异步运行操作来做一些事情，例如发送电子邮件，但在现实中，您会使用它从操作中返回视图吗？例如，如果Action从数据库获取一些数据，该数据库被设置为异步工作，则返回一个View，如果数据无法及时检索，该View是否会返回模型中没有数据？

浏览 0提问于2013-03-30得票数 0

回答已采纳

1回答

hana表分区中的高内存消耗

out-of-memory、partitioning、hana

我有一个包含大约40亿条记录的大表，表已分区，但我需要再次执行分区。在进行分区时，hana系统的内存消耗达到了4TB的极限，并开始影响其他系统。我们如何优化分区，以便在不消耗太多内存的情况下完成分区

浏览 3提问于2019-11-07得票数 1

2回答

使用Psycopg2维护Python和Postgresql之间连续连接的最佳实践

python、linux、performance、postgresql、out-of-memory

我正在用Python和PostgreSQL8.3编写一个应用程序，它可以在本地网络上的几台机器上运行。所有机器 1)从数据库服务器获取大量数据(假设数据库在2秒内从一台机器获得100个不同的查询)，大约有10到11台机器在做这件事。 2)在处理数据之后，机器必须更新某些表(每台机器每1.5秒大约有3到4个更新/插入查询)。我所注意到的是，由于服务器异常中止进程或冻结服务器机器(需要硬重置)，数据库有时会宕机。顺便说一句，所有机器始终保持与数据库的持续连接，也就是说，一旦使用Psycopg2 (Python语言)建立了连接，它就会一直保持活动状态，直到处理结束(这可能会持续几个小时)。在

浏览 1提问于2009-11-13得票数 2

回答已采纳

2回答

Python中的调试器在自己构建的模块上冻结。

python、debugging、python-module、python-idle

我认为这个问题是在这里讨论的：但我没能找到解决办法。第一次在Python中使用调试器。我用的是空闲。该程序运行良好，否则，但当运行通过调试器，它冻结，我必须杀死程序。我已经发现，问题在于我导入了我创建的脚本，这些脚本主要用作数据库。所以就像这样。 from ownScript import array 其中数组只是一个列表，就像CSV文件一样。我发现这是一种非常简单的在本地使用数据的方法，即使我将来肯定会以其他方式实现。如果我使用"over“，它就会结冰，但是如果我”步“到错误的地方，我会得到以下结果： Traceback (most recent call last): F

浏览 1提问于2019-02-20得票数 1

回答已采纳

1回答

编程c#：Parallel.Foreach内存消耗管理

c#、entity-framework、memory、parallel-processing

我想使用Parallel.Foreach机制来确保CPU在处理CPU密集型任务时得到充分利用。我每次从数据库中查询大量的对象(每次迭代中只有一个对象，每个对象都相当小)，然后对该对象执行大量基于CPU的操作，之后将其保存回数据库。我在数据模型端使用Entity Framework，并且给定我查询的对象数量，我为每次迭代创建一个新的上下文(这是为了限制内存消耗)： foreach (var id in idlist) { using (var ctx = new Context()) { var model = ctx.M

浏览 1提问于2016-03-22得票数 0

1回答

Gsutil在下载包含大量进程的多个文件时会占用大量内存

google-cloud-storage、gsutil

我需要用gsutil下载多个文件，我注意到gsutil在下载多个文件时会占用大量内存。(当下载三个2G文件，每个文件有9个进程时，大约1-2 GB内存)。有没有办法调优gsutil的内存使用？这对我来说很重要，因为我在GKE中运行gsutil，如果使用太多内存(超过限制)，容器将被终止。另一个问题: gsutil似乎不能在一个命令中下载同名文件(一个命令会覆盖另一个吗？)。所以我没有使用-m选项。相反，我使用一个gsutil命令下载每个文件: gsutil bucket“"GSUtil:sliced_object_download_component_size=250M”“"

浏览 2提问于2019-06-28得票数 1

1回答

Azure函数未并行运行

.net、azure、parallel-processing、azure-functions

我已经在python中创建了一个azure函数。我正在通过C#呼叫它，预计我将同时发送大约1000个请求。对于这个函数，我需要的是并行处理这些请求，而不是一个接一个，但我不能让它发生。下面是我的测试代码，它并行发送10个请求。 static void Main(string[] args) { List<string> symbols = new List<string> { "MSFT", "AAPL", "NFLX", "JNJ", "INTC", "G

浏览 0提问于2021-10-06得票数 1

1回答

joblib并行函数如何管理内存？

python、parallel-processing、multiprocessing、wand、joblib

我正在编写一个函数来将PDF转换为PNG图像，它看起来如下： import os from wand.image import Image def convert_pdf(filename, resolution): with Image(filename=filename, resolution=resolution) as img: pages_dir = os.path.join(os.path.dirname(filename), 'pages') page_filename = os.path.splitext(os.path

浏览 4提问于2017-02-25得票数 3

回答已采纳

1回答

在并行向HDF5文件写入数据时，dask如何管理任务？

bigdata、python-multithreading、dask

我想使用python在一个大型数组上并行计算。输入数组和输出数组都不在内存中。此外，写入输出文件是一个潜在的瓶颈(因为例如，HDF5通常不支持并行写入)。 dask.array.map_blocks(func).store(...) 在等待写出生成的块时，dask如何决定将多少新块放入内存(即读入并开始计算)？据推测，如果它试图使CPU完全被占用，就有可能导致python达到内存限制。是否存在相关的配置设置，或者最好避免使用dask并实现其他类型的任务队列？

浏览 12提问于2018-02-12得票数 2

回答已采纳

3回答

GNU Make正在使用-j耗尽内存。在那个特定的时刻，它在做什么？

debugging、gnu-make

我正在运行带有-j标志的大型GNU Make文件。在某一点上，使进程溢出所有的RAM，并由于“分段错误”而失败。在没有-j标志的情况下，进程会成功完成。如何知道GNU Make在开始消耗内存时在做什么？调试标志(-d)对此问题没有帮助。

浏览 6提问于2013-04-03得票数 2

1回答

Python :我的多进程插入到MySQL的代码有什么问题？

python、mysql、mysql-python

我编写了一个Python脚本来将一些数据(3亿)插入到MySQL表中： #!/usr/bin/python import os import MySQLdb from multiprocessing import Pool class DB(object): def __init__(self): self.conn = MySQLdb.connect(host='localhost',user='root',passwd='xxx',db='xdd',port=3306) self.cur = sel

浏览 5提问于2013-07-23得票数 1

1回答

后端& auth0 -在本地存储访问令牌，在变量中存储还是获取新的访问令牌？

oauth-2.0、auth0

我从后台调用了一个使用auth0的api。我已经获得了获取访问令牌的凭证，一旦收到，就会在24小时内有效。我想知道，处理这些令牌的最佳实践是什么。你是否应该 a)将其与过期日期一起保存在本地数据库中，然后调用该数据库，直到过期 b)将其保存在一个变量中(目的相同)，并在每次应用启动时获取新的token 或者c)每次进行api调用时只获取一个新的访问令牌。

浏览 10提问于2020-02-22得票数 0

回答已采纳

1回答

SSIS多表加载

ssis、ssis-2012

我是第一次学习SSIS。我正在尝试将多个表从我的临时数据库加载到数据仓库中的多个表。我的临时数据库只是一个将所有源数据库中的所有表复制到其中的数据库。我发现每个数据流任务只允许将一个源表连接到一个目标表。我是否必须使用与我的源数据库中的表数一样多的数据流任务？有没有更简单、更有效的方法来做到这一点呢？根据我的理解，我需要一个空数据库，其中包含在SQL Server中创建的空Dim表和事实表，它将充当目标数据仓库，并从临时数据库接收数据。因此，我已经创建了这个空的数据仓库。请帮帮忙。

浏览 1提问于2013-04-15得票数 0

回答已采纳

1回答

内存和IO带宽的区别是什么?我们如何测量每一个带宽？

io、x86、performance-testing、bandwidth、bus

内存和io带宽的区别是什么?你如何测量每一个带宽？我有这么多假设，请原谅这两个部分的问题。这些问题的灵感来自： Hadi解释道： DATA_REQ_OF_CPU不是用来测量内存带宽，而是用来测量i/o带宽。我想知道mem/io带宽之间的差异是否类似于DMA(直接内存寻址)和MMIO(内存映射io)之间的差异，还是两者的带宽都是io带宽？我试着用这张照片来帮助想象： (希望我有这个权利)在x86中有两个地址空间:内存和IO。IO带宽是否是cpu (或dma控制器)与io设备之间的度量，然后内存带宽将在cpu和主存之间？这两个场景中的所有数据都通过内存总线运行？为了清楚起见，我们

浏览 0提问于2019-07-25得票数 3

1回答

使用CompletableFuture时内存的积累

java、completable-future

class DataItemCache { private CompletableFuture future; public DataItemCache() { future = CompletableFuture.completedFuture(null); } public void saveItemAsync(Object dataItem) { future = future.thenRunAsync(() -> { saveItemSync(dataItem); // Saves the

浏览 2提问于2018-01-18得票数 0

1回答

JSR 352: Java Batch的最佳实践是什么，以确保最大的性能和效率？

java、websphere、websphere-liberty、jsr352、java-batch

我正在从数据库中执行典型的读取操作，并且我将在具有数百万(>1000万)条记录的数据集上处理和写入文件步骤。从设计或架构的角度来看，有什么需要牢记的吗？另外，是否有需要牢记的Java批处理特定的编码实践？(除了一般的java最佳实践之外) 我使用的是IBM在Websphere using上实现的JSR352。

浏览 1提问于2016-07-18得票数 3

1回答

在NodeJs法西斯中执行WorkerQueue的正确方法？

multithreading、node.js

考虑一下经典的工作队列:您有一个主线程，它从某个地方(通常是数据库或远程系统)获取信息。数据通常存储在共享数组中。有N个工作人员->线程，它们从数组中提取一个元素，对其做一些操作，然后再取第二个元素。如果队列是空的，他们只需等待它得到一些信息。在大多数语言中，比如C++、Python，这都是通过线程来完成的。由于NodeJs是异步的，所以我想知道以下内容是否会产生类似的效果： var arr = [21, 22, 23]; arr.forEach(function(entry) { //do something time/processor consuming }); 注意:

浏览 2提问于2014-07-12得票数 1

回答已采纳

2回答

通过Python 3.7使用Google云存储和云函数的轻量级ETL

python、google-cloud-platform、google-cloud-storage、google-cloud-functions

我是GCS和Cloud Functions的新手，我想了解如何结合使用这两种技术和Python (3.7)来创建轻量级ETL。我有一个名为'Test_1233‘的GCS bucket，其中包含3个文件(所有文件在结构上都相同)。当一个新文件被添加到这个gcs存储桶中时，我希望下面的python代码能够运行并生成一个'output.csv文件‘并保存在同一个存储桶中。我尝试运行的代码如下： import pandas as pd import glob import os import re import numpy as np path = os.getc

浏览 0提问于2019-01-06得票数 1

2回答

uWSGI未释放内存

django、uwsgi

我试了试一个非常小的django应用程序，它主要服务于html+static内容，没有数据库操作。这个应用程序在nginx和uwsgi上。我也安装了postgres，但对于这个问题，我没有执行任何DB操作。我发现uwsgi进程没有释放内存。在这张来自newrelic的图表中，你会发现uwsgi进程占用的内存仍然停滞不前，大约100MB，尽管在这个停滞期间，网站/应用程序绝对没有任何活动。另外仅供参考: app/uwsgi进程启动时仅占用56MB。当我使用ab(apache基准测试)进行测试时，我达到了这个大约100MB，而在-n 1000 -c 10中达到了这个范围。 Nginx

浏览 6提问于2013-05-02得票数 6

3回答

在python上使用多线程来更快地处理图像？

python、image-processing、numpy、gpu、python-imaging-library

在Python + Python Image Library脚本中，有一个名为processPixel( image，pos)的函数，用于计算图像的函数中的数学索引和图像上的位置。此索引是使用简单的for循环为每个像素计算的： for x in range(image.size[0)): for y in range(image.size[1)): myIndex[x,y] = processPixel(image,[x,y]) 这花费了太多的时间。如何实现线程化来分散工作，加快速度呢？多线程代码能有多快？具体地说，这是由处理器核心的数量定义的吗？

浏览 0提问于2012-01-10得票数 4

回答已采纳

1回答

应用程序引擎延迟:跟踪内存泄漏

python、google-app-engine、memory-leaks、google-cloud-storage

我们有一个App应用程序，它可以向Google写入许多较大的文件。这些文件是动态创建的CSV，因此我们使用Python的StringIO.StringIO作为缓冲区，使用csv.writer作为写入该缓冲区的接口。一般来说，我们的流程如下： # imports as needed # (gcs is the Google Cloud Store client) buffer = StringIO.StringIO() writer = csv.writer(buffer) # ... # write some rows # ... data = file_buffer.getdata(

浏览 1提问于2016-02-03得票数 1

回答已采纳

3回答

GNU的并行实用程序

bash、parallel-processing、gnu-parallel

我有一个bash脚本，它有一个while循环，它迭代32次，在每次迭代期间使用dd命令编写1G文件。我可以看到，它最终在这个过程中吃掉了我所有的RAM 32G，我的系统冻结了。但是当我使用类似于parallel -P 32的-P选项使用parallel命令做同样的事情时，这一次我的内存并没有用完。有人能解释一下为什么会这样吗？这会耗尽我所有的记忆 function exhaust { for item in `seq 1 1 32` do dd if=/sample/zombie$item of=/dev/null bs=1048576 count=1024 &a

浏览 0提问于2016-10-13得票数 0

1回答

烧瓶和NGINX流文件通过Gunicorn上传

python、python-3.x、linux、nginx、flask

在Linux ( 4.9.13 )和Gunicorn ( 19.9.0 )中，我使用的是由NGINX ( 1.15.7 )代理的Flask ( 1.0.2 )和Python3.7(4.9.13)。我可以用下面的代码成功地将一个大文件( 1.2GB )上传到我的Flask服务器。但是，在用下面所示的file.save()函数写入磁盘之前，整个文件都是在RAM中缓冲的。我尝试过在Googling上搜索，并发现了许多据称将文件流到磁盘而不是在RAM中缓冲的帖子，但我一直无法让他们的方法发挥作用。如何使文件直接流到磁盘，而不是先在RAM中缓冲，然后再进入磁盘？我就是这样发射火鸟的： gunico

浏览 0提问于2019-08-22得票数 1

回答已采纳

3回答

弹簧批式饱和存储器

spring、memory-leaks、out-of-memory、batch-processing、spring-batch

更新：我试着增加一些细节，因为解决这个问题对我来说非常重要。我做了一批，从数据生成pdf文档，这些数据存在于某些表中，并将pdf保存在一个表中。批处理是可以的，但是要处理的数据是巨大的，所以我决定将输入数据分成8组，以8个并行步骤单独处理这8个组。每个步骤都有自己的读取器(步骤“X”的名称为"readerX“)，并具有与其他步骤相同的处理器和编写器。精化进行得很好，但我的客户端说这个批处理占用了太多内存(他查看了perfmon中的“工作集”参数)。特别是，批处理以300 to的使用内存开始，然后使用的内存达到7GB，然后减少到2GB，批处理结束时分配的内存为1/2GB。我把作业

浏览 1提问于2014-05-27得票数 1

回答已采纳

1回答

Django -如何在ASGI和WSGI应用程序之间共享数据？

django、websocket、asgi

我在Django上做我的项目，它在WSGI上有Gunicorn，在ASGI上有Daphne。ASGI服务器只需要处理Websocket协议。使用Django中的通道进行Websocket路由和处理。Nginx关于静态和代理。数据库是Mysql。一般情况下：是否有一种方法可以在ASGI和WSGI应用程序之间同步内存中的变量值，而无需写入数据库？ TLDR: HTTP (wsgi)用于与数据库的主要交互(目前，创建模型实例)。 Websocket (asgi)计划与用户控件一起工作(现在，连接到房间，将来会是游戏中的控件吗？旋转片等。该项目是俄罗斯方块多人游戏，用户可以创建房间，例如，为2或4名

浏览 1提问于2019-12-20得票数 1

8回答

用形状分配张量时理解ResourceExhaustedError: OOM

tensorflow

我正在尝试使用tensorflow实现一个跳过思想模型，并将当前版本放置为。目前，我使用的是我的机器的一个GPU (总共2个GPU )，而GPU信息是 2017-09-06 11:29:32.657299: I tensorflow/core/common_runtime/gpu/gpu_device.cc:940] Found device 0 with properties: name: GeForce GTX 1080 Ti major: 6 minor: 1 memoryClockRate (GHz) 1.683 pciBusID 0000:02:00.0 Total memo

浏览 4提问于2017-09-06得票数 54

1回答

我可以关闭Azure DevOps管道中的并行作业吗？

python、azure、azure-devops、cloud、azure-pipelines

我对Azure管道很陌生。我正在尝试创建用于部署简单python应用程序的管道。但我错了没有购买或授予托管并行。据我所知，微软为公共项目和新组织中的某些私人项目提供了免费的平行工作。但如果我不需要并行工作呢？我需要一个接一个的工作。我可以停止使用并行作业吗？我选择了模板“package”并设置了环境变量"python.version“，只有一个版本"3.7”。但没什么用。我仍然有同样的错误没有购买或授予托管并行。

浏览 1提问于2021-07-09得票数 2

回答已采纳

1回答

Python多处理会在单个坞容器内工作吗？

python、multithreading、docker、multiprocessing

我有一个在守护进程模式下由apache2和mod_wsgi提供的Django web应用程序，与Django的中描述的方式相同。这个应用程序是在AWS中托管的，没有被篡改。但是，现在我们需要在客户的一个服务器上进行one部署，我们决定使用Docker来简化部署。我在这个项目上使用Docker已经有一段时间了，但只是为了开发，而不是为了生产。由于该应用程序同时使用Python的多线程来阻塞操作，而对CPU绑定的任务则使用多处理。此外，Apache2正在生成多个进程，同时为多个请求提供服务。如果应用程序运行在单坞容器中，那么多处理会有什么问题吗？它是否能够产生多个进程并利用主机的多核？

浏览 6提问于2019-11-16得票数 1

回答已采纳

3回答

Docker进程被隐藏的‘Killed`消息杀死

python、macos、docker、docker-machine

在docker容器中运行python脚本，一切似乎都运行得很顺利，看到一些STDOUT消息，大约5分钟后，我收到了一条Killed消息，没有进一步的解释，然后进程停止。查询数据库可能是磁盘空间问题，也可能是OOM问题。我不确定，但是我不知道在哪里可以找到关于这个kill消息的日志，这样我就可以找到这个问题的根源。你知道这些日志在哪里吗？在Mac OSX上运行docker-machine。这就是信息所说的一切！ root@c7b800e0f276:/opt/mymodule# python Python 2.7.13 (default, May 1 2017, 22:44:36) [GCC

浏览 4提问于2017-06-07得票数 74

1回答

在picturebox中绘制列车时c#中的内存不足异常

c#、graphics、bitmap、out-of-memory、picturebox

我正在尝试创建一个应用程序来显示picturebox中的在线火车因此，为了实现这一点，我创建了一个worker thread来获取在线火车位置.so，我定义了这个线程，如下所示： private Thread workerThread = null; private delegate void UpdateListBoxDelegate(); private UpdateListBoxDelegate UpdateListBox = null; 在Form_load中，我称之为： UpdateListBox = new UpdateListBoxDelegate(th

浏览 2提问于2014-07-05得票数 0

回答已采纳

1回答

即使使用微小的数据: mcfork()：无法分叉中的错误，可能的原因:无法分配内存

r、parallel-processing、tm、doparallel

我一直在做一个处理大型语料库的功能。在里面我用的是多列包。在50到100 000份文件上一切正常。我对1M文档进行了测试，并收到了上述错误。然而，当我回到我以前工作过的语料库大小时，我仍然会得到同样的错误。我甚至试着降低到1k个文件。当我在控制台中调用函数时，一旦我点击enter，就会产生错误。虽然我有15个内核，但我测试了这一点，测试的低到只有两个核心-相同的问题。我还尝试重新启动会话并使用rm(list = ls())清除环境。代码： clean_corpus <- function(corpus, n = 1000) { # n is length of each peic

浏览 1提问于2017-08-24得票数 2

2回答

如何高效地分析多个csv文件？

python、database、pandas、csv

我有近60-70个定时日志文件(都是.csv文件，总大小接近100 of )。我需要一次性分析这些文件。到目前为止，我已经尝试了以下方法：将所有这些文件合并到一个文件中，并将其存储在DataFrame ( Python)中，并对它们进行分析。将所有csv文件存储在数据库表中并进行分析。我怀疑这两种方法中哪一种更好？或者有没有其他方法来处理和分析这些文件？谢谢。

浏览 5提问于2017-07-19得票数 1

1回答

迭代器在使用数据库时是如何工作的？

sql、database、iterator

像SELECT * FROM people这样的查询可能会造成严重的内存问题，也就是说，正如许多人所称的那样，“内存超出了”。许多程序员使用迭代器调用以减少内存消耗。迭代器是一种“播放-暂停视频记录”，意思是它们得到一个值，停止，产生一个值等等，从而避免一次生成所有的值。Python中的一个例子可以是： def myIterator(): for i in range(10): yield i * 2 现在，当涉及到使用迭代器从数据库中获取数据时，我感到非常困惑。我总是被告知要限制对数据库的查询数量，因为它可能成为一个瓶颈，并且，在我看来，使用迭代器可以增加查询的数量。是这样吗？

浏览 4提问于2017-04-20得票数 1

1回答

性能更好的是什么？是列表，还是从数据库中获取信息？

java、mysql、performance

因此，我有一个资源有限的服务器。(3 3Gb内存)我需要知道的是，使用这个是不是更好 List<Object> list = new ArrayList<Object>(); void init(){ list = loadListFromDatabase } 并在需要时添加或删除列表，或者，当我需要对象时，每次访问它时从数据库中加载它？

浏览 2提问于2014-02-14得票数 0

1回答

ColumnStore索引扫描未在批处理模式下进行

sql、sql-server、sql-execution-plan、columnstore

在我的数据库中，有一些列存储索引和过程中使用的这些表。在我的开发服务器中执行过程时，列存储索引的执行模式是批处理模式。但是当我将它们移到生产环境中时，它们变成了逐行执行模式。是否有任何服务器设置会影响这些设置。有人能帮我吗？请注意，这两台服务器都是SQL 2014

浏览 0提问于2016-05-27得票数 1

2回答

CUDA与web开发

cuda

显然，GPU的每个核心都可以处理一个请求，而不是一个主处理器(系统的CPU)处理所有请求。从表面上看，这似乎是可能的，也许使用GPU + Redis数据库中的模板在GPU GDDR5中？这是可能的和值得的吗？

浏览 4提问于2010-10-21得票数 1

回答已采纳

1回答

java apache poi循环性能

java、loops、apache-poi、xlsx

我一直在使用一个处理大量数据的代码，它首先将整个长xlsx读取到arraylist的arraylist中，然后在method worker中逐行运行，每次满足条件时，它都会写一些列并做一些事情(每个worker方法可能有1000个)，因此它为每个worker写1行。Worker方法被实现了很多次，因此最终的xlsx将有100000行代码，每行代码都有1000行代码(希望以后会有更多代码行)： public static void main(String[] args) throws Throwable { ArrayList<ArrayList> data; //filled b

浏览 0提问于2015-10-28得票数 0

3回答

记忆分配

erlang、mnesia

我是通过插入大约1000个用户来测试应用程序的，每个用户在mnesia下的数据库表中都有1000个联系人，在插入某个部分时，我得到的错误如下： Crash dump was written to: erl_crash.dump binary_alloc: Cannot allocate 422879872 bytes of memory (of type "binary"). Aborted 我用erl +MBas af (B-二进制分配程序af- a fit)启动erl模拟器，然后再试一次，但是错误是相同的，注意:我正在使用erlang r12b版本，系统ram在ubunt

浏览 3提问于2011-11-23得票数 0

3回答

加速对大量字典列表的解析- Python

python、parsing、list、sorting、dictionary

我使用的是MongoDB，一个nosql数据库。基本上，作为查询的结果，我有一个字典列表，它本身包含字典列表.我需要和一起工作。不幸的是，在中处理所有这些数据时，当数据太多时，可以将这些数据带到爬行中。我从来没有处理过这个问题，--如果有经验的人能给我一些建议，那就太好了。=)

浏览 0提问于2010-07-25得票数 0

回答已采纳

1回答

滑雪板中的RandomizedLasso如何使用变量n_jobs？

python、parallel-processing、scikit-learn

当我不得不在python中并行化一个算法时，我通常使用多处理映射函数。在滑雪随机拉索中，他们似乎在使用不同的。我对python中的并行计算不是很精通，我希望能从中学到一些新的东西。有人能解释一下他们在用什么吗？在他们的情况下，我会使用多重处理。他们为什么要选择不同的东西？

浏览 2提问于2014-05-09得票数 0

回答已采纳

2回答

Python -如何在不耗尽内存或减慢处理速度的情况下构建和访问大型数据集合

python、memory、collections、persistence、containers

我正在用Python编写脚本，以便在专有的ESRI数据库表中获得QC数据。该脚本的目的不是修改无效数据，而只是通过csv文件向用户报告无效数据。我正在使用ESRI的ArcPy包通过arcpy.SearchCursor访问每个单独的记录。SearchCursor是访问ESRI格式的每个单独记录的唯一方法。当我滚动浏览表格的每一条记录时，我会进行多次QC检查，以验证特定的业务逻辑。其中一项检查是在特定字段中查找重复数据。其中一个字段可能是几何。为此，我为每个字段创建了一个空的容器对象，并在检查每条记录时使用以下逻辑。 for field in dupCheckFields: if row

浏览 3提问于2011-10-20得票数 2

2回答

在我的黑莓应用程序中，SD卡的使用对于"database.db“文件是必不可少的？

database、blackberry、sd-card

我在黑莓数据库相关的应用程序工作。在点击按钮时，我只是通过从我的SD卡中存储的.db文件中提取数据来在其他屏幕上显示一些有用的数据。最初，我从我资产中提供了".db“文件。现在，我已经看到一些用户评论，他们在使用SD卡时遇到了问题。我的问题是“在我的blackberry应用程序中使用sql数据库/.db文件而不使用SD-Card是可能的吗？”请告诉我这是否可能....！

浏览 0提问于2012-04-27得票数 0

回答已采纳