我是否可以使用所有CPU和内核来处理图像？

我是用python编程的新手。import face_recognitionimport numpy as npimport glob known_face_encodings.append(images_encoding) known_face_

浏览 16提问于2019-10-22得票数 1

2回答

异步CPU读取和GPU+CPU计算

、、

我的程序首先从HDD中读取2幅图像(带有c++ file.read函数)，然后在GPU和CPU上执行计算(一堆CUDA内核与简单的CPU计算混在一起)。我有大约2000对图像要处理。阅读和计算时间几乎相等。读取和处理的并行化是否有相对简单的实现？我知道，使用CUDA流，我可以异步地评估主机(

浏览 3提问于2015-02-13得票数 3

回答已采纳

1回答

三维纹理上的OpenGL高斯核

、、

我想在openGL中对3D纹理进行模糊处理。因为它是可分离的，所以我应该可以在3次传球中做到。我的问题是，什么是处理这一问题的最佳方法？我现在有三维纹理，并使用imageStore填充它。我应该为模糊区域创建另外两个纹理副本，还是有方法在使用单个纹理时做到这一点？我已经使用glCompute来计算3D纹理的mip映射，但在本例中，我在0级从纹理读取，然后在下一层

浏览 3提问于2014-08-07得票数 1

1回答

CUDA小内核2d卷积-如何实现？

、、、、

我已经用CUDA内核做了几天的实验，在500x500图像(但我也可以改变尺寸)和非常小的2D内核( laplacian 2D内核，所以它是3x3内核)之间执行快速的2d卷积。太小，无法充分利用所有的cuda线程)。我创建了一个典型的CPU实现(两个循环，就像您想象的那样简单)，然后我开始创建CUDA内核。经过几次令人失望的尝试来执行更快的卷积，

浏览 3提问于2012-04-13得票数 14

回答已采纳

1回答

为什么GPU库不支持自动函数组合？

它允许您指定函数序列、组合函数，并通过缓存友好的平铺处理将组合的函数应用于数组。这比简单地遍历每个函数的整个数组提供了更好的性能。这项技术似乎也会让运行在GPU上的代码受益。我是不是遗漏了什么？或者，GPU库不能从自动函数组合中受益有什么原因吗？

浏览 0提问于2013-01-10得票数 0

回答已采纳

4回答

我正在扩展Linux内核，以控制某些线程的频率:当它们被调度到内核(任意内核！)上时，通过将适当的p状态写入寄存器IA32_PERF_CTL来改变内核的频率，就像英特尔手册中所建议的那样。但是，当调度具有不同“自定义”频率的不同线程时，似乎所有线程的吞吐量都会增加，就好像所有核心都以最大的设置频率运行一样。我在不同的负载和配置条件下做了很多试验和测量，但是结果是一样的。在对CPUFreq进行了一些

浏览 3提问于2012-06-19得票数 7

回答已采纳

2回答

Linux进程调度器--它们本身是否消耗CPU？

、、、

我发现了很多资源，这些资源给出了内核对的标准解释，以及信号(SIGXXX)的处理方式：如果一个信号(SIGXXX)正在等待该进程，内核将尝试在该进程中调用适当的处理程序。而且，在具有多个内核、线程和大量可用CPU资源的现代系统中，调度程序是否<

浏览 4提问于2017-02-10得票数 0

回答已采纳

1回答

预编译numba cuda内核(非jit)

、、、、

你好，我正在使用numba编写一些带有@cuda.jit装饰器的内核。我有8个CPU线程，每个线程在2个GPU设备中的一个上调用一个内核。(具体为cpu_idx % len(cuda.gpus)) 我相信每个CPU线程都在编译内核，相对于内核处理整个图像所需的时间，这会占用很多时间。理想情况下，它应该只编译一次，以供所有CPU线

浏览 19提问于2020-04-09得票数 0

1回答

确定库达设备是否在使用中？

、

是否有一种直接测试库达设备是否正在被任何内核使用的方法？我有一个后台线程，在完全占据分形程序的情况下启动“原始”库达内核。线程建立了大的图像数组，然后我想让用户顺利地进行平移、旋转和缩放。我的GUI线程希望使用GPU，如果它目前没有用于大型图像转换，因为它运行在100 fps。如果GPU正在使用，我可以回到使用</em

浏览 6提问于2020-09-11得票数 0

2回答

Linux(Ubuntu)负载平均高于总真利用率？

、、

最近，我更新了VLC的脚本(VLM)，以提高质量，这意味着我也在增加CPU利用率。因此，我开始调优脚本，以避免超过最大利用率。我使用顶级来监控CPU的使用情况。我发现负载平均值高于100%(我总共有8个内核，所以8.00是100%)，但是仍然有20-35%空闲，例如： top - 21:41:19 up 2 days, 17:15, 1 user, loadCPU</e

浏览 2提问于2014-05-09得票数 1

回答已采纳

1回答

为什么我不能控制I/O亲和力？

我试图用处理器和I/O的关联来验证我的应用程序可以在更少的核心上运行，所以我手动设置处理器和I/O，以平衡使用，这样就不会在这两个操作中使用任何一个核心。然而，一旦我到达第三个NUMA节点(即CPU 64)，我只能设置处理器亲和力的使用，I/O亲和力就会变灰。文档有点让人困惑引用的是CPU<

浏览 0提问于2021-09-23得票数 1

1回答

如何使图像处理使用所有的CPU内核

、、、、

我需要一个功能，如何能够建立一个基于多个合并的图像。5-8秒来执行我所有的图像并创建结果。如果我让它同时运行在多个内核上，这将提高我的速度。例如..我有4个核心，如果我可以将我的原始元素列表划分为4个列表，其中将只有四分之一的部分或原始列表，这些可以在一个核心上运行它们中的每一个，毕竟我可以在一个核心上合并只有4个图像<

浏览 5提问于2016-05-08得票数 1

1回答

我们能否在NodeJs中使用多个cpu核与工作线程一起实现并行处理？

、、、

我知道“集群”和"child_process“可以使用一个CPU的多个核心，这样我们就可以实现真正的并行处理。假设我的计算机有4个核心CPU，并且正在执行nodejs脚本。脚本创建三个工作线程。三个工作线程是否会利用CPU中剩下的3个内核</e

浏览 2提问于2021-02-05得票数 3

回答已采纳

1回答

默认情况下，Tensorflow如何使用CPU内核？

、、

我们有一台机器，它有一个CPU和N核。我想在CPU上训练一个神经网络，并希望尽可能多地利用CPU。我知道我可以设置inter_op_parallelism_threads和intra_op_parallelism_threads变量来控制Tensorflow中的并行性。但是我想知道默认情况下，Tensorflow是如何处理跨CPU内核的并行性的？

浏览 5提问于2019-11-05得票数 0

2回答

基于CUDA的GPU图像处理多线程技术

、

问题陈述：我必须连续处理800万像素的相机拍摄的图像。它必须有多种图像处理算法，如颜色插值、颜色变换等，这些运算在CPU上要花费很长的时间。所以，我决定在GPU上使用CUDA内核进行这些操作。我已经为颜色转换编写了一个工作的CUDA内核。但我仍然需要在表现上有更多的提升。将source image从CPU复制到GPU，反之亦然。GPU上source i

浏览 3提问于2015-07-02得票数 0

回答已采纳

3回答

如何在Android / Galaxy SIII上获取每个核心的cpu使用率

、、

我有一个三星Galaxy SIII的Android 4.1.2“根”。我需要测量我用C/C++编写的一些多线程应用程序的CPU使用率，但是我需要每个内核的这个信息。我知道(由于维基百科，...)银河有一个带有4个ARM Cortex A9的SoC，但是当我做一个cat /proc/cpuinfo时，它没有显示任何关于可用内核数量的信息(像在任何Linux中一样)，我在某处读到过，

浏览 0提问于2013-06-19得票数 2

回答已采纳

2回答

将C代码转换为OpenCL

我正在试着把一个用C写的小程序翻译成openCL。我应该将一些输入数据传输到GPU，然后使用连续的内核调用在设备上执行所有计算。然而，我面临着不适合并行化的部分代码的困难，因为我必须避免由于使用的数据量而在CPU和GPU之间来回传输数据。有没有办法在没有并行处理的情况下执行一些内核，这样我就可以用它们来替换这些代码部分？这<e

浏览 3提问于2012-12-13得票数 1

2回答

GCD串行队列是否使用所有CPU核心？

、、、

我想渲染30个不同的图像。每个任务都必须将不同的图像层合并为一个最终图像- 30个最终图像。目前，我使用的是GCD串行队列。现在我想知道这种方法是否会自动使用所有可用内核的CPU能力？或者，当我使用GCD并发队列时，是否可以改善所有这些任务的渲染时间？谢谢你的澄清..

浏览 2提问于2012-08-20得票数 0

回答已采纳

4回答

多线程是在不同的进程上运行还是在同一进程上运行？

、、

在我的.net多线程程序中，我想知道所有这些线程运行在同一进程上还是运行在不同的进程上？如果它在同一进程上，那么我假设一个进程在一个核心上运行，那么多线程如何利用我的四核cpu中的所有四个核心呢？但是如果是在不同的进程上，因为我知道不同的进程和相同的进程有不同的数据共享机制，那么为什么我不需要在我的多线程程序中编写不同的代码来处理这个问题呢？有没有人能解释一下我

浏览 0提问于2012-03-21得票数 2

2回答

异常是否显式捕获和处理导致切换到内核模式？

、、、

从一本OS书中，我了解到异常(例如算术溢出、未定义的指令、无效的内存访问)将导致cpu从用户模式切换到内核模式，从而使操作系统能够处理异常。在高级编程语言中，我们可以捕获和处理程序中的默认(如上面提到的那些)或自定义异常，例如在C++中，通过使用try和catch，以及在Java和Python中使用类似的构造。我注意到，在这种情况下，用户程序中会给出异常处理程序。

浏览 1提问于2015-02-07得票数 5

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

异步CPU读取和GPU+CPU计算

三维纹理上的OpenGL高斯核

CUDA小内核2d卷积-如何实现？

为什么GPU库不支持自动函数组合？

英特尔MSR每螺纹频率缩放

Linux进程调度器--它们本身是否消耗CPU？

预编译numba cuda内核(非jit)

确定库达设备是否在使用中？

Linux(Ubuntu)负载平均高于总真利用率？

为什么我不能控制I/O亲和力？

如何使图像处理使用所有的CPU内核

我们能否在NodeJs中使用多个cpu核与工作线程一起实现并行处理？

默认情况下，Tensorflow如何使用CPU内核？

基于CUDA的GPU图像处理多线程技术

如何在Android / Galaxy SIII上获取每个核心的cpu使用率

将C代码转换为OpenCL

GCD串行队列是否使用所有CPU核心？

多线程是在不同的进程上运行还是在同一进程上运行？

异常是否显式捕获和处理导致切换到内核模式？

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐