前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >【C++】基础:OpenMP并行编程入门

【C++】基础:OpenMP并行编程入门

作者头像
DevFrank
发布2024-07-24 15:33:15
1510
发布2024-07-24 15:33:15
举报
文章被收录于专栏:C++开发学习交流

😏1. 并行编程OpenMP介绍

OpenMP是一种用于并行编程的开放标准,它旨在简化共享内存多线程编程的开发过程。OpenMP提供了一组指令和库例程,可以将顺序程序转换为可并行执行的代码。

OpenMP的核心思想是使用指令来标识出需要并行执行的代码块,并指定如何将工作划分到不同的线程中。开发人员可以在现有的顺序代码中插入特定的指令,以实现并行化。

以下是OpenMP的一些主要特性:

1.指令注释:通过在代码中插入特定的预处理指令,开发人员可以标识出应该并行执行的代码块。例如,可以使用#pragma omp parallel指令来创建一个并行区域。

2.线程创建与同步:OpenMP自动管理线程的创建和同步。在进入并行区域时,OpenMP会动态地创建一组线程,并在退出并行区域时进行同步。开发人员无需手动管理线程的创建和销毁。

3.工作分配:OpenMP提供了多种方式来将工作划分到不同的线程中。例如,可以使用#pragma omp for指令将循环迭代并行化,让不同线程处理不同的迭代。

4.共享内存模型:OpenMP使用共享内存模型,允许多个线程之间共享数据。开发人员可以使用shared关键字将变量声明为共享变量,以便多个线程可以访问和修改它们。

5.线程私有变量:除了共享变量外,OpenMP还支持线程私有变量。开发人员可以使用private关键字将变量声明为线程私有,确保每个线程都有自己的副本。

OpenMP广泛用于各种领域的并行编程,包括科学计算、图形处理、机器学习等。它提供了一种相对简单且易于使用的方法来利用多核处理器的计算能力,加速程序的执行。

😊2. openmp并行处理for循环

openmp常用来对代码中的for循环进行并行处理优化:

一个例子如下:

代码语言:javascript
复制
// main.cpp
// 使用并行循环进行向量加法
#include <stdio.h>
#include <omp.h>

#define SIZE 10000

int main() {
    int i;
    int a[SIZE], b[SIZE], c[SIZE];

    // 初始化数组
    for (i = 0; i < SIZE; i++) {
        a[i] = i;
        b[i] = i;
    }

    #pragma omp parallel for
    for (i = 0; i < SIZE; i++) {
        c[i] = a[i] + b[i];
    }

    // 打印结果
    for (i = 0; i < SIZE; i++) {
        printf("%d ", c[i]);
    }
    printf("\n");

    return 0;
}

例程中使用#pragma omp parallel for指令来并行化for循环。这个指令告诉编译器将循环分割成多个任务,并由多个线程同时执行。每个线程负责处理循环的一个子集。

编译时启用OpenMP支持,g++ main.cpp -fopenmp

这样程序就可以并发执行,提高运算效率了。

😆3. openmp多线程执行效率对比

openmp可以对一段程序指定不同线程数来优化,下面是一个示例:

代码语言:javascript
复制
#include <iostream>
#include <omp.h>
 
using namespace std;
 
void test()
{
	for (int i = 0; i < 50000; i++)
	{
	}
}
 
int main()
{
	float startTime = omp_get_wtime();
 
	//指定2个线程
#pragma omp parallel for num_threads(2)
	for (int i = 0; i < 50000; i++)
	{
		test();
	}
	float endTime = omp_get_wtime();
	printf("指定 2 个线程,执行时间: %f\n", endTime - startTime);
	startTime = endTime;
 
	//指定4个线程
#pragma omp parallel for num_threads(4)
	for (int i = 0; i < 50000; i++)
	{
		test();
	}
	endTime = omp_get_wtime();
	printf("指定 4 个线程,执行时间: %f\n", endTime - startTime);
	startTime = endTime;
 
	//指定8个线程
#pragma omp parallel for num_threads(8)
	for (int i = 0; i < 50000; i++)
	{
		test();
	}
	endTime = omp_get_wtime();
	printf("指定 8 个线程,执行时间: %f\n", endTime - startTime);
	startTime = endTime;
 
	//指定12个线程
#pragma omp parallel for num_threads(12)
	for (int i = 0; i < 50000; i++)
	{
		test();
	}
	endTime = omp_get_wtime();
	printf("指定 12 个线程,执行时间: %f\n", endTime - startTime);
	startTime = endTime;
 
	//不使用OpenMP
	for (int i = 0; i < 50000; i++)
	{
		test();
	}
	endTime = omp_get_wtime();
	printf("不使用OpenMP多线程,执行时间: %f\n", endTime - startTime);
	startTime = endTime;
 
	return 0;
}

结果如下:

代码语言:javascript
复制
指定 2 个线程,执行时间: 2.098389
指定 4 个线程,执行时间: 1.102295
指定 8 个线程,执行时间: 0.564941
指定 12 个线程,执行时间: 0.375244
不使用OpenMP多线程,执行时间: 3.956543

例程中使用#pragma omp parallel for num_threads(12)来对程序指定线程数,对这种运算次数多的情况下,提高openmp方法可压缩执行时间到1/4左右,但不能简单通过提高线程数来提高效率。

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2024-02-04,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 😏1. 并行编程OpenMP介绍
  • 😊2. openmp并行处理for循环
  • 😆3. openmp多线程执行效率对比
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档