.Net多线程编程—预备知识

1 基本概念

共享内存的多核架构:一个单独的封装包内封装了多个互相连接的未处理器,且所有内核都可以访问主内存。共享内存的多核系统的一些微架构,例如内核暂停功能,超频。

内核暂停功能:当使用内核不多的时候,操作系统会使剩下的内核进入休眠状态,当需要使用这些内核时,操作系统会唤醒这些睡眠的内核。

超频:提升一个内核频率的过程。当内核工作繁重时,使内核以更高的频率工作。

分布式内存系统:由多个处理器(CPU)组成,每个处理器可以位于不同的计算机上,计算机之间可以有不同类型的通信信道,并且都有自己私有的内存。

物理内核:物理内核是真正独立的处理单元。

硬件线程(逻辑内核\逻辑处理器):每个物理内核可能会提供多个逻辑内核。

软件线程(一般称作线程):程序执行流的最小单元,有时被称为轻量级进程(Lightweight Process,LWP)。每一个软件线程与其父进程分享一个私有的唯一的内存空间,但每一个软件线程有自己的栈、寄存器和私有局部存储区域。

进程:是计算机中的程序关于某数据集合上的一次运行活动,是系统进行资源分配和调度的基本单位,是操作系统结构的基础。在早期面向进程设计的计算机结构中,进程是程序的基本执行实体;在当代面向线程设计的计算机结构中,进程是线程的容器。程序是指令、数据及其组织形式的描述,进程是程序的实体。Windows中每个运行的程序都是一个进程。

主线程:当一个程序启动时,就有一个进程被操作系统(OS)创建,与此同时一个线程也立刻运行,该线程通常叫做程序的主线程。一个进程至少有一个主线程。

超额申请:应用程序使用的并发线程数多于逻辑内核数时发生超额申请。

负载均衡:不同的任务分配到的工作量差不多,以便有效利用处理器资源。

负载失衡:不同的任务分配到的工作量不同,以致有些任务无事可做,没有有效地利用处理器资源。

并发:多条指令在同一时间段执行。

并行:当系统有一个以上CPU空闲可用时,两个线程互不抢占CPU资源,可以同时进行,这种方式称之为并行。

交错并发:一次执行一个线程的指令,两个线程的指令交错执行。

竞争:计算结果依赖于语句执行的顺序,而执行的顺序没有被控制或同步。

竞争条件:竞争出现的条件。

死锁:是指两个或两个以上的进程在执行过程中,由于竞争资源或者由于彼此通信而造成的一种阻塞的现象,若无外力作用,它们都将无法推进下去。

活锁:与死锁相似,不同之处在于活锁中的线程状态不断地在两个状态之间切换且线程没有被阻塞。

锁争用:多个线程竞争同一个锁。

锁封护:当多个优先级相同的线程反复争用同一个锁时会发生锁封护。与死锁和活锁的情况不同,处于锁封护中的线程仍会前进;但是线程每次企图获取锁并且失败时,它会让出剩余的调度量并强制上下文切换。

临界区:两个并行部分之间需要顺序执行的串行时间段称为临界区。

.NET Framework 4引入的TPL:.NET Framework 4引入了新的TPL(任务并行库,Task Parallel Library),使用新型轻量级并发模型。新的TPL支持数据并行,任务并行和流水线。

1)数据并行:针对大量需要处理的数据,每一份数据执行同样的操作。

2)任务并行:并发运行不同的操作。

3)流水线:数据并行与任务并行的结合体,要对多个并发的任务进行协调。

2 概念辨析

1)并发、交错并发

图1 为并发示意图,其中有两个线程,编号分别为0和1。每个线程有两个指令,0-0表示第一个线程的第一条指令,0-1表示第一个线程的第二条指令,其他依次类推。

图2 为交错并发的示意图,其中有两个线程,编号分别为0和1。每个线程有两个指令,0-0表示第一个线程的第一条指令,0-1表示第一个线程的第二条指令,其他依次类推。从图中可看出,两个线程的指令交替执行,一次只执行一条指令。

图1 并发

图2 交错并发

2)物理内核、硬件线程

Intel Core i5-3470 Processor 有四个物理内核,每个内核有一个硬件线程。

Intel Xeon Processor E7-8893 v4 有四个物理内核,每个内核有两个硬件线程。

可见一个Processor的物理内核个数不一定等于硬件线程数。

图3 Intel Core i5-3470 Processor

图4 Intel Xeon Processor E7-8893 v4

3 Amdahl法则与Gustafson法则

Amdahl法则

功能:预测多处理器系统的最大理论性能提升(加速比,speedup)

公式:最大加速比(倍数)= 1/((1-P)+(P/N))

其中:P表示能够完全并行运行的代码比例

      N表示可用的计算机单元(处理器或物理内核数)

法则缺陷

只考虑了物理内核数的变化,并未考虑可以在既有应用程序中添加新功能以充分利用增加的并行处理能力。

只考虑了硬件的变化,并未考虑待处理的问题规模的变化。

未考虑并行所带来的开销。

未考虑将串行部分转换为充分利用并行化的算法。

Gustafson法则

功能:通过问题的大小来预测在固定时间内可执行的工作量

公式:工作总量(单元数)=S+N*P

其中:S表示一次顺序执行完成的工作单元数

      P表示每一部分能够完全并行执行的工作单元数

      N表示可用的执行单元数(处理器数或物理内核数)

法则缺陷

未考虑并行所带来的开销。

未考虑将串行部分转换为充分利用并行化的算法。

推出编程指导原则:

当程序串行部分消耗时间和问题大小有关时,调整问题大小以获得更好的加速比。

当可并行处理的数据量有限时,可添加新功能,以充分利用现代硬件的并行处理能力。

尽量减少临界区。

4.多核并行程序设计原则

(1)按照并行的方式思考

(2)使用抽象功能,充分利用.NET Framework 4中的TPL(Task Parallel Library)所提供的新功能

(3)按照任务(事情)编程,而不是按照线程(CPU内核)编程,关注任务而非底层线程

(4)设计的时候考虑关闭并发的情形,考虑程序在单核处理器也可运行

(5)避免使用锁

(6)利用为了帮助并发而设计的工具和库

(7)使用可扩展的内存分配器

(8)设计的时候要考虑随增长的工作负载而扩展

参考材料:

1)C#并行编程高级教程(中文版)(美)希拉里著,郑思遥/房佩慈译,清华大学出版社出版

2)设计模式.NET并行编程(中文版)

3)https://en.wikipedia.org/wiki/Lock_convoy

4)https://en.wikipedia.org/wiki/Deadlock#Livelock

5)https://en.wikipedia.org/wiki/Concurrent_computing

6)https://en.wikipedia.org/wiki/Parallel_computing

7)http://ark.intel.com/products/68316/Intel-Core-i5-3470-Processor-6M-Cache-up-to-3_60-GHz

8)http://ark.intel.com/products/93791/Intel-Xeon-Processor-E7-8893-v4-60M-Cache-3_20-GHz

-----------------------------------------------------------------------------------------

时间仓促,水平有限,如有不当之处,欢迎指正。

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏许健的专栏

Python 多线程的思考

在知乎等地方经常看到有人问,Python 的多线程是不是鸡肋?为何我用多线程性能一点没有提升,有时候性能反而下降?在这里通过日常工作中遇到的问题以及自己的一些总...

3510
来自专栏Linyb极客之路

多线程的应用场景

多线程用于堆积处理,就像一个大土堆,一个推土机很慢,那么10个推土机一起来处理,当然速度就快了,不过由于位置的限制,如果20个推土机,那么推土机之间会产生相互的...

362
来自专栏linux驱动个人学习

Linux进程调度器概述--Linux进程的管理与调度(十五)

调度器面对的情形就是这样, 其任务是在程序之间共享CPU时间, 创造并行执行的错觉, 该任务分为两个不同的部分, 其中一个涉及调度策略, 另外一个涉及上下文切换...

862
来自专栏Java架构沉思录

线程与进程的前世今生

原文:http://blog.csdn.net/luoweifu/article/details/46595285 作者:luoweifu

843
来自专栏后端技术探索

进程,线程,协程与并行,并发

进程的出现是为了更好的利用CPU资源使到并发成为可能。 假设有两个任务A和B,当A遇到IO操作,CPU默默的等待任务A读取完操作再去执行任务B,这样无疑是对CP...

852
来自专栏架构说

CPU核数和线程 (池)数量的关系(概念理解)

目前手机配置: 支持HUAWEI Mate 8非凡表现的, 是拥有强大性能的华为麒麟950芯片。 此芯片为八核4*Cortex A72 ...

3726
来自专栏北京马哥教育

关于IO的同步,异步,阻塞,非阻塞

上次写了一篇文章:Unix IO 模型学习。恰巧在这次周会的时候,@fp1203 (goldendoc成员之一) 正好在讲解poll和epoll的底层实现。中途...

26610
来自专栏用户2442861的专栏

编程思想之多线程与多进程(1)——以操作系统的角度述说线程与进程

什么是线程?线程与进程与有什么关系?这是一个非常抽象的问题,也是一个特别广的话题,涉及到非常多的知识。我不能确保能把它讲的话,也不能确保讲的内容全部都正确。即...

271
来自专栏jessetalks

异步编程 In .NET

概述   在之前写的一篇关于async和await的前世今生的文章之后,大家似乎在async和await提高网站处理能力方面还有一些疑问,博客园本身也做了不少的...

3006
来自专栏python3

python3--进程

进程的概念起源于操作系统,是操作系统最核心的概念,也是操作系统提供的最古老也是最重要的抽象概念之一。操作系统的其他所有内容都是围绕进程的概念展开的

512

扫码关注云+社区