.Net多线程编程—预备知识

1 基本概念

共享内存的多核架构:一个单独的封装包内封装了多个互相连接的未处理器,且所有内核都可以访问主内存。共享内存的多核系统的一些微架构,例如内核暂停功能,超频。

内核暂停功能:当使用内核不多的时候,操作系统会使剩下的内核进入休眠状态,当需要使用这些内核时,操作系统会唤醒这些睡眠的内核。

超频:提升一个内核频率的过程。当内核工作繁重时,使内核以更高的频率工作。

分布式内存系统:由多个处理器(CPU)组成,每个处理器可以位于不同的计算机上,计算机之间可以有不同类型的通信信道,并且都有自己私有的内存。

物理内核:物理内核是真正独立的处理单元。

硬件线程(逻辑内核\逻辑处理器):每个物理内核可能会提供多个逻辑内核。

软件线程(一般称作线程):程序执行流的最小单元,有时被称为轻量级进程(Lightweight Process,LWP)。每一个软件线程与其父进程分享一个私有的唯一的内存空间,但每一个软件线程有自己的栈、寄存器和私有局部存储区域。

进程:是计算机中的程序关于某数据集合上的一次运行活动,是系统进行资源分配和调度的基本单位,是操作系统结构的基础。在早期面向进程设计的计算机结构中,进程是程序的基本执行实体;在当代面向线程设计的计算机结构中,进程是线程的容器。程序是指令、数据及其组织形式的描述,进程是程序的实体。Windows中每个运行的程序都是一个进程。

主线程:当一个程序启动时,就有一个进程被操作系统(OS)创建,与此同时一个线程也立刻运行,该线程通常叫做程序的主线程。一个进程至少有一个主线程。

超额申请:应用程序使用的并发线程数多于逻辑内核数时发生超额申请。

负载均衡:不同的任务分配到的工作量差不多,以便有效利用处理器资源。

负载失衡:不同的任务分配到的工作量不同,以致有些任务无事可做,没有有效地利用处理器资源。

并发:多条指令在同一时间段执行。

并行:当系统有一个以上CPU空闲可用时,两个线程互不抢占CPU资源,可以同时进行,这种方式称之为并行。

交错并发:一次执行一个线程的指令,两个线程的指令交错执行。

竞争:计算结果依赖于语句执行的顺序,而执行的顺序没有被控制或同步。

竞争条件:竞争出现的条件。

死锁:是指两个或两个以上的进程在执行过程中,由于竞争资源或者由于彼此通信而造成的一种阻塞的现象,若无外力作用,它们都将无法推进下去。

活锁:与死锁相似,不同之处在于活锁中的线程状态不断地在两个状态之间切换且线程没有被阻塞。

锁争用:多个线程竞争同一个锁。

锁封护:当多个优先级相同的线程反复争用同一个锁时会发生锁封护。与死锁和活锁的情况不同,处于锁封护中的线程仍会前进;但是线程每次企图获取锁并且失败时,它会让出剩余的调度量并强制上下文切换。

临界区:两个并行部分之间需要顺序执行的串行时间段称为临界区。

.NET Framework 4引入的TPL:.NET Framework 4引入了新的TPL(任务并行库,Task Parallel Library),使用新型轻量级并发模型。新的TPL支持数据并行,任务并行和流水线。

1)数据并行:针对大量需要处理的数据,每一份数据执行同样的操作。

2)任务并行:并发运行不同的操作。

3)流水线:数据并行与任务并行的结合体,要对多个并发的任务进行协调。

2 概念辨析

1)并发、交错并发

图1 为并发示意图,其中有两个线程,编号分别为0和1。每个线程有两个指令,0-0表示第一个线程的第一条指令,0-1表示第一个线程的第二条指令,其他依次类推。

图2 为交错并发的示意图,其中有两个线程,编号分别为0和1。每个线程有两个指令,0-0表示第一个线程的第一条指令,0-1表示第一个线程的第二条指令,其他依次类推。从图中可看出,两个线程的指令交替执行,一次只执行一条指令。

图1 并发

图2 交错并发

2)物理内核、硬件线程

Intel Core i5-3470 Processor 有四个物理内核,每个内核有一个硬件线程。

Intel Xeon Processor E7-8893 v4 有四个物理内核,每个内核有两个硬件线程。

可见一个Processor的物理内核个数不一定等于硬件线程数。

图3 Intel Core i5-3470 Processor

图4 Intel Xeon Processor E7-8893 v4

3 Amdahl法则与Gustafson法则

Amdahl法则

功能:预测多处理器系统的最大理论性能提升(加速比,speedup)

公式:最大加速比(倍数)= 1/((1-P)+(P/N))

其中:P表示能够完全并行运行的代码比例

      N表示可用的计算机单元(处理器或物理内核数)

法则缺陷

只考虑了物理内核数的变化,并未考虑可以在既有应用程序中添加新功能以充分利用增加的并行处理能力。

只考虑了硬件的变化,并未考虑待处理的问题规模的变化。

未考虑并行所带来的开销。

未考虑将串行部分转换为充分利用并行化的算法。

Gustafson法则

功能:通过问题的大小来预测在固定时间内可执行的工作量

公式:工作总量(单元数)=S+N*P

其中:S表示一次顺序执行完成的工作单元数

      P表示每一部分能够完全并行执行的工作单元数

      N表示可用的执行单元数(处理器数或物理内核数)

法则缺陷

未考虑并行所带来的开销。

未考虑将串行部分转换为充分利用并行化的算法。

推出编程指导原则:

当程序串行部分消耗时间和问题大小有关时,调整问题大小以获得更好的加速比。

当可并行处理的数据量有限时,可添加新功能,以充分利用现代硬件的并行处理能力。

尽量减少临界区。

4.多核并行程序设计原则

(1)按照并行的方式思考

(2)使用抽象功能,充分利用.NET Framework 4中的TPL(Task Parallel Library)所提供的新功能

(3)按照任务(事情)编程,而不是按照线程(CPU内核)编程,关注任务而非底层线程

(4)设计的时候考虑关闭并发的情形,考虑程序在单核处理器也可运行

(5)避免使用锁

(6)利用为了帮助并发而设计的工具和库

(7)使用可扩展的内存分配器

(8)设计的时候要考虑随增长的工作负载而扩展

参考材料:

1)C#并行编程高级教程(中文版)(美)希拉里著,郑思遥/房佩慈译,清华大学出版社出版

2)设计模式.NET并行编程(中文版)

3)https://en.wikipedia.org/wiki/Lock_convoy

4)https://en.wikipedia.org/wiki/Deadlock#Livelock

5)https://en.wikipedia.org/wiki/Concurrent_computing

6)https://en.wikipedia.org/wiki/Parallel_computing

7)http://ark.intel.com/products/68316/Intel-Core-i5-3470-Processor-6M-Cache-up-to-3_60-GHz

8)http://ark.intel.com/products/93791/Intel-Xeon-Processor-E7-8893-v4-60M-Cache-3_20-GHz

-----------------------------------------------------------------------------------------

时间仓促,水平有限,如有不当之处,欢迎指正。

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏腾讯大数据的专栏

大型web系统数据缓存设计

1. 前言 在高访问量的web系统中,缓存几乎是离不开的;但是一个适当、高效的缓存方案设计却并不容易;所以接下来将讨论一下应用系统缓存的设计方面应该注意哪些...

3906
来自专栏杨建荣的学习笔记

sysbench压测小记(r11笔记第99天)

对于很多线上业务而言,如果有新服务器,新的环境,新的业务,到底资源和预期的承载压力是否匹配,这个得用数据说话,或是通过严谨的论证来阐述。 比如一台新...

4086
来自专栏xcywt

程序员需要知道的十个操作系统的概念

说明:我之前在网上看到这篇文章觉得非常好,于是把它翻译了下来。当然很多地方翻译的很渣,见笑了。温馨提示,文章有点长。

781
来自专栏信安之路

web测试方法工具篇

之前写过一个文章《web应用渗透测试流程》,这个文章的主要内容是关于一个web应用如何进行测试,测试什么地方,没有过多的提供使用的工具,只是一个针对web测试的...

930
来自专栏北京马哥教育

某次压测时物理内存被用光 Tomcat 被 Kernel kill 掉的案例

? 背景描述 某项目结构图如下(前端交互式体验及对象存储为主,Redis 及 rds 负载较小没有画出): ? web1 和 web2 是两个 Apache,...

3027
来自专栏PHP在线

缓存更新的套路

看到好些人在写更新缓存数据代码时,先删除缓存,然后再更新数据库,而后续的操作会把数据再装载的缓存中。然而,这个是逻辑是错误的。试想,两个并发操作,一个是更新操作...

33613
来自专栏java达人

防止表单重复提交的思路和方法

作为一个软件开发者,绝不能奢望你的用户会规规矩矩地使用你的软件,他们一般都是缺乏耐心,“胡作非为”的。比如当他点击提交表单时,服务器处理比较慢, 页面上没有任何...

2478
来自专栏一枝花算不算浪漫

【python】Python 资源大全中文版

2942
来自专栏韩伟的专栏

集群开源软件赏:JGroups

目前我在腾讯主要负责一个服务器端软件的相关开源项目,所以接下来几天的开源内容是最近工作上积累的一些经验和想法,下图中的内容就是我目前主要的工作内容和一些小小的成...

3074
来自专栏java架构学习交流

通过Struts了解MVC框架,兼说如何在面试中利用Struts证明自己

    虽然目前Struts MVC框架不怎么用了,但它确是个能帮助大家很好地入门Web MVC框架,而且,一些历史项目可能还用Struts,反正技多不压身,大...

1867

扫码关注云+社区