开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

为什么互斥锁延迟比JEFF DEAN的latency Numbers中的主存引用要小，每个程序员都应该知道？

互斥锁延迟比JEFF DEAN的latency Numbers中的主存引用要小，每个程序员都应该知道的原因是：

互斥锁是一种同步机制，用于保护共享资源的访问，防止多个线程同时访问导致数据不一致的问题。在多线程编程中，使用互斥锁可以确保同一时间只有一个线程可以访问被保护的资源，其他线程需要等待锁的释放才能继续执行。

互斥锁的延迟比主存引用的延迟小的原因主要有以下几点：

互斥锁的延迟是由于线程之间的竞争和调度引起的，而主存引用的延迟是由于内存访问的物理操作引起的。互斥锁的延迟主要受到线程调度器的影响，而主存引用的延迟主要受到硬件和内存子系统的影响。由于线程调度器通常比硬件和内存子系统更加高效，所以互斥锁的延迟相对较小。
互斥锁通常是在用户空间实现的，而主存引用是在内核空间实现的。用户空间的操作相对于内核空间的操作来说，具有更低的开销和延迟。因此，互斥锁的延迟相对较小。
互斥锁的实现通常会利用一些优化技术，如自旋锁、读写锁等，以减少锁的竞争和降低延迟。这些优化技术可以根据具体的场景和需求选择合适的锁策略，从而进一步降低延迟。

总之，互斥锁延迟比JEFF DEAN的latency Numbers中的主存引用要小是因为互斥锁的实现通常在用户空间，利用了线程调度器的高效性和一些优化技术，从而降低了锁的竞争和延迟。每个程序员都应该知道这个原因，以便在多线程编程中选择合适的同步机制并优化性能。

腾讯云相关产品和产品介绍链接地址：

腾讯云云服务器（ECS）：https://cloud.tencent.com/product/cvm
腾讯云容器服务（TKE）：https://cloud.tencent.com/product/tke
腾讯云数据库（TencentDB）：https://cloud.tencent.com/product/cdb
腾讯云人工智能（AI）：https://cloud.tencent.com/product/ai
腾讯云物联网（IoT）：https://cloud.tencent.com/product/iot
腾讯云移动开发（移动推送、移动分析等）：https://cloud.tencent.com/product/mobile
腾讯云对象存储（COS）：https://cloud.tencent.com/product/cos
腾讯云区块链（BCS）：https://cloud.tencent.com/product/bcs
腾讯云元宇宙（Tencent XR）：https://cloud.tencent.com/product/xr

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

Latency numbers every programmer should know 计算机中的延迟对比

每个编程者都应该知道的延迟：（~2012年的性能） Latency Comparison Numbers (~2012) ---------------------------------- L1 cache...seconds 1 us = 10^-6 seconds = 1,000 ns 1 ms = 10^-3 seconds = 1,000 us = 1,000,000 ns Credit ------ By Jeff...Dean: http://research.google.com/people/jeff/ Originally by Peter Norvig: http://norvig.com...gist.github.com/hellerbarde/2843375 Visual comparison chart: http://i.imgur.com/k0t1e.png 更为形象化：更为可读的对比

6102 0

美国工程院士、谷歌首席架构师、结对编程榜样杰夫·迪恩(JeffDean)博士传记(27k字)

杰夫(Jeff)与桑杰(Sanjay)对于计算机的工作原理非常熟悉，能够立足位(bit)层级进行思考。杰夫(Jeff)曾经整理出一份《每位程序员都应该了解的那些延迟数字》清单。...虽然名为“每位程序员都应该了解”，但大多数从业者对这些数字其实非常陌生——例如一级缓存引用通常需要半纳秒，或者从内存中顺序读取1MB大概需要250微秒等等。...桑杰(Sanjay)：“但我不知道我们为什么会觉得一起在同一台计算机前面琢磨，会比分头行动效果更好。” 杰夫(Jeff)则表示，“我宁愿走过两个街区，也想从自己的D.E.C研究实验室赶到他的研究室去。...正如厨师在食材下锅之前要先对其进行分类一样，MapReduce也要求程序员将自己的任务分成两个阶段。...与此同时，在每周星期一的共同编程中，杰夫(Jeff)与桑杰(Sanjay)又鼓捣出了一个新的 AI 项目。杰夫(Jeff)说这是一种尝试，要训练出一套“巨型”机器学习模型来执行成千上万种不同任务。

2.6K1 0

用于 LLM 的公开的数值数据

数组中的每个元素都是一个包含两个键的字典： input: 用于训练模型的输入文本。输入文本通常包括一个问题或描述。 output: 模型的预期输出。这通常是一个简短的回答或数值。...LLM 开发者应知的数字在谷歌，传奇工程师杰夫·迪恩（Jeff Dean）整理了一份名为“每位工程师都应该知道的数字”的文档。...磁盘延迟是指从磁盘中读取或写入数据所需的时间。了解磁盘延迟有助于在处理大量数据时了解存储系统的性能瓶颈。网络延迟同一数据中心内的往返延迟（RTT）大约为 0.5 毫秒。...跨洲际光缆的往返延迟大约为 150 毫秒。网络延迟是指数据在网络中传输所需的时间。了解网络延迟有助于在开发分布式系统和优化网络通信时预测性能。...然而，我们鼓励您在使用这些数据时，引用这个存储库以便其他人可以找到这些资源。项目地址 https://github.com/ray-project/llm-numbers

2053 0

《纽约客》长文：Jeff Dean和他背后的男人

他跟另一位同事——一位身材瘦高、精力充沛的31岁男子，名叫Jeff Dean，同样来自Digital Equipment Corporation。 Jeff比Sanjay早10个月离开D.E.C。...Jeff和Sanjay是在比特的级别上理解计算机的。 Jeff曾经分发过一份“每个程序员都应该知道的延迟时间”的列表。...实际上这是一份几乎没有哪位程序员知道的数字列表：L1缓存引用通常需要0.5纳秒，或者从内存中连续读取1兆字节需要250微秒。这些数字根植在Jeff和Sanjay的大脑里。...“我们从进谷歌之前就已经是搭档了，”Jeff说。 “但我不知道为什么我们决定在一台电脑前工作，而不是用两台电脑，”Sanjay说。...“我不知道为什么越来越多人不这样做了，”Sanjay说，他指的是与搭档一起编程。 “你需要找到一个能与你的思维方式兼容的人来做搭档，这样你们俩就能形成互补。”Jeff说。

5961 0

干货 | 聊聊java并发(上)

（一）为什么要“并发”？既然聊并发，我们首先会思考为什么要引入这个技术。...那么为什么要并发呢？接下来，我尝试系统、深入、图文并茂的聊一下并发、JSR133中定义的JMM以及其中具体的语义细节。 ? 1.充分利用CPU资源首先，并发可以充分利用CPU资源。...（上下文切换示意图） 2.更复杂，有挑战并发编程比串行的编程更加复杂，要考虑锁问题、线程安全、重排序问题、共享数据的一致性、线程池的设置等等。...为什么不可见计算机为了提高整体运行效率，使得CPU不会直接与内存（主存）进行通信，会先使用缓存替代主存。使用缓存好处主要两点：一，缓存读写数据比内存读写数据速度更快，能更好地被CPU使用。...这个线程获取对象锁成功的同时，会使得当前CPU缓存的数据失效，那么接下来的读操作，就会重新从系统主存中读取（并填充缓存）。

5252 0

Jeff Dean的激荡人生：我和Sanjay在同一台电脑上写代码

他追随 Jeff Dean 加入谷歌，他们之前同在 Digital Equipment Corporation。Jeff Dean 比 Sanjay 早十个月离开 D.E.C.。...Jeff 和 Sanjay 对计算机有非常深入的了解。Jeff 曾经写过一份清单《Latency Numbers Every Programmer Should Know》。...在设计房子时，他发现虽然自己喜欢设计空间，但并没有耐心去完成「适合 Sanjay 的部分」：横梁的细节、螺栓以及保证整个设计不至于分崩离析。「我不知道为什么别人不这么干——合作编程。」...在 MIT，他的研究生导师是 Barbara Liskov，这是一位有影响力的计算机科学家，研究复杂代码库的管理。在她看来，最好的代码就像是一篇好文章。它需要一个精心实现的结构，每个词都应该起作用。...「这山比我想象中的要陡。」Jeff 说道。「我记得有人说这是一次非常平坦的远足。」Sanjay 说。「我猜这就是那一侧没有自行车道的原因。」Jeff 说道。他们又走进了一片丛林。

1.1K1 0

干货 | 聊聊java并发(上)

（一）为什么要“并发”？既然聊并发，我们首先会思考为什么要引入这个技术。...那么为什么要并发呢？接下来，我尝试系统、深入、图文并茂的聊一下并发、JSR133中定义的JMM以及其中具体的语义细节。 ? 1.充分利用CPU资源首先，并发可以充分利用CPU资源。...（上下文切换示意图） 2.更复杂，有挑战并发编程比串行的编程更加复杂，要考虑锁问题、线程安全、重排序问题、共享数据的一致性、线程池的设置等等。...为什么不可见计算机为了提高整体运行效率，使得CPU不会直接与内存（主存）进行通信，会先使用缓存替代主存。使用缓存好处主要两点：一，缓存读写数据比内存读写数据速度更快，能更好地被CPU使用。...这个线程获取对象锁成功的同时，会使得当前CPU缓存的数据失效，那么接下来的读操作，就会重新从系统主存中读取（并填充缓存）。

9085 0

谷歌基情实录：和Jeff Dean在同一台电脑上写代码

大数据文摘出品编译：DonFJ、周家乐、李雷、小七、胡笳、jin、钱天培单丝不成线，孤木不成林，浑身是铁也打不成几根钉子。谷歌的伟大有一多半要归功于公司中亲密无间、协同工作的程序猿们！...谷歌承诺提供一个比当时谷歌搜索引擎还大十倍的索引，为什么要这么大的量呢，因为按照当时的情况，互联网上的数据一年翻一倍（现在岂止一倍……），那这个索引刚好能小跑儿地跟上时代的步伐。...Jeff 和 Sanjay对计算机的了解已经达到了字节级别。Jeff曾经发布过一个名为“每个程序员都应该知道的延迟数列”的列表。...事实上，几乎没有程序员知道这个数字列表：引用L1缓存通常需要半纳秒，或者在内存中顺序读取一兆字节通常需要250微秒。这些数字都深深印刻在了Jeff和Sanjay的脑海中。...它需要精心设计的结构，每个单词都应该发挥作用。这种程序需要与读者产生共鸣。这也意味着代码不仅被看做是实现功能的手段，而其本身也是一种艺术。

8693 0

乐观锁&悲观锁&自旋锁

当线程A要更新数据值时，在读取数据的同时也会读取version值，在提交更新时，若刚才读取到的version值为当前数据库中的version值相等时才更新，否则重试更新操作，直到更新成功。...然后t1t1t1比较预期值E1E1E1和主存中的VVV，发现E1=VE1=VE1=V，说明预期值是正确的，执行N1=V1+1N1=V1+1N1=V1+1，并将N1N1N1的值传入主存。...=V，t2t2t2线程将主存中已经改变的值更新到自己的副本中，再发起重试；直到预期值等于主存中的值，说明没有别的线程对旧值进行修改，继续执行代码，退出； 4....这其实就是乐观锁的实现全过程。如果此时使用的是悲观锁，那么意味着所有程序员都必须一个一个等待操作提交完，才能访问文件，这是难以接受的。 2.什么时候使用悲观锁？...它是为实现保护共享资源而提出一种锁机制。其实，自旋锁与互斥锁比较类似，它们都是为了解决对某项资源的互斥使用。

9044 0

Java高并发：Java内存模型

在指令前插入读屏障，可以让高速缓存中数据失效，强制从主存加载数据。并且，先于这个屏障的指令必须先执行。写屏障：在指令后插入写屏障指令能够让高速缓存中的最新数据立刻刷新到主存，其他线程可见。...图片本质上，这些规则是解决各种场景在并发时的可见性问题：程序顺序规则：一个线程中的每个操作都应该happens-before该线程任何后续操作。即线程内每个操作的结果对该线程所有后续操作都可见。...7 synchronize synchronize是互斥锁，由JVM实现，实际上是调用了操作系统的pthread_mutex_lock系统调用。...每个Java对象都有一个监视器对象同生共死，获取锁失败的线程会进入监视器对象的阻塞队列等待被唤醒。...synchronize是互斥锁，可以保证原子性。 synchronize使用后unlock时会强制将修改的共享变量刷回主存，保证可见性。

8133 0

【数据库09】数据库系统体系结构

，不能够直接用于实现数据库中通用的锁，但是原子操作指令可以用于实现短时间的锁，也称为闩(shuuan)锁，以用于数据库中的互斥。...1.获取锁表上的互斥锁(闩锁) 2.检查是否可以分配请求的锁，如果可以，则更新锁表以表示已分配锁，否则，更新锁表以表示锁请求在该锁的队列中 3.释放表上的互斥锁。...客户端可以采取优化策略来减少网络延迟(network-latency,指在网络上发消息得到响应的时间)的影响。数据库系统也可以采取同样的策略。预取。...这类扩展比适用于的事务是小更新类的事务处理系统，比如银行的存款和取款。下面这些因素影响并行操作的效率，并且可能同时降低加速比与扩展比。串行计算，有些任务必须要串行执行。...由于高速缓存比主存快的多，因此共享内存体系也加入了高速缓存，如果需要对不在高速缓存中的数据项访问，需要从主存提取，称为高速缓存未命中(cache miss).

6033 0

Go 应用优化指北

为什么要做优化这是一个速度决定一切的时代，我们的生活在不断地数字化，线下的流程依然在持续向线上转移，转移过程中，作为工程师，我们会碰到各种各样的性能问题。...因此我们需要知道一些基本的与磁盘、内存、网络相关的基本数据与常见概念：要了解内存的多级存储结构：L1，L2，L3，主存。...还要知道这些不同层级的存储操作时的大致延迟：latency numbers every programmer should know[1]。...要知道基本的文件系统读写 syscall，批量 syscall，数据同步 syscall。要熟悉项目中使用的网络协议，至少要对 TCP, HTTP 有所了解。...numbers every programmer should know: https://colin-scott.github.io/personal_website/research/interactive_latency.html

3034 0

一文讲透 “进程、线程、协程”

虚拟存储器主要提供了三个能力：　将主存看成是一个存储在磁盘上的高速缓存，在主存中只保存活动区域，并根据需要在磁盘和主存之间来回传送数据，通过这种方式，更高效地使用主存为每个进程提供了一致的地址空间，...而同一进程的多个线程是可以共享同一地址空间线程是CPU调度的基本单元，一个进程包含若干线程。线程比进程小，基本上不拥有系统资源。...线程的创建和销毁所需要的时间比进程小很多由于线程之间能够共享地址空间，因此，需要考虑同步和互斥操作一个线程的意外终止会影响整个进程的正常运行，但是一个进程的意外终止不会影响其他的进程的运行。...而且，线程的阻塞状态是由操作系统内核来完成，发生在内核态上，因此协程相比线程节省线程创建和切换的开销协程中不存在同时写变量冲突，因此，也就不需要用来守卫关键区块的同步性原语，比如互斥锁、信号量等，并且不需要来自操作系统的支持...在针对不同的场景对比三者的区别之前，首先需要介绍一下python的多线程(一直被程序员所诟病，认为是"假的"多线程)。那为什么认为Python中的多线程是“伪”多线程呢？

6422 0

揭秘 Google 两大超级工程师：AI 领域绝无仅有的黄金搭档

AI科技评论按，在 Google 从创业公司成长为一代巨头的过程中，有数不清的工程师参与，其中 Jeff Dean 和 Sanjay Ghemawat 是仅有的两位达到 Google Senior...战情室里可不止以上两位，才加入 Google 没几个月的 Sanjay Ghemawat 也在埋头奋战，当然这里还有引荐他进入搜索巨头的老同事 Jeff Dean。...Jeff 就曾写过一个清单，在他看来清单上的延迟数字是每个程序员都应该烂熟于心的。...不过，功勋卓著的 Jeff 和 Sanjay 当然要特事特办，他们是 Google 唯二拿到 11 级的超级工程师。...“我也不知道两人协作的模式是怎么建立的。”Sanjay 回忆道。 “好像加入 Google 之前就开始了吧。”Jeff 说道。 “但为什么要两人共用一个电脑呢？”Sanjay 问道。

4522 0

Go语言基于共享变量的并发

为了效率队内存的写入一般会在每个处理器中缓冲，并在必要时一起flush到主存。这种情况下数据可能会以与当初goroutine写入顺序不同的顺序提交到主存。...如果goroutine在不同的CPU上执行，每个核心都有自己的缓存，一个goroutine的写入对于其他的goroutine的print在主存同步之前是不可见的。...初始化延迟是比较常用的一种处理方式，但是在多协程中如果进行延迟初始化可能会出现互斥问题。...，而goroutine的栈大小最大值有1GB，比传统的固定大小的线程栈要大很多，但一般情况下goroutine不需要太大的栈。...这种调度方式并不需要进入内核的上下文，所以重新调度一个goroutine比调度一个线程代价要低很多。

8284 0

Go语言基于共享变量的并发

为了效率队内存的写入一般会在每个处理器中缓冲，并在必要时一起flush到主存。这种情况下数据可能会以与当初goroutine写入顺序不同的顺序提交到主存。...如果goroutine在不同的CPU上执行，每个核心都有自己的缓存，一个goroutine的写入对于其他的goroutine的print在主存同步之前是不可见的。...初始化延迟是比较常用的一种处理方式，但是在多协程中如果进行延迟初始化可能会出现互斥问题。...，而goroutine的栈大小最大值有1GB，比传统的固定大小的线程栈要大很多，但一般情况下goroutine不需要太大的栈。...这种调度方式并不需要进入内核的上下文，所以重新调度一个goroutine比调度一个线程代价要低很多。

1.4K11 0

高性能队列——Disruptor总论1 背景2 Java内置队列3 ArrayBlockingQueue的问题4 Disruptor的设计方案代码样例性能等待策略Log4j 2应用场景

如果一个线程在持有锁的情况下被延迟执行，例如发生了缺页错误、调度延迟或者其它类似情况，那么所有需要这个锁的线程都无法执行下去。...1个数量级；有锁且多线程并发的情况下，速度比单线程无锁慢3个数量级。...每个cache line通常是64字节，并且它有效地引用主内存中的一块儿地址一个Java的long类型变量是8字节，因此在一个缓存行中可以存8个long类型的变量 CPU每次从主存中拉取数据时，会把相邻的数据也存入同一个...index是long类型，即使100万QPS的处理速度，也需要30万年才能用完无锁设计每个生产者或者消费者线程，会先申请可以操作的元素在数组中的位置，申请到之后，直接在该位置写入或者读取数据。...5,069,086 175,567 Mean Latency 32,757 52 Min Latency 145 29 可见，平均延迟差了3个数量级。

1.6K3 1

Go语言基于共享变量的并发

为了效率队内存的写入一般会在每个处理器中缓冲，并在必要时一起flush到主存。这种情况下数据可能会以与当初goroutine写入顺序不同的顺序提交到主存。...如果goroutine在不同的CPU上执行，每个核心都有自己的缓存，一个goroutine的写入对于其他的goroutine的print在主存同步之前是不可见的。...初始化延迟是比较常用的一种处理方式，但是在多协程中如果进行延迟初始化可能会出现互斥问题。...，而goroutine的栈大小最大值有1GB，比传统的固定大小的线程栈要大很多，但一般情况下goroutine不需要太大的栈。...这种调度方式并不需要进入内核的上下文，所以重新调度一个goroutine比调度一个线程代价要低很多。

1.8K4 0

计算成本降低35倍！谷歌发布手机端自动设计神经网络MnasNet

Jeff Dean在推特推荐了这篇论文：这项工作提出将模型的计算损失合并到神经结构搜索的奖励函数中，以自动找到满足推理速度目标的高准确率的模型。 ?...在以前的工作中，移动延迟（mobile latency）通常是通过另一个代理（例如FLOPS）来考虑的，这些代理经常不准确。...与之前的工作不同，在我们的实验中，我们通过在特定平台（如Pixel phone）上执行模型，从而直接测量实际的推理延迟（inference latency）。...在COCO对象检测任务中，我们的模型实现了比MobileNets更高的mAP质量和更低的延迟。...如表3所示，MnasNet比这些变体在精度和延迟之间的权衡表现更好，这表明在资源有限的CNN模型中，layer的多样性相当重要。

5771 0

美国工程院士、谷歌首席架构师、结对编程榜样杰夫·迪恩(JeffDean)博士简历(5k字)

迪恩(Dean)在长大之前就对电脑很感兴趣，因为他的父亲是一位医生，很希望知道电脑能不能用来帮忙解决健康问题。...此后，迪恩(Dean)在明尼苏达大学读了计算机和经济学本科，毕业论文是研究如何并行训练神经网络——第一次人工智能热潮中的热门主题。...作为一位功勋卓著的谷歌人，杰夫·迪恩(JeffDean)在谷歌内部甚至成了一种文化，每个人都会拿他当俏皮梗的素材(详见II部分的博士传记小节)。...要成为一家优秀IT公司，就不能忽视企业技术团队的培养和交流。...~请备注姓名学校专业年级和单位，添加小助手微信(小程序)缴纳100元年费(欢迎赞助社区活动)，获取VIP会员群邀请！

3.8K2 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭