JVM崩溃和磁盘/内核读取错误-是否存在相关性？ - 腾讯云开发者社区 - 腾讯云

开发者社区

文档建议反馈控制台

文章/答案/技术大牛

发布

Page Cache 与 Kafka 那些事儿

，查询Page Cache是否存在； 3、Page Cache不存在产生缺页中断，CPU向DMA发出控制指令； DMA 控制器将数据从主存或硬盘拷贝到内核空间（kernel space）的缓冲区（read...Cache是否存在，如果不存在则需要创建； 3、Page Cache 存在后，CPU将数据从用户缓冲区拷贝到内核缓冲区，Page Cache 变为脏页（Dirty Page，内存数据页跟磁盘数据页内容不一致...内核会将被写入的page标记为dirty，并将其加入dirty list中。内核会周期性地将dirty list中的page写回到磁盘上，从而使磁盘上的数据和内存中缓存的数据一致。...同时，page cache中的数据会随着内核中flusher线程的调度以及对sync()/fsync()的调用写回到磁盘，就算进程崩溃，也不用担心数据丢失。...ByteBuffer 中的数据和磁盘中的数据还隔了一层，这一层便是 PageCache，是用户内存和磁盘之间的一层缓存。我们都知道磁盘 IO 和内存 IO 的速度可是相差了好几个数量级。

4K5 1

Flink 常见问题定位指南

如果作业在运行中，但是存在近期的重启记录，也表明可能发生了较严重的问题。此时需要整理问题发生的时间线，便于后续定位参考。作业的吞吐和延时等指标是作业运行是否正常的判断标准。...如果日志中没有太多有用的信息，则还需要对作业运行的环境进行检查，例如排除是否有其他进程干扰，系统是否被重启过，网络和磁盘是否存在瓶颈等等… 二、常见问题处理这里我们总结了Flink作业的常见故障、...我们首先要找到作业崩溃的原因，其次可以适当调大 RestartStrategy 中容错的最大次数，毕竟节点异常等外部风险始终存在，作业不会在理想的环境中运行。...磁盘 I/O • iotop、dstat 如果想了解磁盘的使用情况，则可以用 iotop 等工具来查看 JVM 进程的磁盘读取和写入量。dstat 命令则可以持续的输出系统整体的磁盘读写情况。...网络 I/O • 查看网络资源占用情况：nload、nethogs、iftop • 检查是否丢包：tcpdump 抓包查看（注意内核缓冲区大小） • 定位连接数过多的问题：netstat、ss 指标分析

2K5 0

您找到你想要的搜索结果了吗？

是的

没有找到

Flink 常见问题定位指南

如果作业在运行中，但是存在近期的重启记录，也表明可能发生了较严重的问题。此时需要整理问题发生的时间线，便于后续定位参考。作业的吞吐和延时等指标是作业运行是否正常的判断标准。...如果日志中没有太多有用的信息，则还需要对作业运行的环境进行检查，例如排除是否有其他进程干扰，系统是否被重启过，网络和磁盘是否存在瓶颈等等… 二、常见问题处理这里我们总结了Flink作业的常见故障、...我们首先要找到作业崩溃的原因，其次可以适当调大 RestartStrategy 中容错的最大次数，毕竟节点异常等外部风险始终存在，作业不会在理想的环境中运行。...图片.png 磁盘 I/O • iotop、dstat 如果想了解磁盘的使用情况，则可以用 iotop 等工具来查看 JVM 进程的磁盘读取和写入量。...网络 I/O • 查看网络资源占用情况：nload、nethogs、iftop • 检查是否丢包：tcpdump 抓包查看（注意内核缓冲区大小） • 定位连接数过多的问题：netstat、ss 指标分析

5.3K16 5

Java文件读写原理和虚拟内存

空间描述用户空间是非特权区域，在该区域执行的代码不能直接访问硬件设备，常规进程就在本区域执行，JVM就是常规进程，所以JVM进程驻守在用户空间内核空间是操作系统所在区域，有特别的权利:能与设备控制器通讯...3.虚拟内存通过上面的介绍，我们知道当应用程序需要读取文件的时候，内核首先通过DMA技术将文件内容从磁盘读入内核中的buffer，然后Java应用进程再从内核的buffer将数据读取到应用程序的buffer...3.2 虚拟内存空间可大于实际可用的硬件内存当用户程序访问内存地址时，一般的操作如下：首先虚拟内存系统会到物理内存去查找该虚拟地址是否存在。...如果存在，如A1，则直接从物理内存中读取;如果不存在,如A4则会抛出一个信号。这时虚拟内存系统会去磁盘空间中找，找到后再按一定的策略，将其置入到内存中，如将B2和A4交换。...如果当前不存在与该虚拟页形成有效映射的物理内存页，MMU会向CPU 提交一个页错误。 ?

1.5K0 0

学大数据必懂系列之Page Cache

通俗解释：在应用程序读取磁盘文件时，操作系统内核在读取磁盘时会经过一层Cache，利用这个Cache可以更快速读取数据（毕竟磁盘速度和内存速度还是差了很多）。...Pagecache(页缓存)的作用和原理在磁盘进行标准IO操作时，操作系统内核会先把数据写入到PageCache，这样我读取数据时会直接从Cache中读取同时减少了IO的次数，达到了提升读写效率。...文件系统通过目录项，页缓存树，查询Page Cache是否存在，如果存在则直接读取，避免了对物理磁盘I/O操作。...用户进程由内核态切换回用户态，获得文件数据写入流程应用程序发起写请求，触发系统调用write()函数，用户态切换为内核态；文件系统通过目录项，页缓存树，查询 Page Cache是否存在，如果不存在则需要创建...； Page Cache 存在后，CPU将数据从用户缓冲区拷贝到内核缓冲区，Page Cache 变为脏页（Dirty Page，内存数据页跟磁盘数据页内容不一致），写流程返回；用户主动触发刷盘或者达到特定条件内核触发刷盘

1.2K2 0

从 Linux 内核角度探秘 JDK MappedByteBuffer

是否已经存在映射关系，内核都会强行进行映射，如果这块区域已经存在映射关系，那么后续内核会把旧的映射关系覆盖掉。...而且我们对 Non-Volatile Storage 相关的读写，在内核的处理上是按照磁盘块为单位进行的，即使我们只读取几个字节，内核也会将整个磁盘块大小（4K）的数据读取进来，即使我们只写入了几个字节...如果 mmap 发现进程的虚拟内存空间不足以划分出我们指定映射长度的虚拟内存区域的话，内核就会返回 ENOMEM 错误给 JVM 进程。...随后 JVM 进程进入虚拟文件系统层，在这一层内核首先会查看读取文件对应的 page cache 中是否含有请求的文件数据，如果有，那么直接将文件数据拷贝到 DirectByteBuffer 中返回，避免一次磁盘...并根据内核预读算法同步预读若干文件数据。请求的文件数据和预读的文件数据将被一起填充到 page cache 中。磁盘控制器 DMA 将从磁盘中读取的数据拷贝到页高速缓存 page cache 中。

2751 0

「高并发通信框架Netty4 源码解读（二）」NIO的前世今生及核心概念

如果您的本地代码不是 100%无漏洞，您还可能把 JVM 置于频繁出错乃至崩溃的境地。如果您是操作系统开发商，则可以在您的 JVM 实现中包含本地代码，以 Java API 的形式提供这些特性。...下简单描述了数据从外部磁盘向运行中的进程的内存区域移动的过程。进程使用 read( )系统调用，要求其缓冲区被填满。内核随即向磁盘控制硬件发出命令，要求其从磁盘读取数据。...如果当前不存在与该虚拟页形成有效映射的物理内存页， MMU 会向 CPU 提交一个页错误。...页错误随即产生一个陷阱（类似于系统调用），把控制权移交给内核，附带导致错误的虚拟地址信息，然后内核采取步骤验证页的有效性。内核会安排页面调入操作，把缺失的页内容读回物理内存。...• 虚拟内存系统俘获页错误，安排页面调入，从磁盘上读取页内容，使页有效。 • 一旦页面调入操作完成，文件系统即对原始数据进行解析，取得所需文件内容或属性信息。

6043 0

美团一面：为什么线程崩溃崩溃不会导致 JVM 崩溃

，崩溃 s[] = 'H'; } 访问了进程没有权限访问的地址空间（比如内核空间） // 针对进程的内核空间写入数据，崩溃 *p = ; } 访问了不存在的内存，比如以上错误都是访问内存时的错误...，确实都发送了 SIGSEGV，只是虚拟机不选择退出，而是自己内部作了额外的处理，其实是恢复了线程的执行，并抛出 StackoverflowError 和 NPE，这就是为什么 JVM 不会崩溃且我们能捕获这两个错误...crash 文件（记录了一些堆栈信息或错误），然后退出至此我相信大家明白了为什么发生了 StackoverflowError 和 NPE 这两个非法访问内存的错误，JVM 却没有崩溃。...（可以通过 -XX:ErrorFile=/var/log/hs_err.log 这样的方式指定），这个文件记录了虚拟机崩溃的重要原因，所以也可以说，虚拟机是否崩溃只要看它是否会产生此崩溃日志文件总结...，针对 stackoverflow 其实它采用了一种栈回溯的方法保证线程可以一直执行下去，而捕获空指针错误主要是这个错误实在太普遍了，为了这一个很常见的错误而让 JVM 崩溃那线上的 JVM 要宕机多少次

2.2K2 0

【搜索引擎】提高 Solr 性能

这是一个关于我们如何设法克服搜索和相关性堆栈的稳定性和性能问题的简短故事。语境在过去的 10 个月里，我很高兴与个性化和相关性团队合作。...以下是我们遇到的一些问题：高比例的副本进入恢复并且需要很长时间才能恢复副本中的错误无法到达领导者，因为它们太忙了领导者承受过多的负载（来自索引、查询和副本同步），这导致它们无法正常运行并导致分片崩溃...这减少了缓存和磁盘大小并改进了索引过程。索引/更新过程是否有可能我们有一个过度杀伤的索引/更新过程？鉴于我们的经验，这并不过分。我将把这个问题的分析留给另一篇文章。否则，这将过于广泛。...Solr 使用直接内存来缓存从磁盘读取的数据，主要是索引，以提高性能。当它被暴露时，大部分堆内存被多个缓存使用。 JVM 堆大小需要与 Solr 堆需求估计相匹配，以及更多用于缓冲目的。...磁盘活动结果我们在磁盘活动方面也取得了惊人的成果，索引也大幅下降。外部服务结果其中一项访问 Solr 的服务在 New Relic 中的响应时间和错误率显着下降。

7111 0

肝了很久！一文了解操作系统 IO

精确中断和不精确中断另一个问题是：现代 CPU 大量的采用流水线并且有时还采用超标量(内部并行)。在一些老的系统中，每条指令执行完毕后，微程序或硬件将检查是否存在未完成的中断。...上，然后将其读回来验证写入的是否正确，如果不正确，那么就会再次尝试写入和读取，一直到能够验证写入正确为止。...稳定读指的就是首先从驱动器 1 上进行读取，如果读取操作会产生错误的 ECC，则再次尝试读取，如果所有的读取操作都会给出错误的 ECC，那么会从驱动器 2 上进行读取。...这样我们相当于是对两个驱动器进行读取。崩溃恢复指的是崩溃之后，恢复程序扫描两个磁盘，比较对应的块。...这就取决于崩溃发生的精确时间，有五种情况，下面来说一下第一种情况是崩溃发生在写入之前，在恢复的时候就什么都不需要修改，旧的值也会继续存在。 ?

1.2K1 0

聊聊page cache与Kafka之间的事儿

，如果未命中，再去外部存储读取，并且将读取来的数据也加入缓存。...原因有如下三点： JVM中一切皆对象，数据的对象存储会带来所谓object overhead，浪费空间；如果由JVM来管理缓存，会受到GC的影响，并且过大的堆也会拖累GC的效率，降低吞吐量；一旦程序崩溃...同时，page cache中的数据会随着内核中flusher线程的调度以及对sync()/fsync()的调用写回到磁盘，就算进程崩溃，也不用担心数据丢失。...另外，如果consumer要消费的消息不在page cache里，才会去磁盘读取，并且会顺便预读出一些相邻的块放入page cache，以方便下一次读取。...前面已经说过，page cache中的数据会随着内核中flusher线程的调度写回磁盘。与它相关的有以下4个参数，必要时可以调整。

5.3K4 1

聊聊 page cache 与 Kafka 之间的事儿

，如果未命中，再去外部存储读取，并且将读取来的数据也加入缓存。...原因有如下三点： JVM中一切皆对象，数据的对象存储会带来所谓object overhead，浪费空间；如果由JVM来管理缓存，会受到GC的影响，并且过大的堆也会拖累GC的效率，降低吞吐量；一旦程序崩溃...同时，page cache中的数据会随着内核中flusher线程的调度以及对sync()/fsync()的调用写回到磁盘，就算进程崩溃，也不用担心数据丢失。...另外，如果consumer要消费的消息不在page cache里，才会去磁盘读取，并且会顺便预读出一些相邻的块放入page cache，以方便下一次读取。...前面已经说过，page cache中的数据会随着内核中flusher线程的调度写回磁盘。与它相关的有以下4个参数，必要时可以调整。

8633 0

主线程异常会导致 JVM 退出？

大家好，我是坤哥上周线程崩溃为什么不会导致 JVM 崩溃在其他平台发出后，有一位小伙伴留言说有个地方不严谨他认为如果 JVM 中的主线程异常没有被捕获，JVM 还是会崩溃，那么这个说法是否正确呢，...这四大子类 JVM 抛出这些错误其实是一种防止整个进程崩溃的自我防护机制，这些错误其实是 JVM 内部定义了信号处理函数处理后抛出的，JVM 认为这些错误"罪不致死"，所以选择恢复线程再给这些线程抛错误...（就算线程不 catch 这些错误也不会崩溃）的方式来避免自身崩溃，但如果线程触发了一些其他的非法访问内存的错误，JVM 则会认为这些错误很严重，从而选择退出，比如下面这种非法访问内存的错误就会被认为是致命错误...Unsafe unsafe = (Unsafe) f.get(null); unsafe.putAddress(, ); 回过头来看，除了这些致命性错误导致的 JVM 崩溃，还有哪些情况会导致 JVM...守护线程其实是为其他线程服务的线程，比如垃圾回收线程就是典型的守护线程，既然是为其他线程服务的，那么一旦其他线程都不存在了，守护线程也没有存在的意义了，于是 JVM 也就退出了，守护线程通常是 JVM

1.4K2 0

五分钟聊完磁盘

对于磁盘驱动程序来说，一个非常重要的特性就是控制器是否能够同时控制两个或者多个驱动器进行磁道寻址，这就是重叠寻道(overlapped seek)。...上，然后将其读回来验证写入的是否正确，如果不正确，那么就会再次尝试写入和读取，一直到能够验证写入正确为止。...稳定读指的就是首先从驱动器 1 上进行读取，如果读取操作会产生错误的 ECC，则再次尝试读取，如果所有的读取操作都会给出错误的 ECC，那么会从驱动器 2 上进行读取。...这样我们相当于是对两个驱动器进行读取。崩溃恢复指的是崩溃之后，恢复程序扫描两个磁盘，比较对应的块。...如果在稳定写期间出现 CPU 崩溃会怎么样？这就取决于崩溃发生的精确时间，有五种情况，下面来说一下第一种情况是崩溃发生在写入之前，在恢复的时候就什么都不需要修改，旧的值也会继续存在。 ?

1.1K2 0

一文介绍kafka为什么这么快

，如果未命中，再去外部存储读取，并且将读取来的数据也加入缓存。...原因有如下三点： JVM中一切皆对象，数据的对象存储会带来所谓object overhead，浪费空间；如果由JVM来管理缓存，会受到GC的影响，并且过大的堆也会拖累GC的效率，降低吞吐量；一旦程序崩溃...同时，page cache中的数据会随着内核中flusher线程的调度以及对sync()/fsync()的调用写回到磁盘，就算进程崩溃，也不用担心数据丢失。...另外，如果consumer要消费的消息不在page cache里，才会去磁盘读取，并且会顺便预读出一些相邻的块放入page cache，以方便下一次读取。...前面已经说过，page cache中的数据会随着内核中flusher线程的调度写回磁盘。与它相关的有以下4个参数，必要时可以调整。

4172 0

【Linux】多线程概念再理解

是一个整体 ---- 若要把文件加载到内存，以4KB为单位，需要在两个方面下考虑 1.文件系统 +编译器若要从外设磁盘中读取4KB，前提是文件系统认4KB，文件本身按照4KB进行存储所以文件在磁盘时...的数据空间把物理内存中存放数据的空间称之为页框磁盘中数据块称之为页帧内存在实际进行内存管理的时候，也要是4KB为单位的 ---- 内存管理的本质：将磁盘中特定的4KB块(数据内容)放入到哪一个物理内存的...若以块方式存储，则多出的空间是否浪费？...hello world在常量区，只能被读取，不能被修改，所以*s='w'，是错误的 ---- s里面保存的是指向的字符的虚拟起始地址 *s寻址时，会伴随虚拟地址到物理地址的转换 ---- 通过查页表的方式...---- 运行时会发生段错误，刚开始线程是可以运行的，但是发生段错误后，进程崩溃了在多线程程序中，任何一个线程崩溃了，最终都会导致进程崩溃缺乏访问控制的验证定义一个全局变量，线程1和主线程把全局变量的地址和全局变量的数据打印出来

1751 0

一文搞懂网络通信的基石✅IO模型与零拷贝

，发送到网卡上再响应给客户端在这个过程中，以服务端的视角可以看成先从磁盘中读取数据，再往网卡上写数据由于磁盘、网卡属于外部设备，由于外部设备速度慢，不会使用CPU进行拷贝数据，而是通过DMA进行数据拷贝...，当服务端接收到请求后：读取磁盘要先切换为内核态，然后由DMA进行拷贝（将磁盘上的数据拷贝到内核缓冲区），此时用户线程一直阻塞DMA拷贝完成后，由CPU将数据从内核缓冲区拷贝到用户态内存上的用户缓冲区，...，而堆内存为JVM的（属于JVM管理）在这个过程中：用户线程一直阻塞，读数据与写数据存在大量重复拷贝、状态切换，都会导致性能被大大浪费通过IO模型、零拷贝等优化方式能够优化这个过程，提升响应速度IO模型同步阻塞在同步阻塞...在传统的流程处理中，需要先从内核拷贝到直接内存，再从直接内存拷贝到JVM堆内存既然直接内存和JVM堆内存都处于用户态的内存，为什么不从内核直接拷贝到JVM堆内存呢？...，拷贝数据是将内核缓冲区拷贝到用户缓冲区同步阻塞IO模型（BIO）发起系统调用后会阻塞到数据拷贝完成，不适合处理高并发网络通信的场景同步非阻塞IO模型使用轮询的方式判断数据是否就绪，就绪再同步阻塞等待数据拷贝信号驱动模型中数据就绪后通过信号通知应用发起系统调用读取数据

4553 1

彻底搞懂高性能IO之道

，保证内核安全，操作系统将内存寻址空间划分为两部分：内核空间（Kernel-space），供内核程序使用用户空间（User-space），供用户进程使用为了安全，内核空间和用户空间是隔离的，即使用户的程序崩溃了...基于 DMA 访问方式，系统主内存与硬件设备的数据传输可以省去CPU 的全程调度值得注意的是：读写操作基于系统调用实现读写操作经过用户缓冲区，内核缓冲区，应用进程并不能直接操作磁盘应用进程读操作时需阻塞直到读取到数据.../O系统调用时，需要传入数据所在缓冲区起始地址和长度由于JVM GC的存在，导致对象在堆中的位置往往会发生移动，移动后传入系统函数的地址参数就不是真正的缓冲区地址了可能导致读写出错，为了解决上面的问题...，主要原因就是由于OS使用PageCache机制对读写访问操作进行了性能优化：页缓存读取策略：当进程发起一个读操作（比如，进程发起一个 read() 系统调用），它首先会检查需要的数据是否在页缓存中...：如果在，则放弃访问磁盘，而直接从页缓存中读取如果不在，则内核调度块 I/O 操作从磁盘去读取数据，并读入紧随其后的少数几个页面（不少于一个页面，通常是三个页面），然后将数据放入页缓存中 ?

1.1K2 0

Kafka为什么这么快？

零拷贝技术零拷贝技术是指在读写数据时，避免将数据在内核空间和用户空间之间进行拷贝，而是直接在内核空间进行数据传输。...对于 Kafka 来说，它使用了零拷贝技术来加速磁盘文件的网络传输，以提高读取速度和降低 CPU 消耗。下图说明了数据如何在生产者和消费者之间传输，以及零拷贝原理。...这样做的好处是极大地提高了I/O效率，降低了CPU和内存的消耗。 2. 仅可追加日志结构 Kafka 中存在大量的网络数据持久化到磁盘（生产者到代理）和磁盘文件通过网络发送（代理到消费者）的过程。...堆内存大小堆内存是 JVM 用来存储对象实例的内存区域，它会受到 GC 的管理和回收。...GC 算法和参数 GC 算法是 JVM 用来回收无用对象占用的堆内存空间的方法，它会影响 Kafka 的停顿时间和吞吐量。

3312 1

垃圾收集不健康的JVM，这是一种主动方法

但是，这有一个严重的问题：Java堆转储被写入并存储在磁盘上，如果我们反复执行自动终止操作，可能会填满磁盘。因此，我们开始研究获取OS本地核心转储而不是JVM特定的堆转储的方法。...我们意识到，如果我们可以让一个不健康的JVM发送自己的SIGABRT而不是SIGKILL，则Linux内核将自动为我们编写一个核心转储。...我们喜欢这种方法，因为它是所有语言运行时（包括尤其是node.js和Python）的标准配置，最重要的是因为它允许我们收集甚至非常大的核心/堆转储并将其写入管道，而无需向驱动器提供额外的磁盘空间。...为了防止写入核心文件会导致磁盘空间不足的情况，Linux对写入的核心文件的大小提供了资源限制（ulimit -c）。默认资源限制为零，因此内核根本不写入任何核心文件。...此外，流核心转储和脱机转换工具使我们能够调试和修复Cassandra和Elasticsearch数据存储产品中的复杂错误，以便我们的应用程序获得所需的“始终可用”的数据存储。

1.4K1 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭