首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >崩溃: Ubuntu 20.04,Aorus x570 Elite和Ryzen 5 3600

崩溃: Ubuntu 20.04,Aorus x570 Elite和Ryzen 5 3600
EN

Ask Ubuntu用户
提问于 2020-07-26 20:50:23
回答 1查看 2.4K关注 0票数 3

症状:

<#>The系统在启动后的2分钟到1小时之间冻结,大约10秒后自动重新启动。无论系统是坐在登录屏幕上,空闲在桌面上,还是在观看视频等,温度读数都是正常的,导致冻结+重新启动。

我认为这意味着内存问题,但我尝试过重取模块、交换插槽、增加DRAM电压等。Ryzen和Aorus主板上的线程让我掉进兔子洞,我一直在切换c状态,增加空闲DRAM的功率等等。没有喜悦。

请注意,这个AMD Ryzen 5 3600是不是一个有缺陷的CPU部件;我通过一个RMA交换机与AMD交换了它,没有区别!(当我为CPU安装AMD Ryzen 3400G时,系统非常坚固。然而,对于这个系统,我不能长期使用CPU/APU。)

尽可能多的信息,你可以站在下面。如果我漏掉了什么,请告诉我,这可能有助于进一步诊断出什么问题。

我花了几周宝贵的时间来尝试使这个构建稳定。在这一点上,我觉得我已经尝试了一切,除了在我的头上挥舞一只死鸡。请帮我找出根本原因!我的智慧已尽,我感到非常沮丧。:(

(潜在)相关其他线程的简短列表:

硬件

  • 千兆字节x570 Aorus主板(UEFI版本: F11或F20)
  • AMD Ryzen 5 3600 6-核处理器
  • 16 LPX海盗船复仇LPX存储器(DDR4 2x8GB 3200 LPX)
  • MSI GeForce GTX 970游戏4G
    • 08:00.0 VGA兼容控制器: NVIDIA公司GM204 (rev a1)

主要成分图

Things --我尝试过没有改变&

  • 彻底测试内存(一夜之间,没有检测到任何问题)
  • 重摄取记忆
  • 将内存交换到另一个内存库
  • 在同一银行内交换记忆棒
  • 通过RMA与AMD交换CPU
  • 不同的UEFI版本(F11和F20)

引导时报告的错误通常如下所示:

代码语言:javascript
运行
复制
sudo journalctl | grep -i "hardware err"

Jul 13 17:28:36 obelisk-ubuntu kernel: mce: [Hardware Error]: Machine check events logged

Jul 13 17:28:36 obelisk-ubuntu kernel: mce: [Hardware Error]: CPU 2: Machine Check: 0 Bank 5: bea0000000000108

Jul 13 17:28:36 obelisk-ubuntu kernel: mce: [Hardware Error]: TSC 0 ADDR 1ffff87930eee MISC d012000100000000 SYND 4d000000 IPID 500b000000000

Jul 13 17:28:36 obelisk-ubuntu kernel: mce: [Hardware Error]: PROCESSOR 2:870f10 TIME 1594686497 SOCKET 0 APIC 4 microcode 8701013

Jul 13 20:06:36 obelisk-ubuntu kernel: mce: [Hardware Error]: Machine check events logged

Jul 13 20:06:36 obelisk-ubuntu kernel: mce: [Hardware Error]: CPU 4: Machine Check: 0 Bank 5: bea0000000000108

Jul 13 20:06:36 obelisk-ubuntu kernel: mce: [Hardware Error]: TSC 0 ADDR 1ffffbbf30eee MISC d012000100000000 SYND 4d000000 IPID 500b000000000

Jul 13 20:06:36 obelisk-ubuntu kernel: mce: [Hardware Error]: PROCESSOR 2:870f10 TIME 1594695977 SOCKET 0 APIC a microcode 8701021

Jul 15 16:57:44 obelisk-ubuntu kernel: mce: [Hardware Error]: Machine check events logged

Jul 15 16:57:44 obelisk-ubuntu kernel: mce: [Hardware Error]: CPU 1: Machine Check: 0 Bank 5: bea0000000000108

Jul 15 16:57:44 obelisk-ubuntu kernel: mce: [Hardware Error]: TSC 0 ADDR 1ffff89330eee MISC d012000100000000 SYND 4d000000 IPID 500b000000000

Jul 15 16:57:44 obelisk-ubuntu kernel: mce: [Hardware Error]: PROCESSOR 2:870f10 TIME 1594857445 SOCKET 0 APIC 1 microcode 8701021

更多信息:

UEFI设置

下图中的设置指的是F20,这是最新的稳定UEFI版本。

Things我尝试过没有改变(注意没有任何类型的超频)

  • 在“优化的默认”设置下,F11和F20之间的千兆字节UEFI的每个版本
  • 将核心DRAM电压提高到1.35V
  • 下面的许多设置/图片切换到一个或另一个方向:
    • CPU时钟比: Auto (36.00)
    • CPU时钟控制:自动(100.00MHz)
    • 极限内存配置文件(X.M.P):禁用
    • CPU Vcore: Auto
    • CPU Vcore负载线校准:自动
    • CSM支持:启用
    • SMT模式:禁用
    • 电源怠速控制:典型的电流怠速
    • IOMMU:启用
    • 支持向量机模式:启用
    • ACS启用: Auto
    • 启用AER上限: Auto
    • 全局C状态控制:禁用
    • 拖动电源选项>启用断电:禁用

软件

Ubuntu 20.04 LTS

代码语言:javascript
运行
复制
$ uname -a 
Kernel: Linux obelisk-ubuntu 5.4.0-40-generic #44-Ubuntu SMP Tue Jun 23 00:01:04 UTC 2020 x86_64 x86_64 x86_64 GNU/Linux
代码语言:javascript
运行
复制
$ grep GRUB_CMDLINE_LINUX_DEFAULT /etc/default/grub
GRUB_CMDLINE_LINUX_DEFAULT="quiet splash atkbd.reset=1 i8042.reset pci=assign-busses apicmaintimer idle=poll reboot=cold,hard processor.max_cstate=1 rcu_nocbs=0-11"

我还尝试过安装ZenStates包并将其设置为禁用C6。

这是我认为你可能会要求的一切

EN

回答 1

Ask Ubuntu用户

发布于 2021-03-07 19:45:28

我面临着同样的问题,在主板类型上使用3700 X,运行Debian和不同的内核。系统很久以前是稳定的,当我更新bios和安装新内存时,问题就开始了。今天试图将bios恢复到F3版本,现在系统似乎又恢复了稳定。不幸的是,这个旧的bios版本似乎不支持我的内存库中的ecc。

票数 0
EN
页面原文内容由Ask Ubuntu提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://askubuntu.com/questions/1262265

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档