Konu Başlıkları Gizle
Herkese merhaba,
Bugün Fedora 44 kullanırken AMD Radeon RX 9070 XT ekran kartımla karşılaştığım can sıkıcı bir donanım kilitlenmesi (kernel panic) ve bu durumu nasıl çözdüğümü adım adım paylaşacağım. Özellikle en güncel (bleeding-edge) Linux dağıtımlarını kullanan ve donanımını yepyeni kernel sürümleriyle güncelleyenlerin başına gelebilecek klasik bir amdgpu regresyonu hikayesi.
Belirtiler:
Sistem kilitlendiği için güç tuşundan hard reset atıp, GRUB menüsünden bir önceki çalışan kernel sürümünü (6.19.14) seçerek sisteme sorunsuz giriş yaptım. Ardından çöken hatalı oturumda neler olduğunu görmek için terminali açıp şu komutu çalıştırdım:
Aldığım hata çıktıları tam olarak şuydu:
Sorunun Kaynağı: Loglardan da net bir şekilde anlaşılacağı üzere sorun MES (Micro Engine Scheduler). Sistemi kilitleten şey, 6.19 serisinden devasa bir güncellemeyle geçilen yeni 7.0.4-200 serisi kernel'dı. Bu yeni sürüm, RX 9070 XT'nin donanımsal zamanlayıcısını düzgün yönetememiş ve kartın scheduler'ı yanıt vermeyi kesmiş. Sürücü GPU'yu resetlemeye çalışsa da bellekten işlemleri atamadığı için başarısız olmuş ve sistem kernel seviyesinde donmuş.
Çözüm: Çalışan Kernel Sürümünü Kilitlemek
Bu tür durumlarda en mantıklı ve stabil yol, soruna sebep olan yeni kernel (7.0.4) için AMD ve Fedora tarafından bir yama gelene kadar, sistemi stabil çalışan eski kernel (6.19.14) sürümüne kilitlemek. Böylece sistem normal şekilde güncellemeleri almaya devam ederken, bu çalışan kernel sürümünün otomatik temizlemeye takılıp silinmesini engellemiş oluyoruz.
GRUB'dan boot edip sorunsuz girdiğimiz 6.19.14 sürümündeyken (mevcut çalışan sürüm), kernel'ı kilitleyen şu komutu giriyoruz:
İşlem başarıyla tamamlandığında alacağınız çıktı şu şekilde olacaktır:
Eğer yeni kernel güncellemeleriyle sorunun çözüldüğünden emin olursanız, kilidi kaldırmak için terminale şu komutu girmeniz yeterli:
Sistemi durduk yere bu şekilde siyah ekrana veya TTY kilitlenmesine düşen arkadaşlara rehber olması dileğiyle. İyi sosyaller!
Güncelleme: Sorun Kernel değil, ekran kartı kaynaklı. Yapay zeka çalıştırmak isteyince patlıyor RX 9070 XT.
Bugün Fedora 44 kullanırken AMD Radeon RX 9070 XT ekran kartımla karşılaştığım can sıkıcı bir donanım kilitlenmesi (kernel panic) ve bu durumu nasıl çözdüğümü adım adım paylaşacağım. Özellikle en güncel (bleeding-edge) Linux dağıtımlarını kullanan ve donanımını yepyeni kernel sürümleriyle güncelleyenlerin başına gelebilecek klasik bir amdgpu regresyonu hikayesi.
Sorun Nasıl Başladı?
Sistem açılışında masaüstü (KDE Plasma/Wayland) gelmesi gerekirken, ekranda dikey mavi çizgilerin olduğu sabit bir gri ekran belirdi.Belirtiler:
- Ekranda donmuş gri/mavi çizgili bir görüntü.
- Ctrl + Alt + F3 ile TTY (sanal konsol) ekranına geçiş yapılamaması (siyah ekranda kalması).
- Sistemin tamamen kilitlenmesi (Kernel Mode Setting - KMS çökmesi).
Olay Yeri İncelemesi ve Loglar
Sistem kilitlendiği için güç tuşundan hard reset atıp, GRUB menüsünden bir önceki çalışan kernel sürümünü (6.19.14) seçerek sisteme sorunsuz giriş yaptım. Ardından çöken hatalı oturumda neler olduğunu görmek için terminali açıp şu komutu çalıştırdım:
Bash:
journalctl -b -1 -p 3 | grep -iE 'amdgpu|drm|kernel'
Aldığım hata çıktıları tam olarak şuydu:
Bash:
recep@fedora:~$ journalctl -b -1 -p 3 | grep -iE 'amdgpu|drm|kernel'
May 10 07:00:59 fedora kernel: ACPI BIOS Error (bug): Could not resolve symbol [\_SB.PC00.I2C0], AE_NOT_FOUND (20251212/dswload2-162)
May 10 07:00:59 fedora kernel: ACPI Error: AE_NOT_FOUND, During name lookup/catalog (20251212/psobject-220)
May 10 07:00:59 fedora kernel: ACPI BIOS Error (bug): Could not resolve symbol [\_SB.PC00.I2C1], AE_NOT_FOUND (20251212/dswload2-162)
May 10 07:00:59 fedora kernel: ACPI Error: AE_NOT_FOUND, During name lookup/catalog (20251212/psobject-220)
May 10 04:01:05 fedora kernel: snd_hda_Intel 0000:80:1f.3: no codecs found!
May 10 04:01:17 fedora kernel: amdgpu 0000:03:00.0: MES(0) failed to respond to msg=REMOVE_QUEUE
May 10 04:01:17 fedora kernel: amdgpu 0000:03:00.0: failed to remove hardware queue from MES, doorbell=0x1000
May 10 04:01:17 fedora kernel: amdgpu 0000:03:00.0: MES might be in unrecoverable state, issue a GPU reset
May 10 04:01:17 fedora kernel: amdgpu 0000:03:00.0: Failed to evict queue 0
May 10 04:01:17 fedora kernel: amdgpu 0000:03:00.0: Failed to evict process queues
Module libdrm.so.2 from rpm libdrm-2.4.133-1.fc44.x86_64
Module libdrm_amdgpu.so.1 from rpm libdrm-2.4.133-1.fc44.x86_64
Sorunun Kaynağı: Loglardan da net bir şekilde anlaşılacağı üzere sorun MES (Micro Engine Scheduler). Sistemi kilitleten şey, 6.19 serisinden devasa bir güncellemeyle geçilen yeni 7.0.4-200 serisi kernel'dı. Bu yeni sürüm, RX 9070 XT'nin donanımsal zamanlayıcısını düzgün yönetememiş ve kartın scheduler'ı yanıt vermeyi kesmiş. Sürücü GPU'yu resetlemeye çalışsa da bellekten işlemleri atamadığı için başarısız olmuş ve sistem kernel seviyesinde donmuş.
Çözüm: Çalışan Kernel Sürümünü Kilitlemek
Bu tür durumlarda en mantıklı ve stabil yol, soruna sebep olan yeni kernel (7.0.4) için AMD ve Fedora tarafından bir yama gelene kadar, sistemi stabil çalışan eski kernel (6.19.14) sürümüne kilitlemek. Böylece sistem normal şekilde güncellemeleri almaya devam ederken, bu çalışan kernel sürümünün otomatik temizlemeye takılıp silinmesini engellemiş oluyoruz.
1. DNF Versionlock Eklentisinin Kurulumu
Önce kernel kilitleme işlemini yapabilmek için Fedora'ya gerekli eklentiyi kuruyoruz:
Bash:
sudo dnf install 'dnf-command(versionlock)'
2. Stabil Kernel'ı Kilitleme
GRUB'dan boot edip sorunsuz girdiğimiz 6.19.14 sürümündeyken (mevcut çalışan sürüm), kernel'ı kilitleyen şu komutu giriyoruz:
Bash:
sudo dnf versionlock add kernel-$(uname -r) kernel-core-$(uname -r) kernel-modules-$(uname -r) kernel-modules-extra-$(uname -r)
İşlem başarıyla tamamlandığında alacağınız çıktı şu şekilde olacaktır:
Bash:
"kernel = 6.19.14-300.fc44" için sürüm kilidi ekleniyor.
"kernel-core = 6.19.14-300.fc44" için sürüm kilidi ekleniyor.
"kernel-modules = 6.19.14-300.fc44" için sürüm kilidi ekleniyor.
"kernel-modules-extra = 6.19.14-300.fc44" için sürüm kilidi ekleniyor.
Sonuç ve Takip
Sistemi 6.19 serisinde sabitleyerek sorunu şimdilik donanım seviyesinde çözdük. Fedora sisteminize 7.0.5 veya daha yeni bir kernel güncellemesi geldiğinde, güncellemeler otomatik olarak listeye eklenecek. Sistemi yeni kernel ile açıp MES hatasının çözülüp çözülmediğini güvenle test edebilirsiniz. Olur da aynı sorun yaşanırsa, reset atıp kilitli olan 6.19'dan devam edersiniz.Eğer yeni kernel güncellemeleriyle sorunun çözüldüğünden emin olursanız, kilidi kaldırmak için terminale şu komutu girmeniz yeterli:
Bash:
sudo dnf versionlock clear
Sistemi durduk yere bu şekilde siyah ekrana veya TTY kilitlenmesine düşen arkadaşlara rehber olması dileğiyle. İyi sosyaller!
Güncelleme: Sorun Kernel değil, ekran kartı kaynaklı. Yapay zeka çalıştırmak isteyince patlıyor RX 9070 XT.
Son düzenleme: