Kernel Panics am laufenden Band unter Sonoma, mit Mojave gar nichts. DFU Restore probiert, AHT findet nichts - Diagnosehilfe benötigt

cryptokatze

Mitglied
Thread Starter
Dabei seit
18.01.2024
Beiträge
5
Reaktionspunkte
0
Hab hier ein günstig erworbenes (300EUR) MacBook Pro 15" 2018, das mich vor Rätsel stellt.

Der Vorbesitzer hatte offenbar Probleme, das System neuaufzusetzen.

Gut, der Preis war verockend, optisch tadelloser Zustand, vielleicht war der Vorbesitzer ja nur ein DAU, hab schon mehrmals tadellose Computer gekauft, deren Vorbesitzer sie wegen Softwarefehlern abgeschrieben hatten.

Außerdem wegen der 32GB Ram ein nettes Sidegrade, so lange ich noch mit den Intel Macs rumkrebse.

Jedenfalls...

Sonoma Installation lief mit Kernel Panic beim ersten Rebooten nach der Installation ab. Einer, dann Ruhe.

Kam dann leider relativ häufig wieder. Irgendwann auch kein. boot mehr, nur noch "no boot device" und ein Folder-Symbol.

DFU Restore, Mojave (frühestes unterstütztes OS) per Internet Recovery neu draufgespielt. Getestet. Völlig stabil und unauffällig. Stundenlang Cinebench und Unigine Valley laufen lassen, stabil.

Beim Upgrade auf Sonoma wieder ein Fehler, "storage system verify or repair failed -69716".

Die SSD hat sowohl mit DxDrive als auch Smart Utility keinerlei Auffälligkeiten.

CPU&GPU (und damit wahrscheinlich auch der RAM) sind in stundenlanger Stresstest-Situation stabil geblieben.


Was ist hier los?

Probleme mit dem T2-Chip? Da ist ja auch der SSD-Controller dran.


Mal Sonoma auf externe SSD installieren und schauen, ob es wieder zu Abstürzen kommt?

Apple Hardware Diagnostics sagt auch, das alles in Ordnung wäre. Klar...


Ich hab mal ein 2012er mit defekter dGPU gelötet, da war ich mächtig stolz auf mich.

Aber das Teil stellt mich vor ein Rätsel.

Stabil mit altem OS, instabil mit Sonoma...


Habt ihr Tipps, was ich noch diagnostizieren sollte?

Bevor ich's aufgebe und als Ersatzteilspender verschrebele..

Danke.
 
Memtest von org oder com mit Bootstick.

Sonst wohl SSD Problem, probier doch mal eine externe Installation mit Sonoma.

Hatte bei meinem 2012er Mini Probleme -69xxx beim Catalina Installieren weil das SATA UDMA Fehler machte.
 
Memtest werd ich auf jeden Fall noch laufen lassen.

Aber dass Stresstests stundenlang stabil laufen wundert mich etwas.

SSD hängt ja an dem T2-Controller. Kann da was im Argen sein, ohne dass die SMART-Werte auffällig wären?

Und was mich so ratlos macht, ist, dass das Ganze so OS-abhängig ist.
 
Die zufällige RAM Belegung aus Sicherheitsgründen macht es nicht unwahrscheinlich, dass es stundenlang stabil läuft.
Wenn es defekte Stellen gibt, dann liegt ja immer was anderes dort.

Hast denn die interne SSD komplett mal neu partitioniert usw bevor du Sonoma probiert hast?

Ratlos muss das nicht machen, Apple kann ja bessere Checks integriert haben mit neuerem MacOS, damit es bei Hardware Problemen schon beim Install auffällt.
Wie gesagt wegen defektem SATA Kabel ging bei mir schon die Catalina Installation reproduzierbar nicht.
Erst nach dem Tausch war -69512 oder so weg.
 
Okay, Memtest lief gar nicht erst durch, haufenweise Speicherfehler. Dann liegt's doch am RAM... Schade.
 
1) Versuchs mal mit Ventura, wenn es damit einwandfrei läuft würde ich dem verbuggten Sonoma nicht nachweinen. Und ein neueres MacOS wird das Modell dieses Jahr sowieso nicht mehr bekommen, dann hat es sich erledigt.

2) Vielleicht ist die SSD kaputt. Wenn du es testen willst, nimm ein funktionierendes MacOS und schreib einmal die Platte voll und danach unbedingt nochmal auslesen, spätestens hier meldet die SSD dann Fehler zurück. Bei einer einwandfreien SSD kannst du das 100x hintereinander machen, bei einer defekten wird es sich beim ersten Durchlauf schon zeigen.

Da APFS einige Tricks auf Lager hat um Schreibleistung zu minimieren, musst du dafür einen Umweg nehmen. Mit Disk Utility leeres Image erstellen, auf irgendeine Größe setzen die die Größe der SSD überschreitet, zB 10TB, und wichtig auf "sparse disk image" umstellen und das Format auf "Mac OS Extended (Journaled)", dann noch Verschlüsselung von aus auf 128-bit.

Namen fürs Volume (ohne Leerzeichen) zB "volume_xyz", dann der Befehl im Terminal zum Vollschreiben der SSD:

Code:
sudo dd if=/dev/zero of=/Volumes/volume_xyz/img.img bs=512k

Nur über diesen Workaround ist sichergestellt, dass die SSD sowohl vollgeschrieben wird als auch auf schnellstem Wege. Alternative Methoden schreiben langsamer oder nur Nuller, was bei diesem Mac verhindern würde, dass tatsächlich die SSD-Hardware arbeitet.

Irgendwann bricht der Befehl von selbst ab weil der Speicherplatz knapp wird. Jetzt noch einmal alles auslesen und dann die Smart-Werte prüfen. Code zum Auslesen:

Code:
sudo dd if=/Volumes/volume_xyz/img.img of=/dev/zero bs=512k

Am besten startest du das Tool zum Prüfen der Smart-Werte schon bevor du anfängst, weil wenn die Platte erstmal voll ist zeigt MacOS sehr seltsame Verhalten und könnte eventuell scheitern neue Programme noch aufzumachen. Die MacOS-Systemplatte sollte nie annähernd komplett voll werden. Danach kannst du MacOS vermutlich noch einmal neu installieren und nochmal auf die Smart-Werte schauen. Wenn das Programm dann nicht Alarm schreit dürfte die SSD in Ordnung sein.

Der Umweg hier schreibt ein verschlüsseltes mitwachsendes Image mit einem File aus lauter Nullern voll, das HFS-Dateisystem sorgt dafür dass diese ganzen Nuller an die Verschlüsselungsebene weitergereicht werden die daraus sehr effizient zufällige Daten generiert die von MacOS oder der SSD nicht weiter optimiert werden können, sodass die SSD keine Wahl hat als das alles auf die NAND-Speicher zu schreiben. Im letzten Schritt werden alle diese Daten wieder angefordert und die SSD muss alles wieder 1:1 auslesen, der Befehl liest die Daten einfach ins Nirgendwo (/dev/zero). Wenn die Platte defekt ist, wird sie spätestens beim Versuch alle Daten korrekt auszulesen Lesefehler erzeugen die dann im Smart-Log landen.

Bei der NVMe-SSD dieses Macs ist der relevante Smartwert dieser: "Media and Data Integrity Errors" - Wenn da etwas Anderes als 0 steht ist die SSD defekt, auch wenn der Wert "nur" 1 betragen sollte. Eine gesunde SSD hat da immer 0 stehen.

Ich kann zum Auslesen smartctl empfehlen, bekommst du über brew: https://formulae.brew.sh/formula/smartmontools

Nach der Installation kannst du mit dem Befehl hier den Wert auslesen:

Code:
/opt/homebrew/bin/smartctl -a /dev/disk0
 
  • Gefällt mir
Reaktionen: cryptokatze
Okay, Memtest lief gar nicht erst durch, haufenweise Speicherfehler. Dann liegt's doch am RAM... Schade.
Nö, du kannst ja mit nvram Befehl maxmem setzen, damit den defekten Bereich quasi sperren.
Klappt aber nur wenn natürlich die Fehler im oberen/hinteren Bereich liegen.
Z.b. hier auf 8GB.
Code:
sudo nvram boot-args="maxmem=8192"
 
Zuletzt bearbeitet:
Das könnte ich noch probieren, danke für die guten Tipps!

Was ich mir gedacht habe...

Es gibt doch einzelne RAM-BGAs zu kaufen. Und Anbieter, die BGA-Lötarbeiten machen.

Kann ich den defekten Chip lokalisieren und gezielt diesen tauschen? Das könnte sich vom Aufwand her vielleicht noch lohnen.
 
Wirtschaftlich dürfte das nicht sein.
Du hast ja quasi schon 300€ versenkt.
Nicht, dass es Eskalierendes Commitment wird.
 
Wie lokalisiere ich denn den defekten Chip, geht das nur für eine komplette Bank, oder kann mir Memtest sagen, welcher Chip genau Ärger macht?

Momentan hält sich der Schaden in Grenzen, ich denke, für ein top erhaltenes Display mit Topcase bekomme ich das investierte Geld schon in etwa wieder. Die Frage ist, wie viel ich noch hinterherwerfe...
 
Guck doch mal was ein Austausch Logicboard so kostet.

Welcher Chip das ist, kannst mit Schaltplan, Chipgröße und memtest abschätzen.
 
Zurück
Oben Unten