Massive Probleme mit El Capitan

Hallo allerseits! Der Memtest lief nun über 12 Stunden durch. Wie es aussieht hat er keinen einzigen Fehler gefunden. Dafür aber bei jedem der 4 Durchgänge die bereits erwähnte Notiz RAM may be vulnerable to high frequency row hammer bit flips. Hier noch einige Bilder vom fertigen Test:

Bildschirmfoto 2016-02-20 um 09.24.04.png

Bildschirmfoto 2016-02-20 um 09.24.20.png

Bildschirmfoto 2016-02-20 um 09.24.32.png

Hier auch noch zwei Screenshots aus dem Festplattendienstprogramm:

Bildschirmfoto 2016-02-20 um 09.40.07.png

Bildschirmfoto 2016-02-20 um 09.40.24.png
 
Zuletzt bearbeitet:
Ich habe ein wenig recherchiert und bin mir aktuell gar nicht mehr sicher ob ich die Installation von El Capitan überhaupt ordnungsgemäß durchgezogen habe. Ist es für eine saubere Neuinstallation zwingend notwendig die Installation von El Capitan über einen bootfähigen USB Stick durchzuführen? Ich bin wie folgt verfahren: MacBook aus. Neustart. Über den Recovery Modus und das Festplattendienstprogramm die Festplatte (die eingerückte "Macintosh HD") komplett gelöscht (OS X Extended (Journaled)). Gleich im Anschluss - ebenfalls über das OS X Dienstprogramm - OS X neu installiert. Führt diese Vorgehensweise zu dem selben Ergebnis wie die Installations-Variante über den bootfähigen USB Stick?

Undja, hat vielleicht jemand eine Idee wie das Test-Ergebnis meines Memtest zu deuten ist?
Tausend Dank für eure Hilfe!
 
hi..
die Installation von EC ist schon OK so, zu dieser Meldung von Memtest86 kann ich nichts sagen, hatte ich noch nie..

Gruss Franz..
 
Hallo Franz!

Vielen Dank für deine rasche Antwort. Zu der Notiz bzgl. der Hammer Tests habe ich leider nicht allzu viel brauchbare Informationen gefunden. Laut der PassMark Seite irgendwie nicht Fisch und nicht Fleisch. Die Lösungsansätze gehen hierbei auch sehr weit auseinander:
  • Do nothing
  • Replace the RAM modules
  • Use RAM modules with error-checking capabilities (eg. ECC)
Du hast erwähnt, dass eventuell das Logicboard oder auch andere Fehlerquellen in Betracht kommen. Wie würdest du vorgehen um die Fehlerquelle weiter einzugrenzen?
 
Das mit dem Rowhammer ist nicht dein Fehler.

Rowhammer kam vor ~1 Jahr auf und erlaubt fremde Software zu exploiten (auszunutzen) ohne das die Software als solche eine Lücke hat in dem quasi auf den Ram eingehämmert wird durch immer wiederkehrendes beschreiben benachbarter Zellen mit einem bestimmten, gleichen Muster in einer dritten Software. In dem Falle können sich die Werte benachbarter Zellen (das eigentliche Ziel) ändern und die freme Software ausgenutzt werden.

Dein BIOS/EFI Hersteller kann ein Update rausbringen, also Apple, um das Problem abzumindern. RAM Zellen müssen immer wieder aufgefrischt (refreshed) werden um den Inhalt nicht zu verlieren. Das BIOS Update verkürzt das Intervall und der Angriff dauert so länger. Bei meinem Thinkpad gabs jedenfalls im Sommer ein BIOS Update explizit dazu.

http://users.ece.cmu.edu/~yoonguk/papers/kim-isca14.pdf
 
Zuletzt bearbeitet:
hi..
es kann auch das HDD-kabel fehlerhaft sein..

Gruss Franz..
 
Dein RAM sieht gut aus.

Bin mir nicht sicher ob diese Attribute für eine Diagnose auch noch relevant sind:

Hier ist aber ein Problem. Hardware ECC Recovered sollte 0 sein im Idealfall?! Vielleicht aber auch nicht. Scheint Hersteller spezifisch zu sein.

Edit: Vielleicht auch nicht. Jetzt weiß ich, wieso mir das nicht bekannt vorkommt. Bei meiner Toshiba HDD und Crucial SSD gibts das gar nicht.

Code:
=== START OF INFORMATION SECTION ===
Model Family:  Toshiba 3.5" DT01ACA... Desktop HDD
Device Model:  TOSHIBA DT01ACA200

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME  FLAG  VALUE WORST THRESH TYPE  UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate  0x000b  100  100  016  Pre-fail  Always  -  0
  2 Throughput_Performance  0x0005  139  139  054  Pre-fail  Offline  -  70
  3 Spin_Up_Time  0x0007  128  128  024  Pre-fail  Always  -  295 (Average 295)
  4 Start_Stop_Count  0x0012  100  100  000  Old_age  Always  -  439
  5 Reallocated_Sector_Ct  0x0033  100  100  005  Pre-fail  Always  -  0
  7 Seek_Error_Rate  0x000b  100  100  067  Pre-fail  Always  -  0
  8 Seek_Time_Performance  0x0005  124  124  020  Pre-fail  Offline  -  33
  9 Power_On_Hours  0x0012  100  100  000  Old_age  Always  -  910
10 Spin_Retry_Count  0x0013  100  100  060  Pre-fail  Always  -  0
12 Power_Cycle_Count  0x0032  100  100  000  Old_age  Always  -  419
192 Power-Off_Retract_Count 0x0032  099  099  000  Old_age  Always  -  1479
193 Load_Cycle_Count  0x0012  099  099  000  Old_age  Always  -  1479
194 Temperature_Celsius  0x0002  222  222  000  Old_age  Always  -  27 (Min/Max 22/40)
196 Reallocated_Event_Count 0x0032  100  100  000  Old_age  Always  -  0
197 Current_Pending_Sector  0x0022  100  100  000  Old_age  Always  -  0
198 Offline_Uncorrectable  0x0008  100  100  000  Old_age  Offline  -  0
199 UDMA_CRC_Error_Count  0x000a  200  200  000  Old_age  Always  -  0
 
hi..
es kann auch das HDD-kabel fehlerhaft sein..

Gruss Franz..


Das sollte im Idealfall als CRC Error Count in den SMART Werten auftauchen, die sind jedoch 0. Aber überprüfen kann man son Kabel immer mal, auch ob es richtig sitzt.


Edit: @arcade fire: Falls dein System noch bootet, kannst du auch mal in die Konsole schauen (Anwendungen->Diensprogramme->Konsole). Da listen das System und Anwendungen Fehler. Meistens hilft das enorm bei der Fehlersuche.

So sehe ich jedenfalls an den SMART und memtest86 Ergebissen keine Fehler.
 
Franz und Xentric, besten Dank für eure Einschätzungen! Habe nochmals schnell Smart Utility laufen lassen. Hier nochmals eine aktueller Screenshot zu den Attributen der Festplatte:

Bildschirmfoto 2016-02-20 um 19.24.51.png

Bzgl. dem HDD-Kabel hilft wahrscheinlich nur ein einfaches Austauschen, oder? Was könnten sonst noch für Ursachen in Frage kommen?
 
Hey Xentric! Danke, danke! Welche Protokolle sollte ich hier am besten auslesen und posten?
 
Hey,

Entweder du suchst selbst nach den Einträgen in Google, oder du lädst alles hoch, z.b. bei pastebin.com oder in dropbox/etc. in einem Textdokument abgespeichert.

Da ist nichts vertrauliches drin, da es ja Debugginginformationen sind. Du kannst alles kopieren und einfügen. Umso mehr, desto besser, falls du es nicht selbst verstehst.
 
Hallo Xentric und Co!

Ich habe ein wenig nachgeforscht und hoffentlich die richtigen Protokolle (Benutzer- und System-Diagnoseberichte) aus der Konsole ausgelesen und unter folgendem Link als RTF-Dateien hochgeladen: konsole_arcade_fire.zip

Noch ergänzend zur Information: Der Clean Install erfolgte am Donnerstag (18.02.) Nachmittag. Zu Beginn schien alles gut zu laufen. Als neue Software wurde damals ausschließlich Firefox installiert. Von einem Backup wurde hierzu mein altes Benutzer-Profil inkl. aller Einstellung eingespielt. Laut System-Diagnoseberichte dann am Donnerstag Abend der erste Absturz (Wakeups, Firefox). Bzgl. der Uhrzeiten wurde - sofern ich mich recht erinnern kann - die korrekte Zeitzone erst einige Stunden nach dem Clean Install ordnungsgemäß eingestellt. Denke deshalb sind die Protokolldaten eventuell ein wenig durcheinander.

Ich weiß nicht warum, aber seit ich Firefox wieder runter genommen habe, hatte ich nur einen Crash bzw. Freeze - kurz danach bei einem Neustart. Ok, der Memtest brach anfangs mit der Boot-CD immer ab, aber sonst seit Freitag Mittag keine Probleme mehr. Ruhezustand wird ordnungsgemäß beendet und auch alle bisherigen Neustarts verliefen verdächtig problemlos. Aber vielleicht auch alles nur ein blöder Zufall?

Auf jeden Fall nochmals tausend Dank für all eure Hilfe und Unterstützung!
LG
 
Ich weiß nicht warum, aber seit ich Firefox wieder runter genommen habe, hatte ich nur einen Crash bzw. Freeze - kurz danach bei einem Neustart. Ok, der Memtest brach anfangs mit der Boot-CD immer ab, aber sonst seit Freitag Mittag keine Probleme mehr. Ruhezustand wird ordnungsgemäß beendet und auch alle bisherigen Neustarts verliefen verdächtig problemlos. Aber vielleicht auch alles nur ein blöder Zufall?

Ich denke Zufall. Eigentlich darf Firefox kein System crashen, da es nicht nativ auf die Hardware zugreift. Evlt Koinzidenz einfach weil man den Browser so oft benutzt,..

Sorry, ich wusste nicht, dass Apple die Konsole aufgeräumt hat. Früher gabs da nur eine Ansicht, die der Systemmeldungen. Das ist das, was ich brauche, wie in diesem Screenshot. Systemlog Queries->All Messages, und dann einfach alles aus dem rechten Fenster. Ich denke, da kannst du ein Copy&Paste machen: http://cdn.osxdaily.com/wp-content/uploads/2015/04/improved-console-view-mac-os-x.jpg

Die Sachen die du geschickt hast, das sind irgendwelche GPU Wechsel oder sowas und wie die initialisiert werden..
 
Hey Xentric! Danke! Habe gefunden was du meinst! Noch eine kurze, hoffentlich nicht allzu dumme, Frage: Unter den geforderten Systemprotokollanfragen - Alle Meldungen - zeigt es mir immer nur jeweils 4000 Einträge (pro Zeitspanne) an. Reichen die aktuellen, letzten 4000 Einträge (in einem Textfile), oder sollte ich nur frühere Einträge auslesen (zb. die von Donnerstag), wo noch Probleme aufgetreten sind? Oder kannst du vielleicht mit dem kompletten "All Messages.aslquery" File besser was anfangen? Sorry wegen all der Fragen...
 
hi,

Am besten wäre natürlich der Zeitraum um den Crash, das ist richtig :). Entweder schaust du die Logs selbst durch, da sollte dein System neugebootet haben, das wird auch protokolliert, und nimmst die Meldungen um diesen Zeitraum herum, aber nicht zu knapp oder du wartest bis zum nächsten Crash. Ich denke, du wirst den passenden Zeitraum schon finden. Alternativ gingen alle Nachrichten vom Donnerstag, .. Wirst du schon machen!

Mit der .aslqeury kann ich nichts anfangen. ASL steht vermutlich für Apple System Log, und dafür bräuchte ich vermutlich ein OS X um das zu öffnen, was ich nicht habe ;). Auch scheint mit .aslquery vom Namen her nur irgendeine Abfrage zu sein, statt der eigentlichen Datenbank.
 
Moin!

Wenn ich mir die Logs anschaue, fällt mir dazu nur der GPU-Fehler dieser Baureihe ein. Dazu gibt es (nicht nur) hier sehr viele Threads und Informationen.

Das Austausch-und Reparaturprogramm greift evtl. noch für Dein MBP. Das würde ich direkt prüfen.
 
Hallo und nochmals besten Dank!

Es hat ein wenig gedauert, aber ich habe einige Meldungen mit Boot-Vorgängen ("BOOT_TIME") in RTF-Datein kopiert. Hier nochmals der Link: systemprotokollanfragen_alle_meldungen.zip
Ich hoffe sehr ihr könnt damit was anfangen.

Das mit den GPU-Fehlern war mir nicht bekannt. Probleme wie Bildverzerrungen, Farbfehler und Banding hatte ich nie. Bei mir waren es bis dato nur das plötzlich eingefrorene MacBook (nach dem Ruhezustand oder während dem Arbeiten) und Probleme beim Hochfahren (komplett grauer Bildschirm vor dem Login und keine Reaktion). Würde dieses Verhalten auch auf den genannten GPU-Fehler zutreffen?
 
Ja, das passt auch zum GPU-Fehler. Suche mal danach.

Sollte Dein MBP qualifiziert sein und zusätzlich das Festplattenkabel defekt sein, wird das mit ausgetauscht. So wird jedenfalls berichtet.

Das Programm wurde verlängert bis Dez. 2016, aber die Bedingungen etwas angepasst.
 
Danke! Das klingt schon mal gut! Ich habe soeben auf deinem geposteten Link die Garantieabdeckung mit meiner Seriennummer überprüft. Leider scheint die nicht mehr zu greifen. Ist das in diesem Ausnahmefall zu ignorieren? Was machen die Systemprotokollanfragen eurer Meinung nach für einen Eindruck? Können hier Rückschlüsse auf den GPU-Fehler gezogen werden?
 
Zurück
Oben Unten