Hamburg - 25. April 2018 - Sebastian Evers
Das SMART System hat seine Wurzeln in den neunziger Jahren und baut auf dem IBM PFA und Compaqs IntelliSafe zur Dokumentation bedrohlicher Ausfallwerte auf. Die Festplattenfabrikanten Seagate, Quantum, Connor und Western Digital waren mit an der Entwicklung des heute als SMART bekannten Industriestandards zur Festplattenselbstdiagnostik beteiligt.
Beim System zur Selbstüberwachung, Analyse und Statusmeldung handelt es sich um einen ungenormten technischen Standard zur Haltbarkeitsüberwachung von Festplattenlaufwerken (HDD) und Solid State Drives (SSD). SMART dokumentiert verschiedene ausgegebene Werte und Parameter der geräteeigenen Sensorik, welche auf die Abnutzung des Speichermediums hindeuten können und wertet diese aus, um einen eventuellen Ausfall des Datenträgers voraussagen zu können. Die Datenauswertung kann über gesonderte BIOS-Einstellungen, die Firmware oder zusätzlich installierte Software erfolgen. Die Firmware des Datenträgers übermittelt die dafür erforderliche Information, ob der „health status“ des Datenträgers anhand der ausgewerteten Daten als „gut“ oder „schlecht“ bzw. „good“ oder „bad“ einstuft wird.
Bei aktiver SMART Überwachung warnt diese, bei dem Erreichen oder dem Überschreiten gewisser Werte, vor einem möglicherweise eintretenden Ausfall der Festplatte. Deaktiviert man die Überwachung des SMART Status wird die Erfassung der Parameter nicht ausgesetzt, sondern nur der Warnmechanismus bei Erreichen der kritischen Schwellwerte ausgeschaltet. Die Protokollierung und Speicherung der SMART Werte erfolgt in einen regulär nicht adressierbaren nicht änderbaren Bereich des Datenträgers und die laufende Dokumentation wirkt sich nicht nachteilig auf die Performance des Datenträgers aus. Auf Befehl gibt der Datenträger die protokollierten Werte aus. Die Werte unterteilen sich in Werte, die einer permanenten Aktualisierung unterliegen und Werte, welche in Ruhephasen notiert werden. Es erfolgen keine Korrekturmaßnahmen durch SMART; die dafür notwendige festplatteninterne Technik existierte schon lange vor SMART.
Zu den durch die integrierte Sensorik erfassten Parameter für den SMART Status zählen unter anderem Werte wie Laufleistung, Betriebszeit, Temperatur, Lesefehler, Datendurchsatz und viele weitere. Allerdings gibt es keine Standardisierung dafür, welche Parameter und Grenzwerte überwacht werden. Jeder Festplattenhersteller entscheidet individuell, welche Stati er protokolliert und welche Schwellwerte er als Anlass zur Warnung vor einem möglichen Ausfall betrachtet. Hinzu kommen beispielsweise unterschiedlich platzierte Temperatursensoren, deren Positionierung erhebliche Auswirkung auf die dokumentierten Werte haben können.
Auch geben übermäßig positiv eingestellte Sensoren verfälschte Werte aus, wenn die Temperaturmessung bei Gerätestart irrtümlich unterhalb der eigentlichen Zimmertemperatur liegt. Unter diesem Gesichtspunkt existiert bei Anwendern die Diskussionen über die Genauigkeit und Vorhersagefähigkeit von SMART. Ein statistisch relevanter Indikator für einen absehbaren früher oder später eintretenden Ausfall können durch SMART gemeldete Scanfehler (Scan Errors) oder eine hohes Aufkommen an verbrauchten Reservesektoren (Reallocated Sector Count) sein.
In einer 2007 durchgeführten hausinternen Studie hat Google die SMART-Werte von mehr als hunderttausend Festplatten (verschiedene Hersteller, Modelle, Interfaces) ausgewertet. Dabei wurden 64% der Ausfälle von SMART vorhergesagt. Allerdings sind 36% ohne eine vorherige SMART-Warnung ausgefallen. SMART kann nur die erwähnten Parameter protokollieren und auswerten, aber vor dem Durchbrennen von Elektronikbauteilen oder Firmwarefehlern kann die SMART-Diagnostik nicht warnen. Man sollte sich dementsprechend nicht allzu sehr auf dieses Frühwarnsystem verlassen und sich prinzipiell auf eine gewissenhafte und aktuelle Datensicherung verlassen, um Datenverlusten und einer Datenrettung vorzubeugen.