Self-Monitoring, Analysis and Reporting Technology

Self-Monitoring, Analysis and Reporting Technology (SMART bzw. S.M.A.R.T., deutsch System zur Selbstüberwachung, Analyse und Statusmeldung) ist ein Industriestandard zur Überwachung von Festplattenlaufwerken (HDD) und Solid-State-Drives (SSD) und dient der Vorhersage eines möglichen Ausfalls des Speichermediums. Es werden dabei die Werte verschiedener Sensoren mit Hilfe von unterschiedlichen Parametern ausgewertet.

Seit Kurzem ist S.M.A.R.T. auch für Flash-Speicher wie MicroSD-Karten verfügbar[1].

Überblick

Die Auswertung der überwachten Daten erfolgt beim Starten des Rechners durch das entsprechend eingestellte BIOS, bzw. andere Firmware, oder durch spezielle Software, die zusätzlich zum Betriebssystem installiert werden muss. Microsoft beispielsweise stellt dafür seit Windows 95b (OSR 2) einen Treiber bereit, der dann von dieser Software angesprochen wird.

Dabei orientiert sich das Programm an vom Festplattenhersteller festgelegten Grenzwerten für die einzelnen Parameter, etwa für die Temperatur. Nach einem längeren Zeitraum kann die Software dann auch zu erwartende Ausfälle prognostizieren.

Das „Abschalten“ von S.M.A.R.T. etwa in den BIOS-Einstellungen schaltet nicht die Datenerfassung, sondern nur die Warnungen bei Überschreitung der Schwellenwerte ab. Gespeichert werden die gesammelten Daten in einem reservierten, durch Programme nicht änderbaren Bereich der Festplatte.

Die gesamte Überwachung verlangsamt die Festplatte nicht, da sie das Geschehen nur protokolliert, ohne korrigierend einzugreifen. Das erledigen bereits festplatteninterne Mechanismen, so bei Erschütterungen, die wiederum schon vor S.M.A.R.T. existierten. Alles Weitere, etwa Laufleistung und Temperatur, wird durch speziell dafür eingebaute Sensoren und Chipfunktionen erfasst. Dabei gibt es eine Einteilung in „Online“-Parameter, die permanent notiert werden, und jene, die in Ruhepausen aktualisiert werden, wenn das Laufwerk gewissermaßen „offline“ ist.

Aussagekraft

S.M.A.R.T. bleibt auf die damit überwachten Massenspeicher wie Festplatten oder SSDs beschränkt und liefert keine Aussage zur Gesamtzuverlässigkeit des Rechnersystems. Eine Verknüpfung der gewonnenen Daten mehrerer Massenspeicher gibt es nicht. Auch ist das System nicht normiert, sondern es bleibt den Herstellern überlassen, welche Parameter sie in welchen Grenzen überwachen. Unter Anwendern wird auch die Genauigkeit der Überwachung diskutiert. So gelten manche Temperatursensoren als falsch platziert oder zu optimistisch eingestellt, da sie beim Start des Systems z. B. deutlich unter Raumtemperatur liegen.

Eine unabhängige Google-Studie[2][3], die über neun Monate ging, alle Hersteller und insgesamt 100.000 Festplatten umfasste, brachte 2006 folgendes Ergebnis: Unter Einbeziehung aller relevanten Parameter sind 64 % aller Ausfälle mit S.M.A.R.T. vorhersagbar. Dabei wurden alle anderen, also akustisch oder als Datenfehler bemerkbaren, Warnsignale ignoriert. Beim übrigen Drittel aller Ausfälle meldete sich die Festplatte selbst fälschlicherweise als problemfrei.

Die Beanspruchung der Festplatte hatte dabei einen weit geringeren Einfluss auf ihre Haltbarkeit als bisher angenommen. Übersteht ein Laufwerk das erste Jahr, spielt der Leerlaufanteil bis zu seinem turnusmäßigen Austausch nach vier Jahren keine Rolle mehr. Nur im ersten und nach dem vierten Jahr verdoppelt permanentes Lesen und Schreiben die Ausfallrate.

Geschichte

1992 erkannte IBM, dass mit zunehmender Verbreitung von PCs in Unternehmen ebenso das in sie gesetzte Vertrauen stieg. Ausfälle wurden zunehmend zu einem finanziellen Problem, dem man mit PFA (Predictive Failure Analysis) begegnen wollte. IBM-Festplatten mit diesem System teilten dem Computer jegliche Parameteränderungen mit, damit dessen Nutzer so rechtzeitig mit Austausch reagieren konnte. Etwas später wurde durch Compaq IntelliSafe vorgestellt. Dieses filtert Irrelevantes und meldet der mitlaufenden Software nur die bedrohlichen Änderungen und Sollwerte. Seagate, Quantum und Conner waren an der Entwicklung beteiligt und passten es an ihre Produkte an; Compaq selbst fertigte keine Festplatten.
Das Potenzial ahnend und mit einem Industriestandard vor Augen, wurde die Offenlegung des Systems durch Compaq und insbesondere Seagate forciert. Zusammen mit Conner, Quantum, Western Digital und dann auch IBM entstand eine Fusion der beiden Ansätze unter dem Namen S.M.A.R.T.

Seit 1996 und dem Start des ATA-3-Standards, respektive SCSI-3 vier Jahre zuvor, gehört es beinahe ausnahmslos zur Standardausstattung einer Festplatte.

Die Spezifikation für die S.M.A.R.T.-Parameter wurde jedoch vor der Verabschiedung des ATA-3-Standards wieder entfernt (siehe Weblinks). Daher sind weder die Bedeutung der gespeicherten Werte noch deren Skalierung festgeschrieben (zu letzterem siehe auch Übliche Parameter). Nur ihr Speicherort ist offiziell standardisiert. So gibt es strenggenommen auch laut ATA-7-Standard keine Möglichkeit, beispielsweise die Temperatur einer Platte auszulesen. Praktisch alle erhältlichen Platten halten aber das Datenformat aus dem ATA-3-Entwurf ein. Ein auslesendes Programm ergänzt zur besseren Verständlichkeit noch zu jeder Parameter-ID eine Bezeichnung wie „Seek Error Rate“. Über die Jahre entstand so ein verlässlicher De-facto-Standard.

Solid-State-Drives (SSDs) benötigen systembedingt viele der bisherigen Prüfpunkte nicht mehr, dafür aber andere, neue. Hierfür fehlt jedoch bislang eine Abstimmung zwischen den SSD-Controller-Herstellern. Im Ergebnis wurden teilweise neue Parameter-IDs ergänzt, mitunter aber auch bestehende IDs einfach mit einer neuen Bedeutung versehen. Daraus entstehen Fehlinterpretationen in allen S.M.A.R.T.-Programmen, welche noch nicht die Bedeutung in den neuen Laufwerken kennen.[4]

Eine Kurzauswertung wichtiger S.M.A.R.T.-Parameter ist zudem allerdings auch in den meisten BIOS-Versionen enthalten, so dass beim Anschalten des Computers Warnmeldungen zu defekten SSDs erscheinen können. In diesem Fall ist eine Abschaltung der S.M.A.R.T.-Selftest-Funktion im BIOS empfehlenswert und eine manuelle Prüfung mit einem aktuellen Programm im Betriebssystem anzuraten (siehe S.M.A.R.T.-Programme im Vergleich).

Variationen nach Anschluss

Die Umsetzung des S.M.A.R.T.-Standards unterscheidet sich je nach dem Festplattenanschluss im PC. Davon gibt es zwei: ATA- und SCSI-Standard. Beide kennen den HEALTH STATUS. Dabei gibt die Firmware des Laufwerks an, ob es sich als „okay“ oder als „problematisch“ einstuft. Beide Standards unterstützen auch das Auslesen der Temperatur und mehrere Varianten von Selbsttests und Logbüchern.

Bei ATA-Festplatten können zusätzlich über eine mitlaufende Software zahlreiche Werte und ihre Grenzen abgefragt werden. So kann die Software oder der Nutzer genauer einstufen, ob und warum ein Fehler auftreten wird. Diese Parameter sind allerdings nicht genau standardisiert und unterscheiden sich in Umfang und Interpretation, auch zwischen Modellen eines Herstellers.

Die Kommandos und Datenformate für alle diese Funktionen sind allerdings bei ATA und SCSI völlig unterschiedlich implementiert.

Auf dem USB-Anschluss werden im Grunde SCSI-Kommandos übertragen. Die über USB angeschlossenen Festplatten sind aber fast ausnahmslos keine SCSI-, sondern (S)ATA-Platten. Im Zuge der Einführung der USB 3.0 Schnittstelle wurde das Protokoll USB Attached SCSI (UAS) eingeführt, dieses kann auch auf USB 2.0 mit reduzierter Geschwindigkeit verwendet werden, welches im Gegensatz zu den technisch einfacheren Bulk-Transfer der USB-Speichersticks eine Tunnelung der ATA-Kommandos über den USB-Bus ermöglicht und die SMART-Abfragen über USB ermöglicht. Chip-Hersteller wie Cypress, JMicron oder SunPlusIT verwenden herstellerspezifische Kommandos. Einige Programme beherrschen diese Kommandos (siehe Abschnitt S.M.A.R.T.-Programme im Vergleich). Daneben gibt es auch USB-SATA-Bridges, die den herstellerunabhängigen SCSI/ATA Translation-Standard unterstützen.[5]

Der FireWire-Anschluss – besonders bei Apple-Computern üblich – ermöglicht die Übermittlung nativ, Mac OS X nutzt das aber nicht.

Per eSATA angeschlossene Laufwerke sind wie ihre internen SATA-Pendants problemlos auslesbar.

Über Serial Attached SCSI (SAS) angeschlossene Serial-ATA-Platten können geprüft werden, wenn die entsprechenden SAT-Kommandos zur Verfügung stehen.

Für Bandlaufwerke gibt es zu S.M.A.R.T. analoge Funktionen mit der Bezeichnung TapeAlert. Sie dienen zur Warnung bei abgenutzten Bändern.

Auswertung

Übliche Parameter

Jeder Wert wird zuerst als Raw-Data gespeichert. Dieser wird dann zum besseren Verständnis auf einer Werteskala von 0 bis 100, 200 oder 255 einsortiert. Die unterschiedlichen Skalen dienen dabei einer feineren Abstufung, wo der Hersteller sie für sinnvoll erachtet. Mit dem Skalenmaximum startend, nähert sich der Wert (value) bei Fehlern oder zunehmendem Alter null. Häufig ist die kritische Grenze (Threshold) aber schon weit darüber angesiedelt.[6]

Nachstehende Tabelle zeigt die einzelnen Parameter und die Bewertung der jeweiligen Raw-Werte auf (nicht zu verwechseln mit den Values der Werteskala):

Legende der Raw-Werte
A
Ausfallskritisch
Ausfallsrelevanter Parameter. So vorhanden, können damit mögliche Ausfälle prognostiziert werden.
IInformierend, für die Ausfallsprognose wenig bis nicht relevanter Parameter
höher, besser
Je höher der Raw-Wert, desto besser
niedriger, besser
Je niedriger der Raw-Wert, desto besser
IDHexParametername (Englisch)Parametername (Deutsch)AIBesserBeschreibung
010x01(Raw) Read Error RateLesefehlerrate (roh)
niedriger, besser
  • Nicht korrigierbare Fehler beim Lesen von der Festplatte, führt zum erneuten Einlesen.
  • Deutet auf Problem mit der Plattenoberfläche hin.
  • Einige Laufwerke haben hier sehr hohe Raw-Werte, die auch zwischen Modellen eines Herstellers nicht vergleichbar sind. Bei neueren Seagate-Laufwerken ist er fälschlicherweise identisch mit dem bei Hardware ECC Recovered. Ausfallrelevant sind nur die Skalenwerte.
020x02Throughput PerformanceDurchsatz
höher, besser
  • allgemeiner Datendurchsatz bzw. Effizienz der Festplatte
  • Deutet stark auf bremsende Probleme im Laufwerk hin.
030x03Spin Up TimeBeschleunigungszeit
niedriger, besser
  • Durchschnitt der Startzeit in (Milli-)Sekunden.
  • Deutet auf Probleme beim Motor oder den Plattenlagern hin.
  • Bei fabrikneuen Maxtor- und Quantum-Laufwerken kam es hier im ersten Monat häufig zu Falschalarmen.
040x04Start/Stop CountStart/Stop-Vorgängeja
niedriger, besser
  • Anzahl der Start- bzw. Stop-Vorgänge eines Laufwerkes (auch Standby)
  • Deutet auf Abnutzung hin, da dieser Vorgang Festplatten am stärksten belastet.
050x05Reallocated Sectors Countwiederzugewiesene Sektoren
Ausfallskritisch
niedriger, besser
  • Anzahl der verbrauchten Reservesektoren.
  • Deutet auf Oberflächenprobleme hin, da nur dann automatisch ein Reservesektor einen bisher verwendeten ersetzt.
  • Ist dieser RAW-Zähler ungleich null, ist die Wahrscheinlichkeit für einen Ausfall verfünffacht. Meist folgt dieser dem ersten „Reallocation Event“ binnen eines halben Jahres.
070x07Seek Error RateSuchfehlerrate
niedriger, besser
  • Nicht korrigierbare Fehler beim Lesen von der Festplatte, führt zum erneuten Einlesen.
  • Deutet auf Positionierungsproblem der Schreib-Lese-Einheit hin.
  • Auch vom Hersteller unerklärt, tragen hier einige fabrikneue Seagate-Laufwerke Skalenwerte weit unter 100 ein.[7]
090x09Power On Hours CountAnzahl der Betriebsstundenja
niedriger, besser
  • Laufleistung in Stunden oder Sekunden (inklusive Standby)
  • Deutet auf Abnutzung hin, sagt aber nichts über Nutzungsumstände in dieser Zeit aus.
  • Bei einigen Modellen von Maxtor, z. B. bei der Maxtor DiamondMax 10 6L250S0, sind es Minuten.
100x0ASpin Retry CountAnlaufwiederholungen,
nur bei HDDs relevant
Ausfallskritisch
niedriger, besser
  • Anzahl der Anlaufversuche zum Hochdrehen der Festplatten auf Nenndrehzahl. Ein ansteigender Wert deutet auf mechanische Probleme im Antrieb der Festplatte hin.
120x0CPower Cycle CountAnzahl der Einschaltungenja
niedriger, besser
  • Gibt an, wie oft das Laufwerk ein- und ausgeschaltet worden ist.
1840xB8End-To-End errorEnde-zu-Ende Fehler
Ausfallskritisch
niedriger, besser
  • Steigende Werte zeigen Parityfehler zwischen den Speichermedium und Laufwerkcontroller an.
1870xBBReported uncorrectable ErrorGemeldete unkorrigierbare Fehler
Ausfallskritisch
niedriger, besser
1880xBCCommand TimeoutKommandos welche nicht rechtzeitig ausgeführt werden konnten
Ausfallskritisch
niedriger, besser
  • Anzahl der Kommandoabbrüche wegen Zeitüberschreitung
1930xC1Load Cycle Count

bzw.

Load/Unload Cycle Count

Parkvorgängeja
niedriger, besser
  • Parkvorgänge der Schreib-Lese-Einheit auf die neben den Platten befindliche Plastikrampe.
  • Meist nur bei Notebooklaufwerken. Deutet auf Abnutzung hin; vorgesehen sind rund 300.000 – der Raw-Wert zeigt die bisherigen.
  • Geparkt wird die Schreib-Lese-Einheit beim Ausschalten oder nach rund 10 s Leerlauf. Das erzeugt ein mitunter irritierendes Geräusch. Kommt das Notebook zu Fall, stößt so die Schreib-Lese-Einheit nicht mehr auf die Magnetscheiben. Die Stoßfestigkeit wird auf rund 1000 g verdreifacht. Auch das An- bzw. Ausschalten ist schonender, da die Einheit nicht schleifend auf einen Sonderbereich der Platten abgesenkt wird („Landing Zone“).[8]
1940xC2Drive TemperatureFestplatten-Temperatur
niedriger, besser
  • Temperatur des Laufwerkes in °C
  • Da manche Laufwerke auch Maximal- und Minimalwert speichern, ist eine frühere Unterkühlung oder Überhitzung während des Betriebes erkennbar. Der als raw-value angegebene Wert enthält dann alle drei Zahlen hintereinander.
  • Hohe Temperaturen (ab 40 °C) haben erst nach drei Jahren Auswirkung. In diesem Jahr verdoppeln sie die Ausfallwahrscheinlichkeit. Danach verlieren sie ihre Bedeutung wieder. Über alle Alter gemittelt, sind Temperaturen unter 25 °C weit gefährlicher als solche über 40 °C. 20 °C verdoppeln, 15 °C verdreifachen die Ausfallrate; gemessen wurde dabei bis 52 °C. Manche Hersteller verwenden ungenaue oder falsch platzierte Sensoren.[3]
1950xC3Hardware ECC Recoveredgerettete Bitfehler
niedriger, besser
  • korrigierte Bitfehler beim Lesen
  • Kann auf Problem mit der Plattenoberfläche hindeuten.
  • Die hohe Datendichte heutiger Festplatten hat zur Folge, dass beim Lesen die Fehlerkorrektur zwangsläufig anschlägt.[Beleg?] Auch sehr hohe Werte hier sind also kein Grund zur Beunruhigung.
  • Samsung-Laufwerke der P80-Serie tragen hier fälschlicherweise oft sehr niedrige Skalenwerte ein. Generell sind sehr hohe Raw-Werte üblich, die wegen Wechseln von einer Technik auf eine neuere (engl.: „technology change“) auch zwischen Modellen desselben Herstellers nicht vergleichbar sind. Sie steigen bei Lesevorgängen, da nur dann eine Fehlerkorrektur stattfindet. Ausfallrelevant sind nur die Skalenwerte. Selten werden die Werte auch „ECC On-the-fly“ genannt.
1960xC4Reallocation Event Count
Ausfallskritisch
niedriger, besser
  • Anzahl bisher durchgeführten erfolgreichen und fehlgeschlagenen Neuzuweisungen der Sektorposition als Folge von Lesefehlern von defekten Sektoren.
1970xC5Current Pending Sector CountAktuell ausstehende Sektoren
Ausfallskritisch
niedriger, besser
  • Anzahl der aufgrund von Lesefehlern wartenden Sektoren auf Zuweisung einer neuen Sektorposition
1980xC6Uncorrectable Sector CountNicht korrigierbare Sektoren
Ausfallskritisch
niedriger, besser
  • Anzahl bisheriger nicht korrigierbarer Sektorfehler bei Schreibe- oder Leseoperationen.
1990xC7Ultra DMA CRC Error CountDMA-CRC-Fehlerja
niedriger, besser
  • Anzahl der aufgetretenen CRC-Fehler
  • Ursache können defekte Kabel, verschmutzte Kontakte, Übertaktung oder fehlerhafte Festplattentreiber sein. Die Übertragung wird in Stufen immer langsamer wiederholt. Misslingt dies, wird der Zugriff auf die Festplatte gesperrt.
2010xC9Soft Read Error Rate
Ausfallskritisch
niedriger, besser
  • Anzahl der nicht per Software korrigierbaren Lesefehler.

Es gibt noch zahlreiche weitere Parameter, auch herstellerexklusive. Vollständige Listen finden sich im Literatur-Abschnitt der Weblinks.

Beispiel

Die Auswertung wichtiger S.M.A.R.T.-Parameter am Beispiel einer Hitachi 250 GB-Festplatte, angeschlossen über Serial-ATA und ausgelesen mit den smartmontools.

Parameter-IDParameternameValue (normalisierter aktueller Messwert)Worst (bisher schlechtester Wert)Threshold (Grenzwert – Value sollte größer sein)Typ (maximaler Messwert kurz vor dem Ausfall)Updated (Echtzeit- oder Messwert nach einem Selbsttest)RAW Value (eigentlicher Messwert)Bemerkung
2Throughput Performance100100050Pre-failOffline0 
3Spin Up Time118118024Pre-failAlways294Hitachi verwendet eine eigene Zählweise, keine (Milli-)Sekunden.
4Start Stop Count100100000Old ageAlways772772 mal wurde der Festplattenmotor an-/ausgeschaltet, inklusive Standby-Starts.
5Reallocated Sector Count100100005Pre-failAlways5555 Sektoren wurden wegen Defekts gegen Reservesektoren ausgetauscht. Das Laufwerk schätzt das aber noch als problemlos ein (der Value ist nach wie vor 100) – vielleicht zu Unrecht.
7Seek Error Rate100100067Pre-failAlways0Bisher gab es keine Schreib-/Lesefehler.
9Power On Hours100100000Old ageAlways1775Laufwerk wurde bisher 1775 Stunden mit Strom versorgt. Das umfasst auch Standbyphasen, in denen die Platten stillstanden. Wenn das Auswertungsprogramm das Festplattenmodell nicht kennt, muss man selbst einschätzen, ob der Wert Stunden, Minuten oder Sekunden darstellt.
10Spin Retry Count100100060Pre-failAlways0Bisher gab es keine Fehlstarts, die Festplatte lief immer problemlos an.
12Power Cycle Count100100000Old ageAlways745Bisher wurde der PC mit dieser Festplatte 745-mal an- und ausgeschaltet.
194Temperature161161000Old ageAlways34
+(10·216 + 49·232)
Aktuelle Temperatur wäre hier 34 °C. Bisherige Lebensmaxima des Laufwerkes waren 10 °C bzw. 49 °C. Value ist daher von 200 auf 161 gesunken.
199UDMA CRC Error Count200253000Old ageAlways730Bisher gab es 730 Übertragungsfehler zur Hauptplatine („mainboard“). Ursache ist entweder ein fehlerhafter Festplatten-Controller, ein defektes Anschlusskabel oder ein Wackelkontakt.
Valueist ein normalisierter Messwert, der zumeist rückwärts zählt (je niedriger, desto schlechter).
Worstder bisher schlechteste Wert.
Thresholddie Grenze, unter die der Wert nicht fallen darf.
Typsteht für die Bedeutung des Parameters: „Pre-fail“ ist eine Warnung vor einem baldigen Ausfall, während „Old age“ bedeutet, dass es sich allgemein um fortschreitende Alterung handelt (Die aktuelle Temperatur fällt nicht unbedingt in eine der beiden Kategorien).
Updatedzeigt an, ob der Wert permanent (always) oder erst durch einen Selbsttest vom Typ „Offline data collection“ aktualisiert wird.
RAW Valueist der eigentliche Messwert, also etwa die gemessene Temperatur oder die Zahl der Fehler.

Auswertung: Laut festplatteneigener Einschätzung ist dieses Laufwerk völlig in Ordnung. Nirgends wurde der Grenzwert annähernd erreicht. Nur die 55 ausgewechselten Sektoren sind laut einer Google-Studie bedenklich. Dieser Wert sollte daher im Blick behalten werden. Erhöht sich nach dem vorgenommenen Kabeltausch aber der „UDMA CRC Error Count“ nicht weiter und wird die Kühlung so verbessert, dass etwa 45 °C (Temperature) nicht mehr überschritten werden, ist das Laufwerk eigentlich problemlos weiter verwendbar.

Selbsttest und Fehler-Logbuch

Neben der laufenden Protokollierung obiger Parameter gibt es noch weitere Tests. Einige Hersteller starten diese periodisch im Leerlauf, andere überlassen das dem Nutzer. Das kann er mit manchen der angebotenen Programme durchführen. Was schließlich getestet wird, ist ebenso herstellerbestimmt. Standard ist ein Kurztest mit Prüfung aller Parameter, gefolgt von Stichproben der Lesbarkeit der einzelnen Scheiben. Die Langversion tauscht die Stichprobe gegen eine Komplettüberprüfung.

ATA-6 ergänzt zwei weitere Varianten. Die eine empfiehlt sich nach einem Laufwerkstransport (genannt Conveyance – ähnlich dem Kurztest), die andere ermöglicht die Prüfung selbst wählbarer Bereiche des Laufwerkes (Selective – ähnlich dem Langtest).

Seit 1999 und dem ATA-5-Standard werden aufgetretene Fehler nicht nur in die Parameterwerte eingerechnet (Ergebnis etwa: „Fehlerrate: hoch“), sondern ausführlich protokolliert. Notiert werden dabei die Fehler, die Zeit seit dem letzten Anschalten und die fünf zuvor ausgeführten Schritte. Für die Ergebnisse der obigen Selbsttests gibt es sogar eine eigene Tabelle. Generell gelten hier nur aktuelle Fehlerhäufungen als bedenklich.

Unterstützt die Festplatte das Erneuern ihrer Firmware, wird beim Neuschreiben derselben (gleich, mit welcher Version) das Fehlerprotokoll gelöscht. Die Parameterwerte bleiben meist erhalten.

S.M.A.R.T.-Programme im Vergleich

In der folgenden Tabelle sind bekannte Programme zum Auslesen der S.M.A.R.T.-Daten aufgeführt.

Programm­nameBetriebs­system(e)PreisLaufzeit
der Demo­version
ZielgruppeBenutzer­oberflächeAnschlussRAID-Controller-UnterstützungKorrekte Interpretation von SSDsAnzeige des Fehler­protokollsStarten der Selbst­testsAusfall­vorhersageBenach­richtigung beiBenach­richtigung perAnbieterBemerkungen
Argus MonitorWindows14,95 €30 TageEinsteiger bis Fortgeschrittenegrafisch(S)ATA, USBja (nicht bei allen)janeinneinjawählbaren Parameteränderungen, Grenzwert, TemperaturFenster, Ton, E-Mail, beliebiges Kommando ausführenArgusMonitorZusätzlich grafische Anzeige von CPU und Grafikkartentemperatur sowie CPU Kernfrequenz und Intel 'Turbo Boost' Status; Anzeige und Regelung von Mainboard- und GPU-Lüfter
smartmontoolsWindows (nativ oder Cygwin),
Linux,
Darwin (Mac OS X),
Free/Open/NetBSD,
Solaris,
OS/2,
QNX
Open Source-ProfianwenderKommandozeile,
optional Daemon bzw. Dienst, grafisches Frontend
(S)ATA, SCSI, SAT, USB3ware (Linux, FreeBSD, Windows),
Compaq/HP (Linux, FreeBSD),
HighPoint (Linux),
Intel Matrix RAID (Windows)
jajaja (auch zeitgesteuert)neinwählbaren Parameteränderungen, Grenzwert, TemperaturFenster (nur Windows), E-Mail, Systemprotokoll, beliebiges Kommando ausführensmartmontools GSmartControlAnleitung
HDAT2DOSFreeware-ProfianwenderTextmenü(S)ATA, SCSI, USB, FireWire (einige)ja (nicht bei allen)-jajanein--Lubomir CablaBietet Einstellung von AAM und weiterer Parameter, sowie Oberflächentests.
DriveSitterWindowsab 29,69 $30 TageFortgeschrittenegrafisch(S)ATA-?jajajawählbaren Parameteränderungen, Grenzwert, TemperaturFenster, Ton, E-Mail, Netzwerknachricht, Systemprotokoll, beliebiges Kommando ausführenOliver MarrHoch skalierbar, schaltet auf Wunsch bei kritischer Temperatur in Ruhezustand.
EASIS Drive CheckWindowsFreeware / Pro €19.--Fortgeschrittenegrafisch(S)ATA, USB, Oberflächentest alle-?janeinneinParameteränderungenFenster, E-MailEASISKann Oberflächentests durchführen um defekte Sektoren aufzufinden
HDD HealthWindowsFreeware-Einsteiger bis Fortgeschrittenegrafisch(S)ATA--ja (in neuer Version)ja (in neuer Version)jajeder Parameteränderung, TemperaturFenster, Ton, E-Mail, Netzwerknachricht (E-Mail und Netzwerk nur in kommerzieller Version)PANTERASoft
Active SMARTWindowsab 18,46 €21 TageEinsteiger bis Fortgeschrittenegrafisch(S)ATA, SCSI, USBangekündigt-neinneinjaGrenzwert, TemperaturFenster, Ton, E-Mail, NetzwerknachrichtAriolic ATA / SCSI / USBSchaltet auf Wunsch bei kritischer Temperatur in Ruhezustand.
SpeedFanWindowsFreeware-Einsteiger bis Fortgeschrittenegrafisch(S)ATA, SCSI-ja (nicht bei allen)neinjajaGrenzwert, TemperaturSystembenachrichtigung, Ton, E-Mail, beliebiges Kommando ausführenAlfredo Milani ComparettiBietet Online-Analyse des Laufwerks [1], überwacht PC-Temperaturen
SMARTReporterMac OS XOpen Source / Pro 4,49 €-Einsteigergrafisch(S)ATA-ja (basiert auf smartmontools)jajaneinGrenzwertFenster, E-Mail, beliebiges Kommando ausführenJulian Mayer
HDTuneWindowsFreeware HD Tune Pro 24.95 EUR-Einsteiger bis Fortgeschrittenegrafisch(S)ATA, USB (die meisten)--neinneinnein--EFD SoftwareFührt Benchmark und Oberflächentests durch; Health für ext. HDD nur in der Pro-Version
Norton System DoctorWindowsproprietär-Einsteigergrafisch(S)ATA, SCSI, USB??neinneinneinGrenzwert (für jeden Datenträger einzeln)Taskleisten-Symbol, Ton, administrative NachrichtSymantec weblinkLässt sich für jeden Datenträger einzeln konfigurieren, Interface für Disc Doktor/chkdsk: Oberflächentest, Kompletttest bei Neustart
CrystalDiskInfoWindowsOpen Source-Einsteiger bis Fortgeschrittenegrafisch(S)ATA, USB (einige)Intel Matrix RAIDjajanein[9]jaGrenzwert, Temperatur (für jeden Datenträger einzeln)Taskleisten-Symbol, Ton, E-Mail, EreignisprotokollCrystal Dew WorldBietet Einstellung von AAM und weiteren Parametern
Acronis® Drive Monitor™WindowsFreeware / proprietär-Einsteiger bis Fortgeschrittenegrafisch(S)ATA, USB (die meisten), Software-RAID-Controller (viele)Software-RAID-Controller JA, Hardware-Controller-Support angekündigt?ja?jaFestplattenproblemen, Temperatur, "kritischen Ereignissen", Backup-MeldungenTaskleisten-Symbol, Alarmmeldung, E-MailAcronisHandbuch
Samsung SSD MagicianWindowsproprietär-Einsteiger bis Fortgeschrittenegrafisch(S)ATA-jaja???-
DHE Drive InfoWindowsFreeware-Einsteiger bis Fortgeschrittenegrafisch(S)ATA, SCSI, USBexperimentelljajaja?Grenzwert, TemperaturFensterDirk Hauschildportable, keine Installation nötig

Auslesen von Festplatten an RAID-Controllern

  • Nur der Controller-Hersteller hat die nötigen Informationen zum Auslesen des S.M.A.R.T.-Status im RAID-Verbund. Also muss er diesen per API-Funktion mit seinem Treiber zur Verfügung stellen. Das tun jedoch nicht alle – und wenn, dann oft herstellerspezifisch und nur für ausgewählte Modelle. Von welchen Herstellern das Programm die Funktionen kennt, wird in der Tabelle gewertet.
  • Ein direktes Ansprechen des Controllers ohne Verwendung der Treiberfunktionen ist erfolgreicher, aber auch potentiell instabil und daher nur unter DOS akzeptabel.
  • Wird in den Spezifikationen des Controllers eine S.M.A.R.T-Unterstützung genannt, ist das häufig nur eine Controller-interne. Der Treiber reicht die Informationen dann nicht an Programme weiter, manche auch nur die eines Laufwerks.
  • Immer auslesbar sind Festplatten in sogenannten Software-RAIDs (d. h. Verbunde, die vom Betriebssystem verwaltet werden) und jene, die an RAID-Controllern als einzelne Laufwerke statt im Verbund eingerichtet sind. Daher wird das nicht gewertet.

Quellen

  1. Yves Jeanrenaud: TEAMGROUP veröffentlicht microSD-Speicherkarten mit S.M.A.R.T. 22. September 2023, abgerufen am 22. September 2023 (deutsch).
  2. Heise-Meldung vom 16. Februar 2007
  3. a b http://research.google.com/archive/disk_failures.pdf
  4. (Memento des Originals vom 21. März 2014 im Internet Archive)  Info: Der Archivlink wurde automatisch eingesetzt und noch nicht geprüft. Bitte prüfe Original- und Archivlink gemäß Anleitung und entferne dann diesen Hinweis.@1@2Vorlage:Webachiv/IABot/www.ocztechnologyforum.com Beispiel einer Umwidmung eines bestehenden S.M.A.R.T.-Attributs bei Indilinx-Controllern
  5. Einige USB-Geräte mit S.M.A.R.T.-Unterstützung (smartmontools-Wiki)
  6. Michael Schmelzle: Diese S.M.A.R.T.-Daten sind wichtig. IDG Tech Media GmbH, 30. Oktober 2013, abgerufen am 5. April 2017.
  7. http://forums.storagereview.net/index.php?showtopic=20731
  8. Bild: Schreib-Lesekopf in Parkposition
  9. Ticket #20275: Add support for starting tests