S.M.A.R.T - zjistěte jak je na tom Váš harddisk | Kapitola 2
Seznam kapitol
Poruchy harddisků patří mezi nejhorší druhy selhání počítačového hardwaru. Jistě to dosvědčí i můj kamarád programátor, který díky selhání harddisku přišel nejen o své rodinné fotografie ale i o svou programátorskou práci za celý měsíc. Předevčírem zapnul počítač a podivné zvuky linoucí se z pevného disku jen potvrdily definitivní "věčnou archivaci" jeho drahocenných dat. Přitom mohl dříve využít technologie S.M.A.R.T která harddisky stále monitoruje a zaznamenává veškeré nesrovnalosti v jejich chodu jen proto, aby byla schopna předpovědět kdy může dojít k jejich selhání!
Výstupem systému S.M.A.R.T je soustava hodnot (Treshold, Value, Worst, RAW) vázaná k jednotlivým tzv. atributům. Těch je asi dvacet, mají různou váhu a vypovídají o jednotlivých aspektech souvisejících s chodem disku. Některé údaje jsou informativní (jako je např. teplota disku, počet provozních hodin), některé sčítají nečekané událostí.
Podívejme se, co lze konkrétně z registrů SMART vyčíst (dále uvádíme jen ty atributy, jež jsou pro výrobce společné). Konkrétní údaje jsou z mého disku Barracuda IV ST380021A.
atribut | ID hex |
prahová hodnota |
aktuální hodnota |
nejhorší dosažená |
klíč RAW hex | typ atr. | |
* | Raw Read Error Rate | 01 | 34 | 78 | 72 | 8D4F9 | PR ER |
Počet chyb čtení vč. korigovaných (ty jsou v průběhu činnosti HDD běžné). Aktuální hodnota by neměla klesnout pod prahovou hodnotu. | |||||||
* | Spin Up Time | 03 | - | 70 | 70 | 0 | |
Čas potřebný k roztočení ploten. Zde není rozhodující hodnota, ale to, jestli se tato doba prodlužuje. | |||||||
Start/Stop Count | 04 | 20 | 100 | 100 | 5D | EC SP | |
Počet start/stop cyklů jednotky. | |||||||
* | Reallocated Sector Count | 05 | 36 | 100 | 100 | 0 | EC SP |
Označuje množství vadných sektorů (v klíči RAW) přemapovaných do záložní části disku. Hodnota 100 značí, že k dispozici je 100% záložních sektorů (nedošlo tedy k žádnému přemapování). Práh je 36%. | |||||||
* | Seek Error Rate | 07 | 30 | 75 | 60 | 2177EFB | PR ER |
Indikuje počet nepřesností v pozicionování hlaviček na danou stopu. Aktuální hodnota by neměla klesnout pod prahovou hodnotu. | |||||||
Power On Hours Count | 09 | - | - | - | 5B0 | EC SP | |
Měří kolik hodin provozu má disk za sebou (v klíči RAW). Zde konkrétně 5B0 hex. = 1452 (h). | |||||||
* | Spin Retry Count | 0A | 97 | 100 | 100 | 0 | EC |
Počet případů kdy se plotny neroztočily po inicializaci disku. | |||||||
Power Cycle Count | 0C | - | - | - | 35C | EC SP | |
Počet zapnutí disku. 35C = 860x | |||||||
Drive Temperature | C2 | - | 27 | 50 | 1B | SP | |
Aktuální teplota disku (C). Hodnota teploty bývá uložená v RAW. Vysoká interní teplota společně s mechanickými otřesy a vibracemi zkracuje životnost disku ze všeho nejvíce. | |||||||
Current Pending Sector | C5 | - | 100 | 100 | 0 | EC | |
Počet podezřelých sektorů. | |||||||
Uncorrectable Sector | C6 | - | 100 | 100 | 0 | EC | |
Neopravitelné sektory. | |||||||
Ultra ATA CRC Error Rate | C7 | - | 200 | 200 | 0 | PR ER EC SP | |
Chyby přenosu rozhraní Ultra ATA. | |||||||
Write Error Rate | C8 | - | 100 | 253 | 0 | ||
Počet chyb při zápisu dat. | |||||||
Attribute | ID | Threshold | Value | Worst | RAW | Type |
Typ atributů (hodnoty které nemají v dané souvislosti význam jsem nahradil pomlčkou):
* - kritický atribut pro chod disku - věnujte právě jim zvýšenou pozornost
PR - Performance-related (souvisí s výkonem)
ER - Error rate (výskyt chyb)
EC - Events count (čítač)
SP - Self-preserve ()
Jak číst a interpretovat jednotlivé hodnoty? V případě trojice údajů: prahová hodnota, aktuální hodnota, nejhorší hodnota (Treshold, Value, Worst) je pravidlem, že čím nižší je hodnota, tím hůže. U většiny těchto hodnot je maximem 100, u některých atributů 200. Pokud se aktuální hodnota dostane pod prahovou hranici (Treshold) znamená to, že disku se vede podprůměrně.
Poznámka: Atribut C7 (Ultra ATA CRC Error Rate) může pomoci i při odhalování chyb kabeláže Ultra ATA.
T.E.C
Některé atributy mají doplňující údaj T.E.C (Threshold Exceeded Condition). Ten se uvádí dobu / datum, kdy by mohlo dojít k překročení prahové meze. Hodnota T.E.C je právě onou, tolik diskutovanou a kontroverzní předpovědí selhání disku.
Závěr
SMART rozhodně patří mezi technologie, které je dobré znát a využívat (ať si výrobci disků nebo počítačových sestav myslí cokoliv). Klíčem k jejímu využití je však správné pochopení jednotlivých atributů, jejich významů a hodnot - jen tak vám S.M.A.R.T pomůže efektivně disky monitorovat a předcházet jejich poruchám. A nezapomínejte na to, že žádná technologie Vás (bohužel) nezbaví povinnosti periodicky zálohovat data.