SMART (din limba engleză auto-monitorizare, analiză și tehnologie de raportare - auto-monitorizare, analiză și tehnologie de raportare) este o tehnologie pentru evaluarea stării unui hard disk cu echipament de autodiagnosticare încorporat, precum și un mecanism de predicție momentul eșecului său. Tehnologia SMART face parte din protocoalele ATA și SATA .
Unitățile SSD SATA moderne acceptă, de asemenea, SMART.Totuși, unitățile flash USB utilizate pe scară largă (pur și simplu „unități flash”) nu acceptă de obicei SMART, deoarece clasa de dispozitive de stocare în masă USBse bazează pe un alt protocol, SCSI , care nu conține aceeași funcționalitate ca SMART. Există un număr mic de unități flash bazate pe controlere SATA și adaptoare SATA-USB care funcționează conform specificațiilor SAT (SCSI-ATA Translation). Unele dintre aceste adaptoare acceptă transmisia de date SMART
Primul hard disk cu sistem de autodiagnosticare a fost introdus în 1992 de IBM în matricele de discuri IBM 9337 pentru servere AS/400 care utilizează discuri IBM 0662 SCSI -2. Tehnologia a fost numită Predictive Failure Analysis ( PFA ). Mai mulți parametri cheie au fost măsurați și evaluați direct de controlerul de disc . Rezultatul a fost limitat la un singur bit : fie totul este în ordine, fie discul poate eșua în curând.
Mai târziu, Compaq , Seagate , Quantum și Conner au dezvoltat o altă tehnologie numită IntelliSafe. Avea un protocol comun pentru emiterea de informații despre starea hard disk-ului, dar fiecare companie determina independent parametrii măsurați și pragurile acestora.
La începutul anului 1995, Compaq a propus să standardizeze tehnologia. IBM, Seagate, Quantum, Conner și Western Digital (cel din urmă la acea vreme nu avea încă un sistem de urmărire a parametrilor hard diskului) au susținut această idee. Bazat pe tehnologia IntelliSafe. Standardul dezvoltat în comun a fost numit SMART
Standardul SMART I prevedea monitorizarea parametrilor de bază și era lansat doar după o comandă.
Hitachi a participat la dezvoltarea SMART II , care a propus o metodă de autodiagnosticare completă a unității (autotest extins) și a apărut și o funcție de înregistrare a erorilor.
SMART III are o caracteristică pentru detectarea defectelor de suprafață și capacitatea de a le restaura „transparent” utilizatorului.
SMART monitorizează principalele caracteristici ale unității, fiecare dintre acestea fiind evaluată. Caracteristicile pot fi împărțite în două grupe:
Datele sunt stocate în formă hexazecimală , numită valoare brută ( „valori brute” ) și apoi convertite în valoare - o valoare care simbolizează fiabilitatea în raport cu o anumită valoare de referință. De obicei , valoarea variază de la 0 la 100.
Un scor mare indică nicio modificare a acestui parametru sau o deteriorare lentă a acestuia. Scăzut - despre un posibil eșec în viitorul apropiat.
O valoare mai mică decât minimul, la care producătorul garantează funcționarea fără defecțiuni a unității, înseamnă defecțiunea nodului.
Tehnologia SMART vă permite să:
Trebuie remarcat faptul că tehnologia SMART face posibilă prezicerea defecțiunii unui dispozitiv ca urmare a defecțiunilor mecanice, ceea ce reprezintă aproximativ 60% din cauzele [1] ale unei defecțiuni de hard disk. SMART nu este capabil să prezică consecințele unei supratensiuni sau a unui șoc mecanic.
Trebuie remarcat faptul că unitățile nu își pot raporta în mod independent starea folosind tehnologia SMART, dar există programe speciale pentru aceasta. Astfel, utilizarea tehnologiei SMART este imposibilă fără următoarele două componente:
Programele care afișează starea atributelor SMART funcționează conform următorului algoritm:
Tabelul de atribute SMART cunoscut arată astfel:
O valoare mai mare a parametrului este mai bună | |
O valoare mai mică a parametrului este mai bună | |
Parametru critic - fundal linie roșie | Indicator al unei posibile defecțiuni iminente a dispozitivului |
Nu. | hex | Numele atributului | Mai bine dacă... | Descriere |
---|---|---|---|---|
01 | 01 | Rata de eroare de citire brută | Frecvența erorilor la citirea datelor de pe un disc, a căror origine se datorează hardware-ului discului. Pentru toate unitățile Seagate, Samsung (F1 și familiile mai noi) și Fujitsu 2.5″, acesta este numărul de corecții interne ale datelor efectuate înainte de a fi emise către interfață - prin urmare, un număr înfricoșător de mare poate fi reacționat calm [2] [3] . | |
02 | 02 | performanța de debit | Performanța generală a discului. Dacă valoarea atributului scade, atunci există o probabilitate mare să existe o problemă cu discul. | |
03 | 03 | Timp de învârtire | E timpul să învârți un pachet de discuri de la viteza de repaus la viteza de funcționare. Crește odată cu uzura mecanicii (frecare crescută în rulment etc.) și poate indica, de asemenea, o putere de proastă calitate (de exemplu, o cădere de tensiune la pornirea discului). | |
04 | 04 | Pornire/Oprire numărătoare | Numărul total de cicluri pornire-oprire ax. Unitățile de la unii producători (de exemplu, Seagate) au un contor de activare a modului de economisire a energiei. Câmpul de valoare brută stochează numărul total de porniri/opriri de disc. | |
05 | 05 | Sectoarele realocate se numără | Numărul de operațiuni de remapare a sectorului. Când un disc detectează o eroare de citire/scriere, marchează sectorul ca „remapat” și transferă datele într-o zonă de rezervă dedicată . Acesta este motivul pentru care blocurile dăunătoare nu pot fi văzute pe hard disk-urile moderne - toate sunt ascunse în sectoare remapate. Acest proces se numește remapare, iar sectorul remapat se numește remapare. Cu cât valoarea brută este mai mare, cu atât starea suprafeței discurilor este mai proastă. Câmpul valoare brută conține numărul total de sectoare reatribuite. O creștere a valorii brute a acestui atribut poate indica o deteriorare a stării suprafețelor „clătitelor” discului. | |
06 | 06 | Citiți Marja canalului | Marja canalului de citire. Scopul acestui atribut nu este documentat. Nu este folosit în drive-urile moderne. | |
07 | 07 | Seek Error Rate | Frecvența erorilor la poziționarea blocului de capete magnetice. Cu cât sunt mai multe, cu atât starea mecanică și/sau suprafața hard disk-ului este mai proastă. De asemenea, valoarea parametrului poate fi afectată de supraîncălzire și vibrații externe (de exemplu, de la discurile vecine din coș). | |
08 | 08 | Căutați performanță în timp | Performanța medie a operațiunii de poziționare a capului magnetic. Dacă valoarea atributului scade (încetinirea poziționării), atunci există o probabilitate mare de probleme cu partea mecanică a actuatorului. | |
09 | 09 | Număr de timp de pornire (ore de pornire) | Numărul de ore (minute, secunde - în funcție de producător) petrecute în starea de pornire. Ca valoare de prag pentru acesta, este selectat timpul de pașaport între eșecuri (MTBF - timpul mediu între eșecuri). | |
zece | 0A | Număr de reîncercări de învârtire | Numărul de reîncercări de rotire a discurilor la viteza de operare dacă prima încercare nu a reușit. Dacă valoarea atributului crește, atunci există o probabilitate mare de probleme cu partea mecanică. | |
unsprezece | 0B | Încercări de recalibrare | Numărul de reîncercări pentru solicitările de recalibrare dacă prima încercare nu a reușit. Dacă valoarea atributului crește, atunci există o probabilitate mare de probleme cu partea mecanică. | |
12 | 0C | Număr de cicluri de alimentare a dispozitivului | Numărul de cicluri complete de pornire/oprire a discului. | |
13 | 0D | Rata de eroare de citire soft | Numărul de erori de citire cauzate de software care nu pot fi corectate. Toate erorile sunt de natură nemecanică și indică doar aspectul/interacțiunea incorectă cu programele de disc sau cu sistemul de operare. | |
100 | 64 | Cicluri de ștergere/programare (pentru SSD ) | Numărul total de cicluri de ștergere/programare pentru toată memoria flash pe durata de viață. Unitatea SSD are o limită a numărului de scrieri pe ea. Valorile exacte (resursa) depind de cipurile de memorie flash instalate. În drive-urile Kingston - cantitatea de șters în gigaocteți [4] . | |
103 | 67 | Reconstrucție tabel de traducere (pentru SSD) | Numărul de evenimente în care tabelele de adrese interne ale blocului au fost corupte și ulterior reconstruite. Valoarea brută a acestui atribut indică numărul real de evenimente. | |
170 | AA | Număr de blocuri rezervate (pentru SSD) | Starea bazinului de blocuri de rezervă. Valoarea atributului arată procentul din pool-ul rămas. Uneori, valoarea brută conține numărul real de blocuri de rezervă utilizate. Atributul 170 este asociat cu atributul 5, numărul de blocuri de rezervă folosite [4] . | |
171 | AB | Număr de erori de program (pentru SSD) | Numărul de încercări la scrierea în flash nu a reușit. Valoarea brută arată numărul real de eșecuri. Procesul de scriere se numește tehnic „programare flash” – de unde și numele atributului. Când memoria flash este uzată, nu mai poate fi scrisă și devine doar pentru citire. Valoarea este de obicei identică cu atributul 181 [4] . | |
172 | AC | Număr de erori de ștergere (pentru SSD) | De câte ori a eșuat o operațiune de ștergere bliț. Valoarea brută arată numărul real de eșecuri. Un ciclu complet de scriere flash constă din două etape. Mai întâi trebuie eliminată memoria, apoi datele trebuie scrise ("programate") în memorie. Când memoria flash este uzată, nu mai poate fi scrisă și devine doar pentru citire. Identic cu atributul 182 [4] . | |
173 | ANUNȚ | Wear Leveler Worst Case Erase Count (pentru SSD) | Numărul maxim de operațiuni de ștergere efectuate pe un singur bloc flash. | |
174 | AE | Pierdere neașteptată de putere (pentru SSD) | Numărul de întreruperi neașteptate de curent în care s-a pierdut curent înainte de a fi primită o comandă de oprire a unității. Pe un hard disk, durata de viață a acestor opriri este mult mai scurtă decât cea a unei opriri normale. Pe un SSD, există riscul de a pierde tabelul intern de stare atunci când se închide în mod neașteptat. | |
175 | AF | Număr de erori de program (pentru SSD) | Numărul de încercări la scrierea în flash nu a reușit. Valoarea brută arată numărul real de erori. Procesul de scriere se numește tehnic „programare flash”, de unde și numele atributului. Când memoria flash este uzată, nu mai poate fi scrisă și devine doar pentru citire. | |
176 | B0 | Număr de erori de ștergere (pentru SSD) | De câte ori a eșuat o operațiune de ștergere bliț. Valoarea brută arată numărul real de erori. Un ciclu complet de scriere flash constă din două etape. Mai întâi trebuie eliminată memoria, apoi datele trebuie scrise ("programate") în memorie. Când memoria flash este uzată, nu mai poate fi scrisă și devine doar pentru citire. | |
177 | B1 | Wear Leveling Count (pentru SSD) Wear Range Delta |
În funcție de producător, numărul maxim de operațiuni de ștergere efectuate pe un singur bloc de memorie flash sau diferența dintre blocurile cele mai uzate (de cele mai multe ori înregistrate) și cele minime uzate (înregistrate de cel mai mic număr de ori) [4] . | |
178 | B2 | Număr de blocuri rezervate utilizate (pentru SSD) | Starea bazinului de blocuri de rezervă. Valoarea atributului arată procentul din pool-ul rămas. Valoarea brută a acestui atribut conține uneori numărul real de blocuri de rezervă utilizate. | |
179 | B3 | Număr de blocuri rezervate utilizate (pentru SSD) | Starea bazinului de blocuri de rezervă. Valoarea atributului arată procentul din pool-ul rămas. Valoarea brută a acestui atribut conține uneori numărul real de blocuri de rezervă utilizate. | |
180 | B4 | Număr de blocuri rezervate neutilizate (pentru SSD) | Starea bazinului de blocuri de rezervă. Valoarea atributului arată procentul din pool-ul rămas. Valoarea brută a acestui atribut conține uneori numărul real de blocuri de rezervă neutilizate. | |
181 | B5 | Număr de erori de program (pentru SSD) | Numărul de încercări la scrierea în flash nu a reușit. Valoarea brută arată numărul real de erori. | |
182 | B6 | Număr de erori de ștergere (pentru SSD) | De câte ori a eșuat o operațiune de ștergere bliț. Valoarea brută arată numărul real de erori. | |
183 | B7 | Reduceri SATA (pentru SSD) | Specifică cât de des a trebuit redusă rata de transfer SATA (de la 6 Gb/s la 3 sau 1,5 Gb/s, sau de la 3 Gb/s la 1,5 Gb/s) pentru a transfera datele cu succes. Dacă valoarea atributului scade, încercați să înlocuiți cablul SATA. | |
184 | B8 | Eroare de la capăt la capăt | Sarcina depinde de producător. Pentru HP (parte a tehnologiei HP SMART IV), aceasta crește atunci când paritatea datelor dintre gazdă și hard disk nu se potrivește după transferul de date prin memoria cache. Pentru Kinston, acesta este numărul de erori de citire flash. | |
187 | BB | Erori UNC raportate | Numărul de erori pe care unitatea le-a raportat gazdei (interfața computerului) în timpul oricărei operațiuni, de obicei erori de date de pe unitate care nu au fost corectate de ECC [4] . | |
188 | î.Hr | Timeout comanda | Numărul de operațiuni întrerupte din cauza expirării timpului HDD. De obicei, această valoare a atributului ar trebui să fie zero, iar dacă valoarea este mult mai mare decât zero, atunci cel mai probabil există probleme serioase cu alimentarea cu energie sau oxidarea contactelor cablurilor de date. | |
189 | BD | High Fly scrie | Conține numărul de cazuri înregistrate de înregistrare la o înălțime de zbor a capului mai mare decât cea calculată - cel mai probabil din cauza unor influențe externe: de exemplu, vibrații. | |
190 | FI | Temperatura fluxului de aer (WDC) | Temperatura aerului din interiorul carcasei hard diskului. Pentru unitățile Seagate, se calculează folosind formula 100-HDA temperatură . Pentru discuri Western Digital - 125-HDA . | |
191 | bf | Rata de eroare G-Sense (șoc mecanic) | Numărul de erori rezultate din sarcinile de impact. Atributul stochează citirile accelerometrului încorporat, care înregistrează toate șocurile, șocurile, căderile în timpul funcționării discului. | |
192 | C0 | Număr de retrageri de oprire | Numărul de cicluri de opriri sau defecțiuni de urgență (pornirea/oprirea unității). | |
193 | C1 | Ciclul de încărcare/descărcare | Numărul de cicluri de mutare a blocului de capete magnetice în zona de parcare / în poziția de lucru. | |
194 | C2 | Temperatura HDA | Stochează citirile senzorului termic încorporat pentru partea mecanică a discului - „cutii” (HDA - Head and Disk Assembly). Informațiile sunt preluate de la senzorul termic încorporat, care este unul dintre capetele magnetice - de obicei cel de jos din bancă. Câmpurile de biți ale atributului înregistrează temperaturile curente, minime și maxime. Nu toate programele care funcționează cu SMART analizează corect aceste câmpuri, așa că citirile lor ar trebui luate în mod critic. Într-un SSD, aceasta este temperatura din interiorul carcasei SSD sau temperatura PCB [4] . | |
195 | C3 | Hardware ECC Recovered sau ECC On-the-Fly Error Count |
Numărul de corecții de eroare ECC efectuate de controlerul de disc. Pe unitățile cu interfață SATA, valoarea se deteriorează adesea odată cu creșterea frecvenței magistralei de sistem - SATA este foarte sensibil la „overclocking”.
| |
196 | C4 | Număr de evenimente de realocare | Numărul de operațiuni de remapare. Câmpul „valoare brută” al atributului stochează numărul total de încercări de a transfera informații din sectoarele reatribuite în zona de rezervă. Sunt luate în considerare atât încercările reușite, cât și cele nereușite. | |
197 | C5 | Număr curent de sector în așteptare | Numărul de sectoare care sunt candidate pentru înlocuire. Încă nu au fost identificate ca fiind rele, dar citirea din ele este diferită de citirea unui sector stabil - acestea sunt așa-numitele sectoare suspecte sau instabile. În cazul unei lecturi ulterioare cu succes a sectorului, acesta este exclus de pe lista candidaților. În cazul citirilor eronate repetate, unitatea încearcă să o recupereze și efectuează o operație de remapare. O creștere a valorii acestui atribut poate indica degradarea fizică a hard disk-ului. | |
198 | C6 | Număr de sectoare necorectabile | Numărul de sectoare necorectate (prin intermediul discului). În cazul creșterii numărului de erori, probabilitatea apariției unor defecte critice la suprafața și/sau mecanica unității este mare. | |
199 | C7 | Număr de erori UltraDMA CRC, Număr de erori SATA R-Errors |
Pentru un HDD cu o interfață UltraDMA, numărul de erori care au apărut la transferul de date printr-o interfață externă în modul UltraDMA (încălcări ale integrității pachetelor etc.). Creșterea acestui atribut indică un cablu rău (încrețit, răsucit) și contacte proaste. De asemenea, astfel de erori apar la overclockarea magistralei PCI, pene de curent, interferențe electromagnetice puternice și, uneori, din vina driverului. Poate că motivul este un cablu de proastă calitate. Pentru a o repara, încercați să utilizați un cablu SATA fără zăvoare, care are o conexiune strânsă cu contactele discului. Pentru HDD cu interfață SATA și pentru SSD - numărul de erori la primirea și transmiterea datelor prin interfață [4] . | |
200 | C8 | Rata de eroare de scriere/Rata de eroare în mai multe zone | Afișează numărul total de erori care apar la scrierea unui sector. Afișează numărul total de erori de scriere pe disc. Poate servi ca un indicator al calității suprafeței și al mecanicii unității. | |
201 | C9 | Rata de eroare de citire soft , Rată de eroare de citire necorecabilă |
Frecvența de apariție a erorilor „software” la citirea datelor de pe disc.
Acest parametru arată frecvența de apariție a erorilor în timpul operațiunilor de citire de pe suprafața discului din cauza defecțiunii software-ului și nu a hardware-ului unității.
| |
202 | CA | Erori de marcare a adresei de date | Numărul de erori de marcare a adresei de date (DAM) (sau) specifice furnizorului. | |
203 | CB | Rămâneți anulați | Numărul de erori ECC. | |
204 | CC | Corecție soft ECC , Rată de corecție Soft ECC |
Numărul de erori ECC corectate de software. | |
205 | CD | Rata de asperitate termică (TAR) | Numărul erorilor de asperitate termică. | |
206 | CE | înălțimea de zbor | Distanța dintre capul de citire/scriere și suprafața discului când este pornit. | |
207 | CF | Învârtiți curent ridicat | Mărimea curentului în timpul învârtirii discului. | |
208 | D0 | Învârte buzz | Numărul de rutine de zumzet pentru a porni unitatea. | |
209 | D1 | performanță de căutare offline | Drive-ul caută performanță în timpul operațiunilor offline. | |
210 | D2 | Vibrații în timpul scrierii | Vibrații în timpul citirii | |
211 | D3 | Vibrație în timpul citirii | Vibrații în timpul înregistrării | |
212 | D4 | Șoc în timpul scrierii | A fost lovit fizic hard disk-ul în timp ce funcționează? | |
220 | DC | Schimbarea discului | Distanța de deplasare a unității de disc față de ax. În mare parte din cauza unei lovituri sau căderi. Unitatea de măsură este necunoscută. Pe măsură ce atributul crește, discul devine rapid inutilizabil. | |
221 | DD | Rata de eroare G-Sense (șoc mecanic) | Numărul de erori datorate sarcinilor și impacturilor externe. Atributul stochează citirile senzorului de șoc încorporat. | |
222 | DE | Ore încărcate | Timpul petrecut de blocul de capete magnetice între descărcarea din zona de parcare în zona de lucru a discului și încărcarea blocului înapoi în zona de parcare. | |
223 | D.F. | Număr de reîncercări de încărcare/descărcare | Numărul de noi încercări de descărcare/încărcare a unității principale magnetice către/din zona de parcare după o încercare nereușită. | |
224 | E0 | Frecarea sarcinii | Valoarea forței de frecare a blocului de capete magnetice atunci când este descărcat din zona de parcare. | |
225 | E1 | Număr de cicluri de încărcare | Numărul de cicluri de mutare a blocului de capete magnetice în zona de parcare. | |
226 | E2 | Încărcați „În” timp | Timpul în care unitatea descarcă capetele magnetice din zona de parcare pe suprafața de lucru a discului. | |
227 | E3 | Număr de amplificare a cuplului | Numărul de încercări de a compensa cuplul. | |
228 | E4 | Ciclul de retragere a opririi | Numărul de reîncercări de parcare automată a unității principale magnetice ca urmare a opririi. | |
230 | E6 | Amplitudinea capului GMR , starea de protecție a duratei de viață a unității |
Depinde de producator. Amplitudinea „jitter-ului” (distanța de mișcare repetată a blocului capetelor magnetice). Pentru Kingston - gradul de utilizare a mass-media, starea de protecție a ciclului său de viață [4] . | |
231 | E7 | Temperatura , durata de viață SSD rămasă |
Pentru HDD, temperatura hard disk-ului. Pentru SSD-uri, ciclul de viață rămas, numărul aproximativ de cicluri rămase sau capacitatea posibilă de scriere [4] . | |
232 | E8 | Spațiu rezervat disponibil (SSD) | Depinde de producator. Pentru SSD-urile Kingston, numărul de blocuri de servicii de rezervă rămase. Inițial (în noua unitate) este egal cu numărul de blocuri de rezervă . Pentru unele unități, valoarea atributului este 170 , exprimată în gigaocteți [4] . | |
234 | EA | Numărul de erori ECC necorectabile | ||
235 | EB | Sănătatea copiei de rezervă a căderii alimentării | Depinde de producator. Unele SSD-uri arată capacitatea de a salva date din memoria cache pe cipurile flash după o întrerupere bruscă de curent [4] . | |
240 | F0 | cap ore de zbor | Timpul total petrecut de blocul de capete în poziția de lucru în ore. | |
241 | F1 | Total LBA-uri scrise , scrieri pe viață din sistemul gazdă |
Pentru HDD - numărul total de sectoare înregistrate. SSD-ul Kingston are volumul unității înregistrat pe întreaga durată de viață, în gigaocteți [4] . | |
242 | F2 | Total LBA-uri citite , citiri pe tot parcursul vieții către sistemul gazdă |
HDD are numărul total de sectoare citite. SSD-ul Kingston are volumul citit de pe cipurile de unitate pe toată durata de viață, în gigaocteți [4] . | |
250 | FA | Rata de reîncercări de eroare de citire | Numărul de erori la citirea hard diskului. | |
254 | F.E. | Protecție împotriva căderii libere | Contor de evenimente de „cădere liberă” înregistrate. |
Hard disk-urile SMART versiunea 2 și ulterioară oferă o serie de teste diferite: [5] [6] [7]
Jurnalul de testare SMART poate conține doar rezultatele ultimelor 21 de teste și este doar pentru citire. Cu alte cuvinte, este imposibil să-l resetați cu mijloace obișnuite. Jurnalul este un tabel cu următoarele coloane: numărul secvenței testului, tipul testului, rezultatul testului, procentajul rămas până la finalizare, durata de viață a discului, LBA. [unsprezece]
Producători de unități:
Alte: