SMART è l’acronimo di Self-Monitoring, Analysis and Reporting Technology. Come suggerisce il nome, è uno strumento che registra i dati sullo stato di salute di un disco rigido (HDD) o di un SSD (SSD). I dati SMART possono essere uno strumento prezioso, fornendo un avviso tempestivo se ununità sta avendo problemi o ha raggiunto la fine della sua vita utile, portando alla possibilità di sostituzione prima di un guasto.
La semplice segnalazione a un utente o a un amministratore di sistema è importante perché l’unità stessa non è in grado di analizzare in modo approfondito i dati. Lunità può generare report solo se alcuni attributi hanno superato le soglie predeterminate e solo se le soglie sono state programmate nel firmware.
SMART esiste da molti anni e precede la nascita dell’SSD. SMART è stato originariamente implementato sugli HDD ed è stato adattato per gli SSD quando questa nuova tecnologia è stata inventata come sostituzione drop-in per i dischi rigidi rotanti. Sfortunatamente, indipendentemente dalla tecnologia di archiviazione, non esiste uno standard di settore per indicare quale attributo SMART numerato descrive una proprietà fisica specifica di un’unità. I descrittori degli attributi varieranno tra SSD e HDD e anche tra i vari fornitori di SSD.
Esistono diverse utility di terze parti in grado di recuperare e segnalare i dati SMART di un’unità, spesso disponibili in freeware e shareware. Tuttavia, a meno che il fornitore di software di terze parti si consulti con il fornitore dellunità per conoscere gli attributi SMART corretti, le loro definizioni e soglie (se applicabili) potrebbero etichettare erroneamente gli attributi e possono portare a segnalazioni di errori falsi positivi o falsi negativi.
Abbiamo visto esempi in cui l’attributo “Conteggio ore all’accensione” riporta un numero all’utility e l’utility incompatibile potrebbe etichettare erroneamente tale numero “Conteggio guasti programma” o “Errori non correggibili segnalati”. Peggio ancora, l’utilità di terze parti potrebbe avere soglie di guasto che sono inappropriate per l’SSD in questione, quindi l’utilità SMART segnala un guasto in un punto in cui il produttore sa essere un funzionamento accettabile.
A causa di questa potenziale confusione, Crucial consiglia di utilizzare solo il softwareStorage Executive comestrumento per recuperare e analizzare accuratamente i dati SMART sugli SSD Crucial. Storage Executive sarà sempre programmato con le descrizioni degli attributi e le soglie corrette (se applicabili) per tutti gli SSD Crucial precedenti, tranne quelli meno recenti.
Gli SSD Crucial registrano diversi attributi per il recupero da parte di Storage Executive. Alcuni attributi riportano informazioni critiche sull’SSD, mentre altri sono solo informativi.
Parleremo di alcuni dei più importanti qui, quando l’attributo è chiamato in modo diverso per SATA e PCle, saranno presentati entrambi i nomi:
Attributo 202: Percentuale di vita a vita rimanente (percentuale di a vita utilizzata su PCIe)
Questo attributo corrisponde esattamente a quanto indicato dal suo nome. Si tratta di una misura della durata prevista dell’unità a vita in qualsiasi momento. Quando l’SSD è nuovo, l’attributo 202 riporterà “100”, e quando la a vita specificata è stata raggiunta, mostrerà “0”, indicando che lo 0% della vita rimane.
Tuttavia, è importante capire cosa significa utilizzare la vita prevista: non significa che lunità si guasterà quando il contatore raggiungerà lo zero, ma che potrebbe essere necessario sostituire l’SSD a breve.
La vita utile di un dispositivo flash NAND è definita da un’altra caratteristica: la conservazione dei dati. La conservazione dei dati è la quantità di tempo per cui il dispositivo può archiviare e consentire il recupero dei dati utente in modo sicuro e senza alimentazione. Quando un SSD o un altro dispositivo NAND-flash è nuovo, la conservazione dei dati non alimentata durerà diversi anni. Tuttavia, quasi come la memoria umana, si accorcia man mano che subisce usura, scrivendo dati (le letture dei dati non causano direttamente usura).
Il Joint Electron Device Engineering Council (JEDEC) è il gruppo industriale che crea standard e specifiche per i dispositivi e i gruppi basati su semiconduttori. Micron è un membro leader di JEDEC, che definisce la conservazione dei dati in modo specifico: Per gli SSD nelle applicazioni client (come computer aziendali o personali), la conservazione dei dati per un SSD sarà di un anno, in uno stato non alimentato, memorizzato a 30 °C (86 °F). Ciò dovrebbe fornire alla maggior parte degli utenti il tempo sufficiente per recuperare qualsiasi dato da un’unità inutilizzata dopo un periodo di inattività, se necessario.
Potresti essere in grado di dire da questa descrizione che ci si può aspettare che l’SSD funzioni abbastanza bene, mentre il contatore a vita si riduce dal 100%. Tuttavia, con il passare del tempo, la conservazione dei dati continuerà a degradare, da un anno a 6 mesi, poi a 3 mesi e così via. Alla fine, ben oltre la durata garantita dell’unità, qualsiasi nuova scrittura non sarà più possibile quando non è alimentata.
Tuttavia, il firmware dell’SSD lo tiene in considerazione. Man mano che l’SSD continua a invecchiare, il codice di correzione degli errori (Error Correction Code, ECC), i tentativi di lettura, i parametri di lettura adattativi, la manutenzione dei dati in background e altre regolazioni del firmware possono correggere i problemi che sorgono a causa della graduale degradazione della conservazione dei dati. Man mano che i blocchi di dati NAND si degradano, possono essere sostituiti da ricambi integrati e possono procedere le normali operazioni. Naturalmente, tutte queste operazioni di background hanno luogo in presenza di alimentazione, ecco perché la conservazione dei dati viene definita in uno stato di assenza di alimentazione.
Questo attributo viene anche presentato come “Percentuale di utilizzo a vita” su alcuni SSD Crucial legacy, nonché sui modelli NVMe, e funziona in modo simile a a vita Remaining, solo in senso inverso. Il nuovo Attributo 202 dell’SSD riporterà “0” e, una volta raggiunta la a vita specificata, mostrerà “100”, indicando che è stato utilizzato il 100% della vita. Su questi modelli, la percentuale può superare 100 man mano che vengono eseguite più operazioni di scrittura, ma i problemi di conservazione dei dati sono gli stessi.
Attributo 5: Blocchi NAND ritirati
Il numero di blocchi ritirati attraverso questo processo di valutazione continua della qualità dei blocchi NAND viene monitorato nell’attributo SMART 5. Il firmware dell’SSD ritirerà i blocchi NAND per diversi motivi oltre al problema di usura e conservazione dei dati descritto sopra. Un motivo per il pensionamento è la mancata cancellazione di un blocco durante l’eliminazione dei dati o lo spostamento dei dati durante la raccolta dei rifiuti. Questo tipo di errore causa un basso rischio per i dati dell’utente poiché i dati in questione vengono eliminati o sono già stati copiati correttamente in una nuova posizione sull’SSD.
Gli SSD Crucial più recenti misurano i superblocchi con questo attributo, che sono gruppi di molti blocchi individuali. Quando questo è ciò che l’attributo 5 sta misurando, il totale del blocco non aumenterà fino a quando molti singoli blocchi non saranno ritirati.
Attributo 180: Conteggio blocchi riservati inutilizzati (blocchi di ricambio disponibili su SSD PCIe)
Anche in questo caso, come suggerisce il nome, questo è il conteggio dei blocchi extra disponibili da utilizzare nel caso in cui i blocchi difettosi debbano essere ritirati. Questo numero varia in base all’architettura NAND sottostante, all’architettura firmware e alla capacità utente dell’unità, ma di solito inizia nelle migliaia.
Questo numero diminuisce all’aumentare del numero di blocchi ritirati. Quando l’attributo 180 raggiunge 0, il firmware metterà l’SSD in modalità di sola lettura. L’SSD non sarà utilizzabile come unità normale, ma l’utente dovrebbe essere in grado di recuperare i dati archiviati e trasferirli su un nuovo dispositivo.
Come per l’attributo 5, gli SSD Crucial più recenti misurano anche i superblocchi con questo attributo, il che significa che il totale di questo blocco non diminuirà fino a quando molti singoli blocchi non saranno ritirati, e può riflettere un valore molto più basso convenienza appena usciti dalla confezione rispetto a una parte legacy.
Attributo 210: Conteggio pagine recupero RAIN riuscito
Redundant Array of Independent NAND (RAIN) è molto analogo all’acquisizione della ridondanza dei dati utilizzando RAID in un array di unità. Tuttavia, la ridondanza RAIN viene ottenuta all’interno dellunità, in modo trasparente per l’utente. RAIN è una funzione che l’SSD utilizza per protezione i dati degli utenti e per prolungare la vita dell’unità.
Gli eventi RAIN sono rari, quindi se questo conteggio aumenta, è il momento di esaminare alcuni degli attributi sopra indicati e vedere se lunità deve essere sostituita. Eventi RAIN frequenti possono causare una notevole diminuzione delle prestazioni. L’utilizzo della ridondanza di parità per ripristinare i dati consente il proseguimento delle normali operazioni dellunità, ma consuma una certa larghezza di banda I/O. Se le prestazioni diminuiscono frequentemente, le ricostruzioni RAIN potrebbero essere il motivo e potrebbero essere fonte di preoccupazione.
Attributo 174: Conteggio delle perdite di alimentazione impreviste (le interruzioni non sicure contano sugli SSD PCIe)
Una normale perdita di alimentazione in un sistema informatico è preceduta da un messaggio dal computer host all’SSD che indica che l’alimentazione sta per interrompersi. Questo avviso dà all’SSD il tempo di completare qualsiasi attività in corso. Una volta completato, l’SSD invia un messaggio di “riconoscimento” all’host e l’host termina l’arresto.
Ci sono molte situazioni in cui l’alimentazione si interrompe inaspettatamente e questi possono creare problemi per l’SSD. In quasi tutte le condizioni, l’SSD può compensare questo problema, anche se il tempo di avvio successivo potrebbe essere un bit’ più lungo (pochi secondi, invece di centinaia di millisecondi), ma il sistema si riavvierà.
L’attributo 174 è solitamente solo informativo. Tuttavia, un gran numero di tali eventi può indicare che un utente deve essere addestrato su arresti corretti dei sistemi operativi o che potrebbe esserci un problema con alimentatori o connessioni.
Attributo 194: Temperatura involucro (temperatura dispositivo su PCIe)
Il software Crucial Storage Executive riporterà sia la temperatura attuale che la temperatura a vita più alta, in Celsius, misurata da un sensore sull’SSD. La gamma operativa specificata per la maggior parte degli SSD Crucial è compresa tra 0 °C e 70 °C (o tra 32 °F e 158 °F). Qualsiasi temperatura registrata oltre i 70 °C potrebbe invalidare la garanzia del prodotto, pertanto la temperatura deve essere monitorata periodicamente. Se le temperature superano regolarmente i 65 °C, si consigliano misure correttive come una migliore ventilazione e ventole.
SMART può essere uno strumento molto utile per monitorare lo stato del tuo SSD. Tuttavia, SMART non è uno strumento diagnostico completo. Le informazioni raccolte dagli attributi SMART insieme alla diagnostica del sistema operativo possono fornire un buon punto di partenza per le pratiche standard di risoluzione dei problemi.
I dati SMART segnalati o interpretati erroneamente possono portare a conclusioni errate che, sfortunatamente, possono portare al ritorno di un’unità perfettamente funzionante. Pertanto, è necessario ripetere che Crucial suggerisce vivamente di utilizzare solo il software Crucial Storage Executive per leggere i dati SMART dagli SSD Crucial.
©2019 Micron Technology, Inc. Tutti i diritti riservati. Informazioni, prodotti e/o specifiche sono soggetti a modifiche senza preavviso. Né Crucial né Micron Technology, Inc. sono responsabili di eventuali omissioni o errori fotografici o di tipografia. Micron, il logo Micron, Crucial e il logo Crucial sono marchi commerciali o marchi registrati di Micron Technology, Inc. PCI Express e PCIe sono marchi registrati di PCI-SIG. Tutti gli altri marchi commerciali e marchi di servizio sono di proprietà dei rispettivi proprietari.