S.M.A.R.T.

De Wikipedia, l'encyclopédie libre

S.M.A.R.T. (Technique d’Auto-surveillance, d’Analyse et de Rapport; très souvent écrit SMART) est un système de surveillance du disque dur d’un ordinateur. Il permet de faire un diagnostic selon plusieurs indicateurs de fiabilité dans le but d’anticiper les erreurs sur le disque dur.

Lorsqu'une défaillance est pressentie par S.M.A.R.T., l'utilisateur peut choisir de remplacer le disque pour éviter une interruption inattendue et la perte de données. Le fabricant peut être capable d'utiliser les données de S.M.A.R.T. pour découvrir où se trouvent les défauts et les empêcher de se reproduire dans les conceptions futures du disque.

Sommaire

[dissimuler]

1Contexte
2Histoire et prédécesseurs
3Informations fournies
4Standards et implémentation
- 4.1Manque d’interprétation commune
- 4.2Visibilité des systèmes d’hébergement
5Accès
6Attributs de ATA S.M.A.R.T.
- 6.1Attributs Connus de ATA S.M.A.R.T.
- 6.2Condition de Dépassement du Seuil
7Auto-tests
8Voir aussi
9Notes
10Bibliographie
11Références
12Liens externes

Contexte

Le but de SMART est d'avertir un utilisateur d'une panne imminente du disque tandis qu'il y a encore assez de temps pour agir, comme en copiant les données vers un disque de remplacement.

Les pannes du disque dur se retrouvent dans l'une de deux classes de base :

Les pannes prévisibles résultent de processus lents tels que l'usure mécanique et la dégradation graduelle des surfaces d'enregistrement. Le suivi peut déterminer quand est-ce que de telles pannes sont le plus plausible.
Les pannes imprévisibles se produisent soudainement et sans avertissement. Elles varient des composants électroniques qui deviennent défectueux à une panne mécanique soudaine (peut être à cause d'une manipulation inappropriée).

Les pannes mécaniques représentent environ 60% de toutes les pannes de disque.[1] Alors que la panne finale peut s’avérer désastreuse, la plupart des pannes mécaniques résultent de l'usure graduelle et il y a généralement quelques indications qu'une panne est imminente. Celles-ci peuvent inclure une production excessive de chaleur, des niveaux élevés de bruit, des problèmes lors de la lecture et l’écriture de données, ou un accroissement dans le nombre de secteurs endommagés du disque.

Une étude de Google sur plus de 100.000 disques a révélé des corrélations entre certaines informations SMART et les taux actuels de pannes. Dans les 60 jours qui suivent la première analyse hors-ligne d'une erreur incorrigible sur un disque (attribut SMART 0xC6 ou 198), le disque était, en moyenne, 39 fois plus susceptible de tomber en panne qu'il ne le serait si aucune erreur pareille n’était survenue. Les premières erreurs de réaffectations, les réaffectations hors ligne (attributs SMART 0xC4 et 0x05 ou 196 et 5) et les comptes probatoires (attribut SMART 0xC5 ou 197) étaient également très en corrélation avec de plus hautes probabilités de panne. Inversement, une faible corrélation avait été trouvée pour de grandes température et aucune corrélation pour le niveau d'utilisation. Toutefois, une grande proportion (56%) de disques ayant connu une panne sont tombés en panne sans donner un quelconque avertissement S.M.A.R.T., ce qui signifie que les données S.M.A.R.T. seules étaient d’une utilité limitée dans l'anticipation des pannes. [2]

Page de PCTechGuide sur SMART (2003)[3] commentaires selon lesquels la technologie a traversé trois phases :

Dans son incarnation originale SMART effectuait la prévision des pannes en surveillant certaines activités en ligne du disque dur. Une version ultérieure améliora la prévision des pannes en ajoutant une analyse automatique de lecture hors ligne pour surveiller les opérations supplémentaires. La technologie "SMART" la plus récente non seulement surveille les activités du disque dur mais ajoute la prévention de pannes en essayant de détecter et de réparer les erreurs de secteur. Par ailleurs, tandis les versions antérieures de la technologie surveillaient uniquement l’activité du disque dur pour les données qui étaient extraites par le système d'exploitation, ce dernier SMART testes toutes des données et tous les secteurs d'un disque en utilisant "la collecte hors-ligne de données" pour confirmer l’intégrité du disque durant des périodes d’inactivité.

Histoire et prédécesseurs

Une technologie antérieure de surveillance du disque dur avait été introduite par IBM en 1992 dans ses réseaux de disques IBM 9337 pour les serveurs AS/400 utilisant les disques durs IBM 0662 SCSI-2. Cela a été appelé par la suite technologie d'analyse prédictive de défaillance (PFA). Cela permettait de mesurer plusieurs paramètres clés de l’intégrité de l'appareil et de les évaluer au sein du micrologiciel du disque. Les communications entre l’unité physique et le logiciel de contrôle étaient limitées à un résultat binaire : à savoir, soit "l'appareil est OK" ou "le disque est susceptible de tomber en panne bientôt".

Plus tard, une autre variante, qui avait été appelée IntelliSafe, était créée par le fabricant d'ordinateurs Compaq et les fabricants de disques durs Seagate, Quantum, et Conner.[4] Les disques durs mesuraient les "paramètres d’intégrité" du disque, et les valeurs étaient transférées au système d'exploitation et au logiciel de contrôle de l'espace-utilisateur. Chaque fournisseur de disque dur était libre de décider quels paramètres devaient être inclus pour le contrôle, et quels devaient être leurs seuils. L'unification était au niveau du protocole avec l’hôte.

Compaq soumit ses implémentations au comité Faible Facteur de Forme (SFF) pour standardisation en début 1995. [5] Il était pris en charge par IBM, par les partenaires au développement de Compaq qui étaient Seagate, Quantum, et Conner, et par Western Digital, qui ne disposait pas d'un système de prévision de panne à l’époque. Le comité choisit l'approche de IntelliSafe, car elle offrait plus de flexibilité. Le standard résultant développé conjointement était appelé SMART.

Ce standard SFF décrivait un protocole de communication pour qu'un hôte ATA utilise et contrôle le suivi et l'analyse dans un lecteur de disque dur, mais ne spécifiait aucune métrique ou méthode d'analyse particulière. Plus tard, "SMART" fut compris (quoique sans aucune spécification formelle) comme se référant à une variété de métriques spécifiques et de méthodes et comme s'appliquant à des protocoles sans rapport avec ATA pour la communication des mêmes genres de choses.

Informations fournies

La documentation technique de SMART est dans la Pièce Jointe AT (ATA) standard. Initialement introduit en 2004, [6] il a subi des révisions régulières, [7] la dernière étant en 2008. [8]

L'information la plus basique fournie par SMART est le statut SMART. Il n'offre que deux valeurs: "seuil non dépassé" et "seuil dépassé". Très souvent celles-ci sont représentées respectivement comme "disque OK" ou "disque en panne". Une valeur de "seuil dépassé" indique une probabilité assez élevée que le disque ne sera pas en mesure d'honorer ses spécifications dans le futur : c'est à dire, le disque est "sur le point de tomber en panne". La panne anticipée peut être désastreuse ou peut être quelque chose de subtil comme l'inaptitude à écrire sur certains secteurs, ou peut-être des performances plus lentes que le minimum déclaré par le fabricant.

Le statut SMART n'indique pas nécessairement la fiabilité passé ou présente du disque. Si un disque a déjà connu une panne de façon désastreuse, le statut SMART peut être inaccessible. Autrement, si un disque a rencontré des problèmes par le passé, mais les capteurs ne détectent plus de tels problèmes, le statut SMART peut, selon la programmation du fabricant, suggérer que le disque est maintenant sain.

L’incapacité à lire quelques secteurs n'est pas toujours une indication que le disque est sur le point de tomber en panne. Une méthode par laquelle des secteurs illisibles peuvent être crées, même lorsque le disque fonctionne selon les spécifications, est au travers d'une coupure soudaine d'électricité tandis que le disque est en cours d’écriture. Par ailleurs, même si le disque physique est endommagé à un endroit, de telle sorte qu'un certain secteur est illisible, le disque peut être capable d'utiliser l'espace de réserve pour remplacer la zone endommagée, afin que le secteur puisse être écrasé.[9]

Plus de détails sur l’intégrité du disque peuvent être obtenus en examinant les attributs SMART. Les attributs SMART ont été inclus dans certaines ébauches du standard ATA, mais ont été retirés avant que le standard ne soit finalisé. La signification et l’interprétation des attributs varient selon les fabricants, et sont quelquefois considérés comme étant un secret de fabrication par un fabricant ou un autre. Une discussion plus poussée sur les attributs est menée ci-dessous. [10]

Les disques intégrant SMART peuvent optionnellement maintenir un nombre de 'journaux'. Le journal d'erreurs enregistre des informations sur les erreurs les plus récentes signalées par le disque à l'ordinateur hôte. L'examen de ce journal peut aider à déterminer si les problèmes informatiques sont liés au disque ou causés par quelque chose d'autre (les estampilles temporelles du journal d'erreur peuvent "recouvrir" après 2³² ms = 49,71 jours [11])

Un disque qui implémente SMART peut optionnellement implémenter un nombre de routines d'auto-test ou de maintenance, et les résultats des tests sont enregistrés dans le journal d'auto-test. Les routines d'auto-test peuvent être utilisées pour détecter tous les secteurs illisibles sur le disque, de telle sorte qu'ils puissent être restaurés à partir des sources de sauvegarde (par exemple, à partir d'autres disques dans un RAID). Ceci permet de réduire le risque de subir des pertes permanentes de données.

Standards et implémentation

Manque d’interprétation commune

Plusieurs cartes mères affichent un message d'avertissement lorsqu'un lecteur de disque se rapproche de la panne. Bien qu'un standard industriel existe parmi la plupart de fabricants majeurs de disques durs,[3] il y a quelques problèmes restants et beaucoup de "connaissances secrètes" propriétaires détenues par des fabricants individuels sur leur approche spécifique. Par conséquent, S.M.A.R.T. n'est pas toujours implémenté correctement sur plusieurs plateformes informatiques, à cause de l'absence de standards logiciel et matériel à l'échelle de l'industrie pour l’échange de données S.M.A.R.T.

Sous une perspective légale. le terme "S.M.A.R.T." renvoie uniquement à une méthode de signal entre les capteurs électromécaniques du disque dur interne et l'ordinateur hôte. Donc, des fabricants peuvent affirmer que leur disque implémente S.M.A.R.T. même s'il n'inclut pas, par exemple, un capteur de température, qui doit raisonnablement être supposé présent par le client. En outre, dans le cas le plus extrême, un fabricant de disque pourrait, en théorie, produire un disque qui inclut un capteur pour seulement un attribut physique, et par la suite légalement faire de la publicité selon laquelle le produit est "compatible S.M.A.R.T.".

Visibilité des systèmes d’hébergement

En fonction du type d'interface utilisée, certaines cartes-mères et logiciels associés prenant en charge S.M.A.R.T. peuvent ne pas communiquer avec certains disques prenant en charge S.M.A.R.T. Par exemple, peu de disques externes connectés via USB et Firewire transmettent correctement des données S.M.A.R.T. data au travers de ces interfaces. Avec tant de méthodes de connecter un disque dur (SCSI, Fibre Channel, ATA, SATA, SAS, SSA, et ainsi de suite), il est difficile de prédire si les rapports S.M.A.R.T. fonctionneront correctement dans un système donné.

Même avec un disque dur et une interface qui implémente la spécification, le système d'exploitation de l'ordinateur peut ne pas voir les informations S.M.A.R.T. parce que le disque et l'interface sont encapsulés dans une couche plus basse. Par exemple, ils peuvent faire partie d'un sous-système RAID dans lequel le contrôleur du RAID voie le disque prenant en charge S.M.A.R.T., mais l'ordinateur principal ne voie qu'un volume logique généré par le contrôleur du RAID.

Sur la plateforme Windows, beaucoup de programmes conçus pour suivre et rapporter les informations S.M.A.R.T. ne fonctionneront que sous un compte administrateur. Actuellement, S.M.A.R.T. est implémenté individuellement par des fabricants, et bien que certains aspects sont standardisés pour compatibilité, d'autres ne le sont pas.

Accès

Pour une liste de divers programmes qui permettent de lire des Données Smart, voir Comparaison des outils S.M.A.R.T..

Attributs de ATA S.M.A.R.T

Chaque fabricant de disque dur définit un ensemble d'attributs, [12][4]et établit des valeurs de seuil au-delà desquelles les attributs ne devraient pas aller sous un fonctionnement normal. Chaque attribut a une valeur brute, dont le sens est entièrement selon le fabricant du disque (mais correspond très souvent aux comptes d'une unité physique, telle que les degrés Celsius ou les secondes), une valeur normalisée, qui varie de 1 à 253 (où 1 représente le pire des cas et 253 représente le meilleur des cas) et une valeur pire, qui représente la plus petite valeur normalisée enregistrée. En fonction du fabricant, une valeur de 100 ou 200 sera assez souvent choisie comme la valeur normalisée initiale.

Les fabricants qui ont implémenté au moins un attribut SMART dans divers produits comprennent Samsung, Seagate, IBM (Hitachi), Fujitsu, Maxtor, Toshiba, Intel, STEC Inc, Western Digital et ExcelStor Technology.

Attributs connus de ATA S.M.A.R.T

Le tableau suivant liste quelques attributs S.M.A.R.T. et le sens typique de leurs valeurs brutes. Les valeurs normalisées sont toujours répertoriées afin que les valeurs plus grandes sont meilleures (avec seulement de très rares exceptions telles que l'attribut "Température" sur certains disques Seagate [13]), mais de plus grandes valeurs brutes d'attributs peuvent être meilleures ou pires en fonction de l'attribut et du fabricant. Par exemple, la valeur normalisée de l'attribut "Compte de Secteurs Réaffectés" décroit au fur et à mesure que le compte de secteurs réaffectés s’accroît. Dans ce cas, la valeur brute de l'attribut indiquera très souvent le compte actuel de secteurs qui ont été réaffectés, quoique les fournisseurs ne sont en rien tenus d’adhérer à cette convention. Puisque les fabricants ne sont pas nécessairement d'accord sur les définitions précises des attributs et les unités de mesure, la liste suivante d'attributs doit être perçue comme guide général uniquement.

Légende
	Une plus haute valeur brute est meilleure
	Une plus basse valeur brute est meilleure
Critique : la rangée de couleur rose	Indicateurs potentiels d'une panne électromécanique imminente

ID	Hex	Nom de l'attribut	Meilleur	Description
01	0x01	Taux d'Erreur de Lecture		(Valeur brute spécifique au fournisseur.) Enregistre les données liées au taux d'erreurs de lecture matérielle qui se sont produises lors de la lecture de données sur une surface de disque. La valeur brute a une structure différente pour différents fournisseurs et est très souvent sans signification comme un nombre décimal.
02	0x02	Performance de Débit		Performance de débit globale (générale) d'un disque dur. Si la valeur de cet attribut est en régression il y a une forte probabilité qu'il y a un problème avec le disque.
03	0x03	Temps d'Accélération		Temps moyen de mise en rotation de l'axe (de zéro tr/min à pleinement opérationnel [millisecs]).
04	0x04	Compte Départ/Arrêt		Un compte des cycles de l'axe en départ/arrêt. L'axe tourne, et donc le compte s’accroît, quand le disque dur est mis en marche après avoir été auparavant mis totalement à l’arrêt (déconnecté de la source d'alimentation) et quand le disque dur reprend du service après avoir été préalablement mis en mode veille.[14]
05	0x05	Compte des Secteurs Réaffectés		Compte des secteurs réaffectés. Quand le disque dur rencontre une erreur de lecture/écriture/vérification, il marque ce secteur comme "réaffecté" et transfère les données vers un emplacement spécial réservé (espace de réserve). Ce processus est également connu comme remappage, et les secteurs réaffectés sont appelés "remaps". La valeur brute représente normalement un compte des secteurs défectueux qui ont été trouvés et remappés. Ainsi, plus grande est la valeur de l'attribut, plus grand est le nombre de secteurs que le disque a dû réaffecter. Ceci permet à un disque comportant des secteurs défectueux de continuer à fonctionner ; toutefois, un disque qui a subi des réaffectations est considérablement plus susceptible de connaitre une défaillance dans un futur proche.[2] Quoique essentiellement utilisé comme une métrique de l’espérance de vie du disque, ce nombre affecte également la performance. Au fur et à mesure que le compte de secteurs réaffectés s’accroît, la vitesse de lecture/écriture tend à se détériorer parce que la tête de lecture du disque est contrainte de chercher dans la zone réservée à chaque fois qu'un remap est accédé. Une solution de rechange qui préservera la vitesse du disque aux dépens de la capacité est de créer une partition de disque au dessus de la région contenant des remaps et d'instruire le système d'exploitation de ne pas utiliser cette partition.
06	0x06	Marge du Canal de Lecture		Marge d'un canal pendant la lecture de données. La fonction de cet attribut n'est pas spécifiée.
07	0x07	Taux d'Erreur de Recherche	N/A	(Valeur brute spécifique au fournisseur.) Taux d'erreurs de recherche des têtes magnétiques. S'il y a une panne partielle dans le système de positionnement mécanique, alors les erreurs des recherche se produiront. Une telle panne peut être due à divers facteurs, tels qu'un dommage à un servomoteur, ou l’élargissement thermique du disque dur. La valeur brute a une structure différente pour différents fournisseurs et est très souvent sans signification comme un nombre décimal.
08	0x08	Performances du Temps de Recherche		La performance moyenne des opérations de recherche des têtes magnétiques. Si cet attribut va décroissant, cela est un signe de problèmes dans le sous-système mécanique.
09	0x09	Heures Sous Tension (POH)		Compte des heures dans l’état sous tension. La valeur brute de cet attribut exprime le compte total d'heures (ou minutes, ou secondes, en fonction du fabricant) dans l’état sous tension.[15] Sur certains disques antérieurs à 2005, cette valeur brute peut avancer de façon erratique et/ou "se recouvrir" (réinitialiser à zéro périodiquement). [16]
10	0x0A	Compte Nouvel Éssai de Tourner		Nombre de nouveaux essais d’accélération. Cet attribut enregistre le compte total de tentatives de faire tourner afin d'atteindre la vitesse de fonctionnement optimale (sous la condition que la première tentative était infructueuse). Une augmentation de la valeur de cet attribut est un signe de problèmes dans le sous-système mécanique du disque dur.
11	0x0B	Nouvelles Tentatives de Ré-étalonnage or Compte de Nouvelle Tentative d'Étalonnage		Cet attribut indique le nombre de fois que le ré-étalonnage a été requis (sous la condition que la première tentative ait été infructueuse). Une augmentation de la valeur de cet attribut est un signe de problèmes dans le sous-système mécanique du disque dur.
12	0x0C	Compte de Cycle de Puissance		Cet attribut indique le nombre de cycles complets arrêt/allumage du disque dur.
13	0x0D	Taux d'Erreur de Lecture Intermittente		Erreurs de lecture non corrigées signalées au système d'exploitation.
180	0xB4	Total de Blocs Réservés Inutilisés		Attribut "Échec-Anticipé" utilisé au moins dans les appareils HP.
183	0xB7	Compte d'Erreur de Rétrogradage SATA		Attribut de Western Digital et Samsung.
184	0xB8	Error de Bout-en-Bout/ IOEDC		Cet attribut fait partie de la technologie Hewlett-Packard's SMART IV, ainsi que des schémas de Détection et de Correction d'erreurs IO d'autres fournisseurs, et il contient un compte d'erreurs de parité qui se produisent dans le chemin des données vers le média via la RAM cache du disque. [17]
185	0xB9	Stabilité de la tête		Attribut Western Digital.
186	0xBA	Détection de Vibration-Op Induite		Attribut Western Digital.
187	0xBB	Erreurs Incorrigibles Signalées		Le nombre d'erreurs qui n'ont pas pu être récupérées à l'aide du code correcteur d'erreur (voir attribut 195).
188	0xBC	Expiration de Commande		Le compte d’opérations annulées suite à l'expiration du disque dur. Normalement cette valeur d'attribut devrait être égale à zéro et si la valeur est très supérieure à zéro, alors très probablement il y aura quelques sérieux problèmes avec l’alimentation électrique ou un câble de données oxydé. [18]
189	0xBD	Écritures à Grande Hauteur		Les fabricants de disques durs implémentent un dispositif de contrôle de la Hauteur de Vol qui essaie d'offrir des protections supplémentaires pour les opérations d’écriture en détectant lorsqu'une tête d'enregistrement est entrain de voler hors de sa plage normale de fonctionnement. Si l'on est confronté à une hauteur de vol risquée, le processus d’écriture est stoppé, et l'information est réécrite ou réaffectée à une région sûre du disque dur. Cet attribut indique le compte de ces erreurs détectées tout au long de la vie du disque. Cette fonction est implémentée dans la plupart des disques modernes Seagate[1] et dans certains disques de Western Digital, à commencer par les disques durs WD Enterprise WDE18300 et WDE9180 Ultra2 SCSI et sera incluse dans tous les produits futurs de WD Enterprise.[19]
190	0xBE	Température du Courant d'Air (WDC) resp. Température du Courant d'Air Celsius (HP)		La température du courant d'air sur les disques durs Western Digital (Identiquement à temp. [C2], mais la valeur actuelle est de 50 en moins pour certains modèles. Marqués comme obsolètes.)
190	0xBE	La Différence de Température de la Valeur 100		Est égale à (100−temp. °C), permettant au fabricant de définir un seuil minimum qui correspond à une température maximum .
191	0xBF	Taux d'Erreur G-Sense		Le nombre d'erreurs résultant de choc & vibration provenant de l’extérieur.
192	0xC0	Compte de Retrait à l’Arrêt or Compte de Cycle de Retrait en Urgence (Fujitsu) [20]		Nombre de fois que les têtes sont déchargées du média. Les têtes peuvent être déchargées sans s’éteindre tout à fait.
193	0xC1	Compte de Cycle de Chargement ou Compte de Cycle de Chargement/Déchargement (Fujitsu)		Nombre de cycles de chargement/déchargement jusqu’à une position de la zone d’atterrissage de la tête. [20] L’espérance de vie typique des disques durs d'ordinateurs portables (2,5 pouces) est de 300.000 à 600.000 cycles de chargement. [21]Certains disques d'ordinateurs portables sont programmés pour décharger les têtes à chaque fois qu'il n'y a pas eu d’activité pendant environ cinq secondes. [22]Beaucoup d'installations Linux écrivent sur le système de fichiers quelques fois par minute en arrière-plan. [23]Par conséquent, il peut y avoir 100 cycles de chargements ou plus par heure, et la cote de cycle de chargement peut être dépassée en moins d'un an. [24]
194	0xC2	Température resp. Température Celsius		Température interne actuelle.
195	0xC3	Temps entre les Erreurs Corrigées	N/A	(Valeur brute spécifique au fournisseur.) La valeur brute a une structure différente pour différents fournisseurs et n'est très souvent pas significative comme un nombre décimal.
196	0xC4	Compte d'Événement de Réaffectation		Compte des opérations de remappage. La valeur brute de cet attribut exprime le nombre total de tentatives de transférer des données des secteurs réaffectés vers une zone de réserve. Les tentatives avec succès & et les tentatives infructueuses sont comptées.[25]
197	0xC5	Compte de Secteur Courant en Attente		Compte de secteurs "instable" (en attente d’être remappés, à cause d'erreurs de lecture irrécupérables). Si un secteur instable est par la suite lu avec succès, cette valeur est revue à la baisse et le secteur n'est pas remappé. Les erreurs de lecture sur un secteur ne remapperont pas le secteur immédiatement (car la valeur correcte ne peut être lue et ainsi la valeur à remapper n'est pas connu, et de plus elle pourrait devenir lisible plus tard); au lieu de cela, le micrologiciel du disque se rappelle que le secteur nécessite d’être remappé, et le remappera la prochaine fois qu'il est écrit. [26]Toutefois certains disques ne remapperont pas dans l’immédiat de tels secteurs lorsqu'ils sont écrits; au lieu de cela le disque tentera dans un premier temps d’écrire sur le secteur à problème et si l’opération d’écriture connait un succès alors le secteur sera marqué comme bon (dans ce cas, le "Compte d'Evénement de Réaffectation" (0xC4) ne sera pas incrémenté). Ceci constitue un grave défaut, car si un tel disque contient des secteurs marginaux qui connaissent des défaillance de façon consistante seulement après qu'un peu de temps se soit écoulé suite à une opération d'écriture réussie, alors le disque ne remappera jamais ces secteurs à problème.
198	0xC6	Compte de Secteur Incorrigible ou Compte de Secteur Incorrigible Hors Ligne ou Incorrigible avec Analyse Hors Ligne[20]		Le compte total d'erreurs incorrigibles lors de la lecture/écriture d'un secteur. Une augmentation de la valeur de cet attribut indique des défauts de la surface du disque et/ou des problèmes dans le sous-système mécanique.
199	0xC7	Compte de l'Erreur UltraDMA CRC		Le compte d'erreurs dans le transfert de données via l'interface du câble tel que déterminé par ICRC (Vérifications de Redondance Cyclique de l'Interface).
200	0xC8	Taux d'Erreur à Zones Multiples [27]		Le nombre d'erreurs trouvées lors de l’écriture d'un secteur. Plus grande est la valeur, pire est la condition mécanique du disque.
200	0xC8	Taux d'Erreur d'Écriture (Fujitsu)		Total des erreurs lors de l’écriture d'un secteur.[28]
201	0xC9	Taux d'Erreur de Lecture Intermittente ou Compteur de TA Détecté		Nombre d'erreurs hors-piste.
202	0xCA	Erreurs de Marquage de l’Adresse des Données ou Compteur de TA Augmenté		Nombre d'erreurs de Marquage d'Adresse de Données (ou spécifique au fournisseur).
203	0xCB	Annulation de la Sortie
204	0xCC	Correction ECC Intermittent		Total des erreurs corrigées par le logiciel ECC
205	0xCD	Taux d'Aspérités Thermiques (TAR)		Total des erreurs dues à une température élevée.[18]
206	0xCE	Hauteur de Vol		Hauteur des têtes au-dessus de la surface du disque. Une hauteur de vol trop basse augmente de chances d'un accident de la tête tandis qu'un hauteur de vol trop élevée augmente les chances d'une erreur lecture/écriture.
207	0xCF	Courant de Rotation Élevée		Quantité de courant de surtension utilisé pour faire tourner le disque. [18]
208	0xD0	Bruit de Rotation		Nombre de routines de bruit nécessaires à l'accélération du disque suite à une puissance insuffisante. [18]
209	0xD1	Performance de Recherche Hors Ligne		Performance de la recherche du disque durant ses tests internes. [18]
210	0xD2	Vibration Durant L’Opération d'Écriture		(trouvée sur les disques Maxtor 6B200M0 200GO et Maxtor 2R015H1 15GO)
211	0xD3	Vibration Durant L’Opération d'Écriture		Vibration Durant L’Opération d'Écriture
212	0xD4	Choc Durant L’Opération d'Écriture		Choc Durant L’Opération d'Écriture
220	0xDC	Décalage du disque		Distance dont le disque a décalé relativement à l'axe (généralement à cause d'un choc ou de la température). L’unité de mesure est inconnue.
221	0xDD	Taux d'Erreur G-Sense		Le nombre d'erreurs résultant de choc & vibration provenant de l’extérieur.
222	0xDE	Heures Sous Charge		Temps de fonctionnement mis sous la charge de données (mouvement de l'armature magnétique de la tête)
223	0xDF	Compte de Nouvel Éssai Chargement/Déchargement		Nombre de fois que la tête change de position
224	0xE0	Frottement de Charge		Résistance causée par les frottements dans les parties mécaniques lors du fonctionnement.
225	0xE1	Compte de Cycles de Chargement/Déchargement		Nombre total de cycles de chargement
226	0xE2	Temps total de charge		Temps total de chargement sur le mécanisme des têtes magnétiques (temps non passé dans la zone de parking).
227	0xE3	Compte d'Amplification du Couple		Nombre de tentatives de compenser les variations de la vitesse du plateau
228	0xE4	Cycle de Retrait pour Défaut de Puissance		Le nombre de fois que l'armature magnétique a été automatiquement rétractée suite à la réduction de la puissance.
230	0xE6	Amplitude de la Tête GMR		Amplitude de "battage" (distance des mouvements répétitifs avancer/reculer de la tête)
230	0xE6	Statut de Protection de la Durée de Vie du Disque		État actuel de fonctionnement du disque selon la courbe du cycle de vie[29]
231	0xE7	Température		Température du Disque
231	0xE7	Durée restante pour le SSD		Renseigne sur la durée approximative de vie restante pour le SSD, en termes de cycles de programmation/effaçage des blocs flash actuellement disponibles pour usage. [29]
232	0xE8	Espace Réservé Disponible		Intel SSD signale la quantité d'espace disponible réservée comme un pourcentage de l'espace réservé dans un SSD flambant neuf.
232	0xE8	Longévité Restante		Nombre de cycles physiques de suppression accomplis sur le disque comme un pourcentage du nombre maximum de cycles physiques de suppression que le disque a été conçu pour endurer
233	0xE9	Indicateur de l'Usure des Médias		Intel SSD signale une valeur normalisée de 100 (lorsque le SSD est neuf) et réduit jusqu’à une valeur minimum de 1. Elle décroit lorsque les cycles de suppression NAND croissent de 0 jusqu’aux cycles cotés au maximum.
233	0xE9	Heures Sous Tension		Nombre d'heures écoulées dans un état sous tension.
234	0xEA	Compte Moyen de Suppression ET Compte Maximum de Suppression		Décodé comme : octet 0-1-2 = compte moyen de suppression (big endian) et octet 3-4-5 = compte max de suppression (big endian) [30]
235	0xEB	Compte de Blocs Sains ET Compte de Blocs du Système (Libre)		décodé comme : octet 0-1-2 = compte de blocs sains (big endian) et octet 3-4 = compte de blocs du système(libre).
240	0xF0	Taux d'Erreur de Transmission (Fujitsu)		Compte des fois que le lien est réinitialisé durant un transfert de données. [31]
240	0xF0	Heures de Vol de la Tête		Temps de positionnement de la tête
241	0xF1	Total de LBAs écrits		Nombre total de LBAs écrits
242	0xF2	Total de LBAs lus		Compte total de LBAs lus. Certains utilitaires S.M.A.R.T. signaleront un nombre négatif comme valeur brute car en réalité il a 48 bits plutôt que 32.
250	0xFA	Taux de Réessai d'Erreur de Lecture		Compte d'erreurs lors de la lecture à partir d'un disque
254	0xFE	Protection Contre la Chute Libre		Compte de "d'Événements de Chute Libre" détectés [32]

Date d'Estimation de la Prochaine Défaillance

La date d'estimation de la prochaine défaillance (TEC) est une date estimée à laquelle un attribut statistique critique du disque atteindra sa valeur seuil. Lorsque le logiciel d’Intégrité du Disque signale "T.E.C. le plus proche", cela doit être perçu comme une "Date d’échec". Parfois, aucune date n'est donnée et l'on peut s'attendre à ce que le disque fonctionne sans erreurs.[33]

Pour prédire la date, le disque surveille le taux suivant lequel l'attribut change. Notez que les dates de TEC sont uniquement des estimations ; les disques durs peuvent et tombent en panne beaucoup plus tôt ou plus tard que la date de TEC.[34]

Auto-tests

Les disques SMART peuvent offrir un nombre d'auto-tests : [35][36][37]

Bref

Vérifie les performances électriques et mécaniques ainsi que les performance de lecture du disque. Les tests électriques peuvent inclure un test de la RAM tampon, un test du circuit de lecture/écriture, ou un test des éléments de lecture/écriture de la tête. Les tests mécaniques incluent la recherche et le servomoteur lors du suivi de données. Analyse de petites portions de la surface du disque (la zone est spécifique au fournisseur et il y a une limite de temps pour le test). Vérifie la liste de secteurs en Attente qui peuvent contenir des erreurs de lecture. (Généralement en moins de deux minutes.)

Long/Étendu

Une version plus longue et plus complète de l'auto-test bref, analyse l’entière surface du disque, sans limite de temps. (Des centaines de minutes, approximativement un gigaoctet par minute pour les disques modernes.)

Acheminement

Destiné à être un test rapide d'identification des dommages subis lors du transport de l'appareil du fabricant du disque jusqu’au fabricant de l'ordinateur.[38] Disponible seulement sur les disques ATA (plusieurs minutes.)

Sélectif

Certains disques permettent des auto-tests sélectifs d'une partie de la surface seulement.[39]

Les journaux d'auto-test pour des disques SCSI et ATA sont légèrement différents. Il est possible au long test de réussir même si le court test échoue. [40]

Voir aussi

Notes

^ ^a ^bAttributs Améliorés de Smart (déclaration), Seagate , http://argusmonitor.com/help/enhanced_smart.pdf.
^ ^a ^bPinheiro, Eduardo; Weber, Wolf-Dietrich; Barroso, Luís André, "Conclusion" , Tendances de Défaillances dans une Grande Population de Disques Durs, 1600 Amphithéâtre Pkwy Mountain View, CA 94043: Google , http://research.google.com/archive/disk_failures.pdf.
^ ^a ^b SMART, PCTechGuide, 2003, http://www.pctechguide.com/31HardDisk_SMART.htm.
^ ^a ^bOttem & Plummer 1995.
^Compaq. IntelliSafe. Rapport technique SSF-8035, Janvier 1995.
^Section 4.8: "Ensemble des fonctions de SMART (Technique d’Auto-surveillance, d’Analyse et de Rapport)", "Ensemble de Commandes ATA/ATAPI (ATA8-ACS)", Pièce jointe 8 AT (ANSI INCITS), 17 août 2004, ftp://ftp.t10.org/t13/docs2004/D1699-ATA8-ACS.pdf.
^Stephens 2006, pp. 44–126, 198–213, 327–44, Sections 4.19: "Ensemble des fonctions de SMART (Technique d’Auto-surveillance, d’Analyse et de Rapport)", 7.52: "SMART", Annexe A: "Définitions de la Page du Journal".
^Section 4.21: "Technique d’Auto-surveillance, d’Analyse et de Rapport Ensemble des fonctions (SMART)", "Ensemble de Commandes ATA/ATAPI (ATA8-ACS)", Pièce jointe 8 AT (ANSI INCITS), 6 septembre 2008, http://www.t13.org/documents/UploadedDocuments/docs2008/D1699r6a-ATA8-ACS.pdf.
^ (PDF) Hitachi Travelstar 80GN (spécifications du disque dur) (2.0 ed.), Systèmes de Données Hitachi, 19 septembre 2003, Document Hitachi Numéro S13K-1055-20, http://www.hitachigst.com/tech/techlib.nsf/techdocs/85CC1FF9F3F11FE187256C4F0052E6B6/$file/80GNSpec2.0.pdf
^ Hatfield, Jim (30 septembre 2005), Annexe de l'Attribut SMART, T13, e05148r0, http://www.t13.org/Documents/UploadedDocuments/docs2005/e05148r0-ACS-SMARTAttributesAnnex.pdf
^ "Maxtor" (texte brut), Smart mon tools (exemple), Source forge, http://smartmontools.sourceforge.net/examples/MAXTOR-1.txt.
^ Stephens 2006, p. 207Of les 512 octets listés dans la table 42 à la page 207: "Structure de données de l'appareil SMART" un total de 489 sont marqués comme "Spécifique au fournisseur".
^ "FAQ", Smartmontools, Source forge, http://smartmontools.sourceforge.net/faq.html#temp-seagate, "Attribut 194 (Température Celsius) se comporte étrangement sur mon disque Seagate".
^ "Technique d’Auto-surveillance, d’Analyse et de Rapport (SMART)", Linux Smart (article), Source forge, 2009-03-10, http://smartlinux.sourceforge.net/smart/article.php
^ "9109: Attribut S.M.A.R.T. : Heures Sous Tension. (POH)", Base des Connaissances, Acronis, http://kb.acronis.com/content/9109.
^ "FAQ". Smartmontools. Sourceforge. Extrait le 2013-01-15.
^ "Technologie SMART IV dans les Disques Durs d'Ordinateurs de Bureau HP Business" (PDF). Hewlett-Packard. Extrait le 8 septembre 2011.
^ ^a ^b ^c ^d ^eliste d'attribut S.M.A.R.T. (ATA), HD sentinel, http://www.hdsentinel.com/help/en/56_attrib.html.
^ (PDF) Le dispositif de Contrôle de la Hauteur de Vol Améliore la Fiabilité du Disque Dur, Western Digital, Avril 1999, 79-850123-000, http://www.wdc.com/wdproducts/library/other/2579-850123.pdf
^ ^a ^b ^c(PDF) Disques durs MHT2080AT, MHT2060AT, MHT2040AT, MHT2030AT, MHG2020AT (manuel du produit), Fujitsu, 2003-07-04, C141-E192-02EN, http://www.fujitsu.com/downloads/COMP/fcpa/hdd/discontinued/mht20xxat_prod-manual.pdf
^ Problème Load_Cycle_Count du disque dur de l'ordinateur portable, Forums Ubuntu, http://ubuntuforums.org/showthread.php?p=5031046.
^ "Problème avec le clic du disque dur", Think (wiki), http://www.thinkwiki.org/wiki/Problem_with_hard_drive_clicking, "Malgré la mise en cache des fichiers, les systèmes de fichiers conformes à POSIX comme ext2 ou ext3 doivent mettre à jour (=écrire) le dernier temps d’accès."
^ liste de discussion, Arch Linux, http://bbs.archlinux.org/viewtopic.php?id=66706, "Si linux tend à écrire sur /var/log/* chaque 30s, alors les têtes peuvent se garer/reprendre du service chaque 30s."
^ "Disques durs", Comment Réduire la Consommation d'Életricité (wiki), Think, http://www.thinkwiki.org/wiki/How_to_reduce_power_consumption#Hard_Drives, "La mise à jour du temps d’accès aux fichiers, bien que mandatée par POSIX, cause beaucoup d’accès aux disques; même l’accès des fichiers sur le cache du disque peut réveiller le bus ATA ou USB."
^ "S.M.A.R.T.-Attribut : Compte d'Événement de Réaffectation", Base des Connaissances, Acronis, http://kb.acronis.com/content/9132.
^ "S.M.A.R.T. Attribut : Heures Sous Tension (POH)", Base des Connaissances, Acronis, http://kb.acronis.com/content/9133.
^ Cabla, Lubomir (2009-08-06). "Manuel de l'utilisateur HDAT2 v4.6" (PDF) (1.1 ed.).
^ "Attributs". projet SMART Linux. Source forge.
^ ^a ^bDétails de l'Attribut SMART (PDF), Kingston, http://media.kingston.com/support/downloads/MKP_306_SMART_attribute.pdf.
^ "Brevet 171". Smartmontools (journal de bord). Source forge.
^ "Disques durs MHY2xxxBH, Manuel du Produit / de Maintenance". Fujitsu Limitée. C141-E192-02EN.
^ (PDF) Momentus 7200.2 SATA (manuel du produit) (D ed.), Seagate, Septembre 2007, Numéro de Document Hitachi S13K-1055-20, http://www.seagate.com/staticfiles/support/disc/manuals/notebook/momentus/7200.2/100451238d.pdf
^ "FAQ", Intégrité du Disque, http://www.drivehealth.com/faq.html, extrait le 4 octobre 2011.
^ L’interprétation de TEC et de SMART, Altrix soft, http://www.altrixsoft.com/en/support/help/hddinsp/tec%20and%20smart.php, extrait le 4 octobre 2011.
^ "auto-tests: "OPTIONS DE TEST SMART EXÉCUTER/ANNULER HORS LIGNE ET AUTO-TEST : -t TEST, --test=TEST"", SMARTCTL, http://smartmontools.sourceforge.net/man/smartctl.8.html.
^ Analyse du disque dur, http://hddscan.com/ – utilitaire gratuit de test du disque dur avec la prise en charge de la clé USB et de RAID.
^ Evans, Mark (26 avril 1999) (PDF), Auto-tests de Disques Durs, Milpitas, CA US: T10, http://www.t10.org/ftp/t10/document.99/99-179r0.pdf.
^ Bulik, Darrin (Sept. 24, 2001) (PDF), Proposition d'Extensions à l'Auto Test du Disque, Lake Forest, CA: T10, http://www.t10.org/t13/technical/e01137r0.pdf.
^ McLean, Pete (23 octobre 2001) (PDF), Proposition d'un Auto-test sélectif, Longmont, CO: T10, http://www.t10.org/t13/technical/e01139r0.pdf
^ "Le disque dur échoue le court test de S.M.A.R.T., mais réussit le long test ?". Canucks Matériel. Extrait le 2013-01-15.

Bibliographie

Stephens, Curtis E, dir. (11 décembre 2006), "Ensemble de Commandes ATA/ATAPI (ATA8-ACS)" (PDF), Pièce Jointe 8 AT (ANSI INCITS): p. 207.
Ottem, Erik; Plummer, Judy (Juin 1995), Agir Intelligemment (SMART), Technologie Seagate.

Références

"Signification de l'attribut S.M.A.R.T.". PalickSoft. Extrait le 3 février 2006.
Chlondowski, Zbigniew. "Site S.M.A.R.T. : table de référence des attributs". S.M.A.R.T. Linux . Extrait le 17 janvier 2007.
"Signification des attributs S.M.A.R.T.". Ariolic. 2007 . Extrait le 26 octobre 2007.
"Pouvons-nous faire confiance à SMART ?". H.D.S. Hongrie. 2007 . Extrait le 4 juin 2008.
Allen, Bruce (2004). "Suivre les Disques Durs avec SMART". Revue Linux . Extrait le 8 août 2010.

Liens externes

Soyez plus rusé que votre Disque Dur : Utilisation du programme smartmontools pour suivre les valeurs de S.M.A.R.T., Préchargement.
Comment Intelligent (S.M.A.R.T.) est votre disque dur ?, UK: Roi du PC.
Comment prédire la défaillance du disque dur (Rapport SMART) sous Linux Ubuntu en juste 3 clics ? , Karuppus Wamy, 2010‐5‐19.
KB251: Comprendre S.M.A.R.T. et les erreurs et défaillances S.M.A.R.T. , Western Digital.