S.M.A.R.T.

De Wikipedia, l'encyclopédie libre

S.M.A.R.T. (Technique d’Auto-surveillance, d’Analyse et de Rapport; très souvent écrit SMART) est un système de surveillance du disque dur d’un ordinateur. Il permet de faire un diagnostic selon plusieurs indicateurs de fiabilité dans le but d’anticiper les erreurs sur le disque dur.

Lorsqu'une défaillance est pressentie par S.M.A.R.T., l'utilisateur peut choisir de remplacer le disque pour éviter une interruption inattendue et la perte de données. Le fabricant peut être capable d'utiliser les données de S.M.A.R.T. pour découvrir où se trouvent les défauts et les empêcher de se reproduire dans les conceptions futures du disque.

Contexte

Le but de SMART est d'avertir un utilisateur d'une panne imminente du disque tandis qu'il y a encore assez de temps pour agir, comme en copiant les données vers un disque de remplacement.

Les pannes du disque dur se retrouvent dans l'une de deux classes de base :

  • Les pannes prévisibles résultent de processus lents tels que l'usure mécanique et la dégradation graduelle des surfaces d'enregistrement. Le suivi peut déterminer quand est-ce que de telles pannes sont le plus plausible.
  • Les pannes imprévisibles se produisent soudainement et sans avertissement. Elles varient des composants électroniques qui deviennent défectueux à une panne mécanique soudaine (peut être à cause d'une manipulation inappropriée).

Les pannes mécaniques représentent environ 60% de toutes les pannes de disque.[1] Alors que la panne finale peut s’avérer désastreuse, la plupart des pannes mécaniques résultent de l'usure graduelle et il y a généralement quelques indications qu'une panne est imminente. Celles-ci peuvent inclure une production excessive de chaleur, des niveaux élevés de bruit, des problèmes lors de la lecture et l’écriture de données, ou un accroissement dans le nombre de secteurs endommagés du disque.

Une étude de Google sur plus de 100.000 disques a révélé des corrélations entre certaines informations SMART et les taux actuels de pannes. Dans les 60 jours qui suivent la première analyse hors-ligne d'une erreur incorrigible sur un disque (attribut SMART 0xC6 ou 198), le disque était, en moyenne, 39 fois plus susceptible de tomber en panne qu'il ne le serait si aucune erreur pareille n’était survenue. Les premières erreurs de réaffectations, les réaffectations hors ligne (attributs SMART 0xC4 et 0x05 ou 196 et 5) et les comptes probatoires (attribut SMART 0xC5 ou 197) étaient également très en corrélation avec de plus hautes probabilités de panne. Inversement, une faible corrélation avait été trouvée pour de grandes température et aucune corrélation pour le niveau d'utilisation. Toutefois, une grande proportion (56%) de disques ayant connu une panne sont tombés en panne sans donner un quelconque avertissement S.M.A.R.T., ce qui signifie que les données S.M.A.R.T. seules étaient d’une utilité limitée dans l'anticipation des pannes. [2]

Page de PCTechGuide sur SMART (2003)[3] commentaires selon lesquels la technologie a traversé trois phases :

Dans son incarnation originale SMART effectuait la prévision des pannes en surveillant certaines activités en ligne du disque dur. Une version ultérieure améliora la prévision des pannes en ajoutant une analyse automatique de lecture hors ligne pour surveiller les opérations supplémentaires. La technologie "SMART" la plus récente non seulement surveille les activités du disque dur mais ajoute la prévention de pannes en essayant de détecter et de réparer les erreurs de secteur. Par ailleurs, tandis les versions antérieures de la technologie surveillaient uniquement l’activité du disque dur pour les données qui étaient extraites par le système d'exploitation, ce dernier SMART testes toutes des données et tous les secteurs d'un disque en utilisant "la collecte hors-ligne de données" pour confirmer l’intégrité du disque durant des périodes d’inactivité.

Histoire et prédécesseurs

Une technologie antérieure de surveillance du disque dur avait été introduite par IBM en 1992 dans ses réseaux de disques IBM 9337 pour les serveurs AS/400 utilisant les disques durs IBM 0662 SCSI-2. Cela a été appelé par la suite technologie d'analyse prédictive de défaillance (PFA). Cela permettait de mesurer plusieurs paramètres clés de l’intégrité de l'appareil et de les évaluer au sein du micrologiciel du disque. Les communications entre l’unité physique et le logiciel de contrôle étaient limitées à un résultat binaire : à savoir, soit "l'appareil est OK" ou "le disque est susceptible de tomber en panne bientôt".

Plus tard, une autre variante, qui avait été appelée IntelliSafe, était créée par le fabricant d'ordinateurs Compaq et les fabricants de disques durs Seagate, Quantum, et Conner.[4] Les disques durs mesuraient les "paramètres d’intégrité" du disque, et les valeurs étaient transférées au système d'exploitation et au logiciel de contrôle de l'espace-utilisateur. Chaque fournisseur de disque dur était libre de décider quels paramètres devaient être inclus pour le contrôle, et quels devaient être leurs seuils. L'unification était au niveau du protocole avec l’hôte.

Compaq soumit ses implémentations au comité Faible Facteur de Forme (SFF) pour standardisation en début 1995. [5] Il était pris en charge par IBM, par les partenaires au développement de Compaq qui étaient Seagate, Quantum, et Conner, et par Western Digital, qui ne disposait pas d'un système de prévision de panne à l’époque. Le comité choisit l'approche de IntelliSafe, car elle offrait plus de flexibilité. Le standard résultant développé conjointement était appelé SMART.

Ce standard SFF décrivait un protocole de communication pour qu'un hôte ATA utilise et contrôle le suivi et l'analyse dans un lecteur de disque dur, mais ne spécifiait aucune métrique ou méthode d'analyse particulière. Plus tard, "SMART" fut compris (quoique sans aucune spécification formelle) comme se référant à une variété de métriques spécifiques et de méthodes et comme s'appliquant à des protocoles sans rapport avec ATA pour la communication des mêmes genres de choses.

Informations fournies

La documentation technique de SMART est dans la Pièce Jointe AT (ATA) standard. Initialement introduit en 2004, [6] il a subi des révisions régulières, [7] la dernière étant en 2008. [8]

L'information la plus basique fournie par SMART est le statut SMART. Il n'offre que deux valeurs: "seuil non dépassé" et "seuil dépassé". Très souvent celles-ci sont représentées respectivement comme "disque OK" ou "disque en panne". Une valeur de "seuil dépassé" indique une probabilité assez élevée que le disque ne sera pas en mesure d'honorer ses spécifications dans le futur : c'est à dire, le disque est "sur le point de tomber en panne". La panne anticipée peut être désastreuse ou peut être quelque chose de subtil comme l'inaptitude à écrire sur certains secteurs, ou peut-être des performances plus lentes que le minimum déclaré par le fabricant.

Le statut SMART n'indique pas nécessairement la fiabilité passé ou présente du disque. Si un disque a déjà connu une panne de façon désastreuse, le statut SMART peut être inaccessible. Autrement, si un disque a rencontré des problèmes par le passé, mais les capteurs ne détectent plus de tels problèmes, le statut SMART peut, selon la programmation du fabricant, suggérer que le disque est maintenant sain.

L’incapacité à lire quelques secteurs n'est pas toujours une indication que le disque est sur le point de tomber en panne. Une méthode par laquelle des secteurs illisibles peuvent être crées, même lorsque le disque fonctionne selon les spécifications, est au travers d'une coupure soudaine d'électricité tandis que le disque est en cours d’écriture. Par ailleurs, même si le disque physique est endommagé à un endroit, de telle sorte qu'un certain secteur est illisible, le disque peut être capable d'utiliser l'espace de réserve pour remplacer la zone endommagée, afin que le secteur puisse être écrasé.[9]

Plus de détails sur l’intégrité du disque peuvent être obtenus en examinant les attributs SMART. Les attributs SMART ont été inclus dans certaines ébauches du standard ATA, mais ont été retirés avant que le standard ne soit finalisé. La signification et l’interprétation des attributs varient selon les fabricants, et sont quelquefois considérés comme étant un secret de fabrication par un fabricant ou un autre. Une discussion plus poussée sur les attributs est menée ci-dessous. [10]

Les disques intégrant SMART peuvent optionnellement maintenir un nombre de 'journaux'. Le journal d'erreurs enregistre des informations sur les erreurs les plus récentes signalées par le disque à l'ordinateur hôte. L'examen de ce journal peut aider à déterminer si les problèmes informatiques sont liés au disque ou causés par quelque chose d'autre (les estampilles temporelles du journal d'erreur peuvent "recouvrir" après 232 ms = 49,71 jours [11])

Un disque qui implémente SMART peut optionnellement implémenter un nombre de routines d'auto-test ou de maintenance, et les résultats des tests sont enregistrés dans le journal d'auto-test. Les routines d'auto-test peuvent être utilisées pour détecter tous les secteurs illisibles sur le disque, de telle sorte qu'ils puissent être restaurés à partir des sources de sauvegarde (par exemple, à partir d'autres disques dans un RAID). Ceci permet de réduire le risque de subir des pertes permanentes de données.

Standards et implémentation

Manque d’interprétation commune

Plusieurs cartes mères affichent un message d'avertissement lorsqu'un lecteur de disque se rapproche de la panne. Bien qu'un standard industriel existe parmi la plupart de fabricants majeurs de disques durs,[3] il y a quelques problèmes restants et beaucoup de "connaissances secrètes" propriétaires détenues par des fabricants individuels sur leur approche spécifique. Par conséquent, S.M.A.R.T. n'est pas toujours implémenté correctement sur plusieurs plateformes informatiques, à cause de l'absence de standards logiciel et matériel à l'échelle de l'industrie pour l’échange de données S.M.A.R.T.

Sous une perspective légale. le terme "S.M.A.R.T." renvoie uniquement à une méthode de signal entre les capteurs électromécaniques du disque dur interne et l'ordinateur hôte. Donc, des fabricants peuvent affirmer que leur disque implémente S.M.A.R.T. même s'il n'inclut pas, par exemple, un capteur de température, qui doit raisonnablement être supposé présent par le client. En outre, dans le cas le plus extrême, un fabricant de disque pourrait, en théorie, produire un disque qui inclut un capteur pour seulement un attribut physique, et par la suite légalement faire de la publicité selon laquelle le produit est "compatible S.M.A.R.T.".

Visibilité des systèmes d’hébergement

En fonction du type d'interface utilisée, certaines cartes-mères et logiciels associés prenant en charge S.M.A.R.T. peuvent ne pas communiquer avec certains disques prenant en charge S.M.A.R.T. Par exemple, peu de disques externes connectés via USB et Firewire transmettent correctement des données S.M.A.R.T. data au travers de ces interfaces. Avec tant de méthodes de connecter un disque dur (SCSI, Fibre Channel, ATA, SATA, SAS, SSA, et ainsi de suite), il est difficile de prédire si les rapports S.M.A.R.T. fonctionneront correctement dans un système donné.

Même avec un disque dur et une interface qui implémente la spécification, le système d'exploitation de l'ordinateur peut ne pas voir les informations S.M.A.R.T. parce que le disque et l'interface sont encapsulés dans une couche plus basse. Par exemple, ils peuvent faire partie d'un sous-système RAID dans lequel le contrôleur du RAID voie le disque prenant en charge S.M.A.R.T., mais l'ordinateur principal ne voie qu'un volume logique généré par le contrôleur du RAID.

Sur la plateforme Windows, beaucoup de programmes conçus pour suivre et rapporter les informations S.M.A.R.T. ne fonctionneront que sous un compte administrateur. Actuellement, S.M.A.R.T. est implémenté individuellement par des fabricants, et bien que certains aspects sont standardisés pour compatibilité, d'autres ne le sont pas.

Accès

Pour une liste de divers programmes qui permettent de lire des Données Smart, voir Comparaison des outils S.M.A.R.T..

Attributs de ATA S.M.A.R.T

Chaque fabricant de disque dur définit un ensemble d'attributs, [12] [4]et établit des valeurs de seuil au-delà desquelles les attributs ne devraient pas aller sous un fonctionnement normal. Chaque attribut a une valeur brute, dont le sens est entièrement selon le fabricant du disque (mais correspond très souvent aux comptes d'une unité physique, telle que les degrés Celsius ou les secondes), une valeur normalisée, qui varie de 1 à 253 (où 1 représente le pire des cas et 253 représente le meilleur des cas) et une valeur pire, qui représente la plus petite valeur normalisée enregistrée. En fonction du fabricant, une valeur de 100 ou 200 sera assez souvent choisie comme la valeur normalisée initiale.

Les fabricants qui ont implémenté au moins un attribut SMART dans divers produits comprennent Samsung, Seagate, IBM (Hitachi), Fujitsu, Maxtor, Toshiba, Intel, STEC Inc, Western Digital et ExcelStor Technology.

Attributs connus de ATA S.M.A.R.T

Le tableau suivant liste quelques attributs S.M.A.R.T. et le sens typique de leurs valeurs brutes. Les valeurs normalisées sont toujours répertoriées afin que les valeurs plus grandes sont meilleures (avec seulement de très rares exceptions telles que l'attribut "Température" sur certains disques Seagate [13]), mais de plus grandes valeurs brutes d'attributs peuvent être meilleures ou pires en fonction de l'attribut et du fabricant. Par exemple, la valeur normalisée de l'attribut "Compte de Secteurs Réaffectés" décroit au fur et à mesure que le compte de secteurs réaffectés s’accroît. Dans ce cas, la valeur brute de l'attribut indiquera très souvent le compte actuel de secteurs qui ont été réaffectés, quoique les fournisseurs ne sont en rien tenus d’adhérer à cette convention. Puisque les fabricants ne sont pas nécessairement d'accord sur les définitions précises des attributs et les unités de mesure, la liste suivante d'attributs doit être perçue comme guide général uniquement.

Légende
Une plus haute valeur brute est meilleure
Une plus basse valeur brute est meilleure
Critique : la rangée de couleur rose Indicateurs potentiels d'une panne électromécanique imminente
ID Hex Nom de l'attribut Meilleur Description
01 0x01 Taux d'Erreur de Lecture
(Valeur brute spécifique au fournisseur.) Enregistre les données liées au taux d'erreurs de lecture matérielle qui se sont produises lors de la lecture de données sur une surface de disque. La valeur brute a une structure différente pour différents fournisseurs et est très souvent sans signification comme un nombre décimal.
02 0x02 Performance de Débit
Performance de débit globale (générale) d'un disque dur. Si la valeur de cet attribut est en régression il y a une forte probabilité qu'il y a un problème avec le disque.
03 0x03 Temps d'Accélération
Temps moyen de mise en rotation de l'axe (de zéro tr/min à pleinement opérationnel [millisecs]).
04 0x04 Compte Départ/Arrêt Un compte des cycles de l'axe en départ/arrêt. L'axe tourne, et donc le compte s’accroît, quand le disque dur est mis en marche après avoir été auparavant mis totalement à l’arrêt (déconnecté de la source d'alimentation) et quand le disque dur reprend du service après avoir été préalablement mis en mode veille.[14]
05 0x05 Compte des Secteurs Réaffectés
Compte des secteurs réaffectés. Quand le disque dur rencontre une erreur de lecture/écriture/vérification, il marque ce secteur comme "réaffecté" et transfère les données vers un emplacement spécial réservé (espace de réserve). Ce processus est également connu comme remappage, et les secteurs réaffectés sont appelés "remaps". La valeur brute représente normalement un compte des secteurs défectueux qui ont été trouvés et remappés. Ainsi, plus grande est la valeur de l'attribut, plus grand est le nombre de secteurs que le disque a dû réaffecter. Ceci permet à un disque comportant des secteurs défectueux de continuer à fonctionner ; toutefois, un disque qui a subi des réaffectations est considérablement plus susceptible de connaitre une défaillance dans un futur proche.[2] Quoique essentiellement utilisé comme une métrique de l’espérance de vie du disque, ce nombre affecte également la performance. Au fur et à mesure que le compte de secteurs réaffectés s’accroît, la vitesse de lecture/écriture tend à se détériorer parce que la tête de lecture du disque est contrainte de chercher dans la zone réservée à chaque fois qu'un remap est accédé. Une solution de rechange qui préservera la vitesse du disque aux dépens de la capacité est de créer une partition de disque au dessus de la région contenant des remaps et d'instruire le système d'exploitation de ne pas utiliser cette partition.
06 0x06 Marge du Canal de Lecture Marge d'un canal pendant la lecture de données. La fonction de cet attribut n'est pas spécifiée.
07 0x07 Taux d'Erreur de Recherche N/A (Valeur brute spécifique au fournisseur.) Taux d'erreurs de recherche des têtes magnétiques. S'il y a une panne partielle dans le système de positionnement mécanique, alors les erreurs des recherche se produiront. Une telle panne peut être due à divers facteurs, tels qu'un dommage à un servomoteur, ou l’élargissement thermique du disque dur. La valeur brute a une structure différente pour différents fournisseurs et est très souvent sans signification comme un nombre décimal.
08 0x08 Performances du Temps de Recherche
La performance moyenne des opérations de recherche des têtes magnétiques. Si cet attribut va décroissant, cela est un signe de problèmes dans le sous-système mécanique.
09 0x09 Heures Sous Tension (POH) Compte des heures dans l’état sous tension. La valeur brute de cet attribut exprime le compte total d'heures (ou minutes, ou secondes, en fonction du fabricant) dans l’état sous tension.[15]

Sur certains disques antérieurs à 2005, cette valeur brute peut avancer de façon erratique et/ou "se recouvrir" (réinitialiser à zéro périodiquement). [16]

10 0x0A Compte Nouvel Éssai de Tourner
Nombre de nouveaux essais d’accélération. Cet attribut enregistre le compte total de tentatives de faire tourner afin d'atteindre la vitesse de fonctionnement optimale (sous la condition que la première tentative était infructueuse). Une augmentation de la valeur de cet attribut est un signe de problèmes dans le sous-système mécanique du disque dur.
11 0x0B Nouvelles Tentatives de Ré-étalonnage or Compte de Nouvelle Tentative d'Étalonnage
Cet attribut indique le nombre de fois que le ré-étalonnage a été requis (sous la condition que la première tentative ait été infructueuse). Une augmentation de la valeur de cet attribut est un signe de problèmes dans le sous-système mécanique du disque dur.
12 0x0C Compte de Cycle de Puissance Cet attribut indique le nombre de cycles complets arrêt/allumage du disque dur.
13 0x0D Taux d'Erreur de Lecture Intermittente
Erreurs de lecture non corrigées signalées au système d'exploitation.
180 0xB4 Total de Blocs Réservés Inutilisés Attribut "Échec-Anticipé" utilisé au moins dans les appareils HP.
183 0xB7 Compte d'Erreur de Rétrogradage SATA Attribut de Western Digital et Samsung.
184 0xB8 Error de Bout-en-Bout/ IOEDC
Cet attribut fait partie de la technologie Hewlett-Packard's SMART IV, ainsi que des schémas de Détection et de Correction d'erreurs IO d'autres fournisseurs, et il contient un compte d'erreurs de parité qui se produisent dans le chemin des données vers le média via la RAM cache du disque. [17]
185 0xB9 Stabilité de la tête Attribut Western Digital.
186 0xBA Détection de Vibration-Op Induite Attribut Western Digital.
187 0xBB Erreurs Incorrigibles Signalées
Le nombre d'erreurs qui n'ont pas pu être récupérées à l'aide du code correcteur d'erreur (voir attribut 195).
188 0xBC Expiration de Commande
Le compte d’opérations annulées suite à l'expiration du disque dur. Normalement cette valeur d'attribut devrait être égale à zéro et si la valeur est très supérieure à zéro, alors très probablement il y aura quelques sérieux problèmes avec l’alimentation électrique ou un câble de données oxydé. [18]
189 0xBD Écritures à Grande Hauteur
Les fabricants de disques durs implémentent un dispositif de contrôle de la Hauteur de Vol qui essaie d'offrir des protections supplémentaires pour les opérations d’écriture en détectant lorsqu'une tête d'enregistrement est entrain de voler hors de sa plage normale de fonctionnement. Si l'on est confronté à une hauteur de vol risquée, le processus d’écriture est stoppé, et l'information est réécrite ou réaffectée à une région sûre du disque dur. Cet attribut indique le compte de ces erreurs détectées tout au long de la vie du disque.

Cette fonction est implémentée dans la plupart des disques modernes Seagate[1] et dans certains disques de Western Digital, à commencer par les disques durs WD Enterprise WDE18300 et WDE9180 Ultra2 SCSI et sera incluse dans tous les produits futurs de WD Enterprise.[19]

190 0xBE Température du Courant d'Air (WDC) resp. Température du Courant d'Air Celsius (HP)
La température du courant d'air sur les disques durs Western Digital (Identiquement à temp. [C2], mais la valeur actuelle est de 50 en moins pour certains modèles. Marqués comme obsolètes.)
190 0xBE La Différence de Température de la Valeur 100
Est égale à (100−temp. °C), permettant au fabricant de définir un seuil minimum qui correspond à une température maximum .
191 0xBF Taux d'Erreur G-Sense
Le nombre d'erreurs résultant de choc & vibration provenant de l’extérieur.
192 0xC0 Compte de Retrait à l’Arrêt or Compte de Cycle de Retrait en Urgence (Fujitsu) [20]
Nombre de fois que les têtes sont déchargées du média. Les têtes peuvent être déchargées sans s’éteindre tout à fait.
193 0xC1 Compte de Cycle de Chargement ou Compte de Cycle de Chargement/Déchargement (Fujitsu)
Nombre de cycles de chargement/déchargement jusqu’à une position de la zone d’atterrissage de la tête. [20]

L’espérance de vie typique des disques durs d'ordinateurs portables (2,5 pouces) est de 300.000 à 600.000 cycles de chargement. [21]Certains disques d'ordinateurs portables sont programmés pour décharger les têtes à chaque fois qu'il n'y a pas eu d’activité pendant environ cinq secondes. [22]Beaucoup d'installations Linux écrivent sur le système de fichiers quelques fois par minute en arrière-plan. [23]Par conséquent, il peut y avoir 100 cycles de chargements ou plus par heure, et la cote de cycle de chargement peut être dépassée en moins d'un an. [24]

194 0xC2 Température resp. Température Celsius
Température interne actuelle.
195 0xC3 Temps entre les Erreurs Corrigées N/A (Valeur brute spécifique au fournisseur.) La valeur brute a une structure différente pour différents fournisseurs et n'est très souvent pas significative comme un nombre décimal.
196 0xC4 Compte d'Événement de Réaffectation
Compte des opérations de remappage. La valeur brute de cet attribut exprime le nombre total de tentatives de transférer des données des secteurs réaffectés vers une zone de réserve. Les tentatives avec succès & et les tentatives infructueuses sont comptées.[25]
197 0xC5 Compte de Secteur Courant en Attente
Compte de secteurs "instable" (en attente d’être remappés, à cause d'erreurs de lecture irrécupérables). Si un secteur instable est par la suite lu avec succès, cette valeur est revue à la baisse et le secteur n'est pas remappé. Les erreurs de lecture sur un secteur ne remapperont pas le secteur immédiatement (car la valeur correcte ne peut être lue et ainsi la valeur à remapper n'est pas connu, et de plus elle pourrait devenir lisible plus tard); au lieu de cela, le micrologiciel du disque se rappelle que le secteur nécessite d’être remappé, et le remappera la prochaine fois qu'il est écrit. [26]Toutefois certains disques ne remapperont pas dans l’immédiat de tels secteurs lorsqu'ils sont écrits; au lieu de cela le disque tentera dans un premier temps d’écrire sur le secteur à problème et si l’opération d’écriture connait un succès alors le secteur sera marqué comme bon (dans ce cas, le "Compte d'Evénement de Réaffectation" (0xC4) ne sera pas incrémenté). Ceci constitue un grave défaut, car si un tel disque contient des secteurs marginaux qui connaissent des défaillance de façon consistante seulement après qu'un peu de temps se soit écoulé suite à une opération d'écriture réussie, alors le disque ne remappera jamais ces secteurs à problème.
198 0xC6 Compte de Secteur Incorrigible ou

Compte de Secteur Incorrigible Hors Ligne ou

Incorrigible avec Analyse Hors Ligne[20]

Le compte total d'erreurs incorrigibles lors de la lecture/écriture d'un secteur. Une augmentation de la valeur de cet attribut indique des défauts de la surface du disque et/ou des problèmes dans le sous-système mécanique.
199 0xC7 Compte de l'Erreur UltraDMA CRC
Le compte d'erreurs dans le transfert de données via l'interface du câble tel que déterminé par ICRC (Vérifications de Redondance Cyclique de l'Interface).
200 0xC8 Taux d'Erreur à Zones Multiples [27]
Le nombre d'erreurs trouvées lors de l’écriture d'un secteur. Plus grande est la valeur, pire est la condition mécanique du disque.
200 0xC8 Taux d'Erreur d'Écriture (Fujitsu)
Total des erreurs lors de l’écriture d'un secteur.[28]
201 0xC9 Taux d'Erreur de Lecture Intermittente ou

Compteur de TA Détecté

Nombre d'erreurs hors-piste.
202 0xCA Erreurs de Marquage de l’Adresse des Données ou

Compteur de TA Augmenté

Nombre d'erreurs de Marquage d'Adresse de Données (ou spécifique au fournisseur).
203 0xCB Annulation de la Sortie
204 0xCC Correction ECC Intermittent
Total des erreurs corrigées par le logiciel ECC
205 0xCD Taux d'Aspérités Thermiques (TAR)
Total des erreurs dues à une température élevée.[18]
206 0xCE Hauteur de Vol Hauteur des têtes au-dessus de la surface du disque. Une hauteur de vol trop basse augmente de chances d'un accident de la tête tandis qu'un hauteur de vol trop élevée augmente les chances d'une erreur lecture/écriture.
207 0xCF Courant de Rotation Élevée
Quantité de courant de surtension utilisé pour faire tourner le disque. [18]
208 0xD0 Bruit de Rotation Nombre de routines de bruit nécessaires à l'accélération du disque suite à une puissance insuffisante. [18]
209 0xD1 Performance de Recherche Hors Ligne Performance de la recherche du disque durant ses tests internes. [18]
210 0xD2 Vibration Durant L’Opération d'Écriture (trouvée sur les disques Maxtor 6B200M0 200GO et Maxtor 2R015H1 15GO)
211 0xD3 Vibration Durant L’Opération d'Écriture Vibration Durant L’Opération d'Écriture
212 0xD4 Choc Durant L’Opération d'Écriture Choc Durant L’Opération d'Écriture
220 0xDC Décalage du disque
Distance dont le disque a décalé relativement à l'axe (généralement à cause d'un choc ou de la température). L’unité de mesure est inconnue.
221 0xDD Taux d'Erreur G-Sense
Le nombre d'erreurs résultant de choc & vibration provenant de l’extérieur.
222 0xDE Heures Sous Charge Temps de fonctionnement mis sous la charge de données (mouvement de l'armature magnétique de la tête)
223 0xDF Compte de Nouvel Éssai Chargement/Déchargement Nombre de fois que la tête change de position
224 0xE0 Frottement de Charge
Résistance causée par les frottements dans les parties mécaniques lors du fonctionnement.
225 0xE1 Compte de Cycles de Chargement/Déchargement
Nombre total de cycles de chargement
226 0xE2 Temps total de charge Temps total de chargement sur le mécanisme des têtes magnétiques (temps non passé dans la zone de parking).
227 0xE3 Compte d'Amplification du Couple
Nombre de tentatives de compenser les variations de la vitesse du plateau
228 0xE4 Cycle de Retrait pour Défaut de Puissance
Le nombre de fois que l'armature magnétique a été automatiquement rétractée suite à la réduction de la puissance.
230 0xE6 Amplitude de la Tête GMR Amplitude de "battage" (distance des mouvements répétitifs avancer/reculer de la tête)
230 0xE6 Statut de Protection de la Durée de Vie du Disque
État actuel de fonctionnement du disque selon la courbe du cycle de vie[29]
231 0xE7 Température
Température du Disque
231 0xE7 Durée restante pour le SSD
Renseigne sur la durée approximative de vie restante pour le SSD, en termes de cycles de programmation/effaçage des blocs flash actuellement disponibles pour usage. [29]
232 0xE8 Espace Réservé Disponible Intel SSD signale la quantité d'espace disponible réservée comme un pourcentage de l'espace réservé dans un SSD flambant neuf.
232 0xE8 Longévité Restante Nombre de cycles physiques de suppression accomplis sur le disque comme un pourcentage du nombre maximum de cycles physiques de suppression que le disque a été conçu pour endurer
233 0xE9 Indicateur de l'Usure des Médias Intel SSD signale une valeur normalisée de 100 (lorsque le SSD est neuf) et réduit jusqu’à une valeur minimum de 1. Elle décroit lorsque les cycles de suppression NAND croissent de 0 jusqu’aux cycles cotés au maximum.
233 0xE9 Heures Sous Tension Nombre d'heures écoulées dans un état sous tension.
234 0xEA Compte Moyen de Suppression ET Compte Maximum de Suppression Décodé comme : octet 0-1-2 = compte moyen de suppression (big endian) et octet 3-4-5 = compte max de suppression (big endian) [30]
235 0xEB Compte de Blocs Sains ET Compte de Blocs du Système (Libre) décodé comme : octet 0-1-2 = compte de blocs sains (big endian) et octet 3-4 = compte de blocs du système(libre).
240 0xF0 Taux d'Erreur de Transmission (Fujitsu) Compte des fois que le lien est réinitialisé durant un transfert de données. [31]
240 0xF0 Heures de Vol de la Tête Temps de positionnement de la tête
241 0xF1 Total de LBAs écrits Nombre total de LBAs écrits
242 0xF2 Total de LBAs lus Compte total de LBAs lus.
Certains utilitaires S.M.A.R.T. signaleront un nombre négatif comme valeur brute car en réalité il a 48 bits plutôt que 32.
250 0xFA Taux de Réessai d'Erreur de Lecture
Compte d'erreurs lors de la lecture à partir d'un disque
254 0xFE Protection Contre la Chute Libre
Compte de "d'Événements de Chute Libre" détectés [32]

Date d'Estimation de la Prochaine Défaillance

La date d'estimation de la prochaine défaillance (TEC) est une date estimée à laquelle un attribut statistique critique du disque atteindra sa valeur seuil. Lorsque le logiciel d’Intégrité du Disque signale "T.E.C. le plus proche", cela doit être perçu comme une "Date d’échec". Parfois, aucune date n'est donnée et l'on peut s'attendre à ce que le disque fonctionne sans erreurs.[33]

Pour prédire la date, le disque surveille le taux suivant lequel l'attribut change. Notez que les dates de TEC sont uniquement des estimations ; les disques durs peuvent et tombent en panne beaucoup plus tôt ou plus tard que la date de TEC.[34]

Auto-tests

Les disques SMART peuvent offrir un nombre d'auto-tests : [35] [36] [37]

Bref

Vérifie les performances électriques et mécaniques ainsi que les performance de lecture du disque. Les tests électriques peuvent inclure un test de la RAM tampon, un test du circuit de lecture/écriture, ou un test des éléments de lecture/écriture de la tête. Les tests mécaniques incluent la recherche et le servomoteur lors du suivi de données. Analyse de petites portions de la surface du disque (la zone est spécifique au fournisseur et il y a une limite de temps pour le test). Vérifie la liste de secteurs en Attente qui peuvent contenir des erreurs de lecture. (Généralement en moins de deux minutes.)

Long/Étendu

Une version plus longue et plus complète de l'auto-test bref, analyse l’entière surface du disque, sans limite de temps. (Des centaines de minutes, approximativement un gigaoctet par minute pour les disques modernes.)

Acheminement

Destiné à être un test rapide d'identification des dommages subis lors du transport de l'appareil du fabricant du disque jusqu’au fabricant de l'ordinateur.[38] Disponible seulement sur les disques ATA (plusieurs minutes.)

Sélectif

Certains disques permettent des auto-tests sélectifs d'une partie de la surface seulement.[39]

Les journaux d'auto-test pour des disques SCSI et ATA sont légèrement différents. Il est possible au long test de réussir même si le court test échoue. [40]

Voir aussi

Notes

  1. ^ a b Attributs Améliorés de Smart (déclaration), Seagate , http://argusmonitor.com/help/enhanced_smart.pdf .
  2. ^ a b Pinheiro, Eduardo; Weber, Wolf-Dietrich; Barroso, Luís André, "Conclusion" , Tendances de Défaillances dans une Grande Population de Disques Durs, 1600 Amphithéâtre Pkwy Mountain View, CA 94043: Google , http://research.google.com/archive/disk_failures.pdf .
  3. ^ a b SMART, PCTechGuide, 2003, http://www.pctechguide.com/31HardDisk_SMART.htm.
  4. ^ a b Ottem & Plummer 1995.
  5. ^ Compaq. IntelliSafe. Rapport technique SSF-8035, Janvier 1995.
  6. ^ Section 4.8: "Ensemble des fonctions de SMART (Technique d’Auto-surveillance, d’Analyse et de Rapport)", "Ensemble de Commandes ATA/ATAPI (ATA8-ACS)", Pièce jointe 8 AT (ANSI INCITS), 17 août 2004, ftp://ftp.t10.org/t13/docs2004/D1699-ATA8-ACS.pdf.
  7. ^ Stephens 2006, pp. 44–126, 198–213, 327–44, Sections 4.19: "Ensemble des fonctions de SMART (Technique d’Auto-surveillance, d’Analyse et de Rapport)", 7.52: "SMART", Annexe A: "Définitions de la Page du Journal".
  8. ^ Section 4.21: "Technique d’Auto-surveillance, d’Analyse et de Rapport Ensemble des fonctions (SMART)", "Ensemble de Commandes ATA/ATAPI (ATA8-ACS)", Pièce jointe 8 AT (ANSI INCITS), 6 septembre 2008, http://www.t13.org/documents/UploadedDocuments/docs2008/D1699r6a-ATA8-ACS.pdf.
  9. ^ (PDF) Hitachi Travelstar 80GN (spécifications du disque dur) (2.0 ed.), Systèmes de Données Hitachi, 19 septembre 2003, Document Hitachi Numéro S13K-1055-20, http://www.hitachigst.com/tech/techlib.nsf/techdocs/85CC1FF9F3F11FE187256C4F0052E6B6/$file/80GNSpec2.0.pdf
  10. ^ Hatfield, Jim (30 septembre 2005), Annexe de l'Attribut SMART, T13, e05148r0, http://www.t13.org/Documents/UploadedDocuments/docs2005/e05148r0-ACS-SMARTAttributesAnnex.pdf
  11. ^ "Maxtor" (texte brut), Smart mon tools (exemple), Source forge, http://smartmontools.sourceforge.net/examples/MAXTOR-1.txt.
  12. ^ Stephens 2006, p. 207Of les 512 octets listés dans la table 42 à la page 207: "Structure de données de l'appareil SMART" un total de 489 sont marqués comme "Spécifique au fournisseur".
  13. ^ "FAQ", Smartmontools, Source forge, http://smartmontools.sourceforge.net/faq.html#temp-seagate, "Attribut 194 (Température Celsius) se comporte étrangement sur mon disque Seagate".
  14. ^ "Technique d’Auto-surveillance, d’Analyse et de Rapport (SMART)", Linux Smart (article), Source forge, 2009-03-10, http://smartlinux.sourceforge.net/smart/article.php
  15. ^ "9109: Attribut S.M.A.R.T. : Heures Sous Tension. (POH)", Base des Connaissances, Acronis, http://kb.acronis.com/content/9109.
  16. ^ "FAQ". Smartmontools. Sourceforge. Extrait le 2013-01-15. 
  17. ^ "Technologie SMART IV dans les Disques Durs d'Ordinateurs de Bureau HP Business" (PDF). Hewlett-Packard. Extrait le 8 septembre 2011. 
  18. ^ a b c d e liste d'attribut S.M.A.R.T. (ATA), HD sentinel, http://www.hdsentinel.com/help/en/56_attrib.html.
  19. ^ (PDF) Le dispositif de Contrôle de la Hauteur de Vol Améliore la Fiabilité du Disque Dur, Western Digital, Avril 1999, 79-850123-000, http://www.wdc.com/wdproducts/library/other/2579-850123.pdf
  20. ^ a b c (PDF) Disques durs MHT2080AT, MHT2060AT, MHT2040AT, MHT2030AT, MHG2020AT (manuel du produit), Fujitsu, 2003-07-04, C141-E192-02EN, http://www.fujitsu.com/downloads/COMP/fcpa/hdd/discontinued/mht20xxat_prod-manual.pdf
  21. ^ Problème Load_Cycle_Count du disque dur de l'ordinateur portable, Forums Ubuntu, http://ubuntuforums.org/showthread.php?p=5031046.
  22. ^ "Problème avec le clic du disque dur", Think (wiki), http://www.thinkwiki.org/wiki/Problem_with_hard_drive_clicking, "Malgré la mise en cache des fichiers, les systèmes de fichiers conformes à POSIX comme ext2 ou ext3 doivent mettre à jour (=écrire) le dernier temps d’accès."
  23. ^ liste de discussion, Arch Linux, http://bbs.archlinux.org/viewtopic.php?id=66706, "Si linux tend à écrire sur /var/log/* chaque 30s, alors les têtes peuvent se garer/reprendre du service chaque 30s."
  24. ^ "Disques durs", Comment Réduire la Consommation d'Életricité (wiki), Think, http://www.thinkwiki.org/wiki/How_to_reduce_power_consumption#Hard_Drives, "La mise à jour du temps d’accès aux fichiers, bien que mandatée par POSIX, cause beaucoup d’accès aux disques; même l’accès des fichiers sur le cache du disque peut réveiller le bus ATA ou USB."
  25. ^ "S.M.A.R.T.-Attribut : Compte d'Événement de Réaffectation", Base des Connaissances, Acronis, http://kb.acronis.com/content/9132.
  26. ^ "S.M.A.R.T. Attribut : Heures Sous Tension (POH)", Base des Connaissances, Acronis, http://kb.acronis.com/content/9133.
  27. ^ Cabla, Lubomir (2009-08-06). "Manuel de l'utilisateur HDAT2 v4.6" (PDF) (1.1 ed.). 
  28. ^ "Attributs". projet SMART Linux. Source forge. 
  29. ^ a b Détails de l'Attribut SMART (PDF), Kingston, http://media.kingston.com/support/downloads/MKP_306_SMART_attribute.pdf.
  30. ^ "Brevet 171". Smartmontools (journal de bord). Source forge. 
  31. ^ "Disques durs MHY2xxxBH, Manuel du Produit / de Maintenance". Fujitsu Limitée. C141-E192-02EN. 
  32. ^ (PDF) Momentus 7200.2 SATA (manuel du produit) (D ed.), Seagate, Septembre 2007, Numéro de Document Hitachi S13K-1055-20, http://www.seagate.com/staticfiles/support/disc/manuals/notebook/momentus/7200.2/100451238d.pdf
  33. ^ "FAQ", Intégrité du Disque, http://www.drivehealth.com/faq.html, extrait le 4 octobre 2011.
  34. ^ L’interprétation de TEC et de SMART, Altrix soft, http://www.altrixsoft.com/en/support/help/hddinsp/tec%20and%20smart.php, extrait le 4 octobre 2011.
  35. ^ "auto-tests: "OPTIONS DE TEST SMART EXÉCUTER/ANNULER HORS LIGNE ET AUTO-TEST : -t TEST, --test=TEST"", SMARTCTL, http://smartmontools.sourceforge.net/man/smartctl.8.html.
  36. ^ Analyse du disque dur, http://hddscan.com/ – utilitaire gratuit de test du disque dur avec la prise en charge de la clé USB et de RAID.
  37. ^ Evans, Mark (26 avril 1999) (PDF), Auto-tests de Disques Durs, Milpitas, CA US: T10, http://www.t10.org/ftp/t10/document.99/99-179r0.pdf.
  38. ^ Bulik, Darrin (Sept. 24, 2001) (PDF), Proposition d'Extensions à l'Auto Test du Disque, Lake Forest, CA: T10, http://www.t10.org/t13/technical/e01137r0.pdf.
  39. ^ McLean, Pete (23 octobre 2001) (PDF), Proposition d'un Auto-test sélectif, Longmont, CO: T10, http://www.t10.org/t13/technical/e01139r0.pdf
  40. ^ "Le disque dur échoue le court test de S.M.A.R.T., mais réussit le long test ?". Canucks Matériel. Extrait le 2013-01-15. 

Bibliographie

  • Stephens, Curtis E, dir. (11 décembre 2006), "Ensemble de Commandes ATA/ATAPI (ATA8-ACS)" (PDF), Pièce Jointe 8 AT (ANSI INCITS): p. 207 .
  • Ottem, Erik; Plummer, Judy (Juin 1995), Agir Intelligemment (SMART), Technologie Seagate .

Références

Liens externes