Aller au contenu

Vademecum Sur Les Disques


fdm900

Messages recommandés

Un disque mécanique comme son nom l'indique est fait de pièces mécaniques et composants électroniques et peut tomber en panne.

Un disque électronique (SSD) est fait de composants électroniques et peut aussi tomber en panne.

Règle 1 : Un disque mécanique ou électronique n'est pas toujours fiable => une sauvegarde régulière s'impose pour préserver les données !

Règle 2 : Une sauvegarde n'est pas une synchronisation !

Par exemple, soient deux volumes A et B synchronisés. Un fichier est perdu sur le volume A pour une raison ou une autre. On ne s'en rend pas compte sur le moment. Lors d'une nouvelle synchronisation entre les deux volumes, ce même fichier est supprimé automatiquement du volume B.

Une sauvegarde du volume A sur le volume B permettra par contre de pouvoir récupérer à tout moment le fichier sur le volume B.

Règle 3 : S'assurer que les sauvegardes sont exploitables - c'est-à-dire que les données sauvegardées sont effectivement restaurables.

---

Quel que soit le type de disque, chacun a son logiciel embarqué (appelé firmware en anglais). Il est parfois nécessaire et même (très) recommandé de le mettre à jour.

Règle 4 : Mettre à jour le firmware des disques avant de les installer dans un NAS.

Cas d'école : Western Digital a livré dans le passé des disques entreprises RE4-GP dont le firmware était défaillant. La conséquence est que je perdais régulièrement des données. Le problème a été mis en évidence avec rsync en mode verbose (problème que j'ai relaté dans le passé sur ce forum).

---

Il existe des moyens pour se "prémunir" de futures erreurs disques bien que parfois il soit déjà (trop) tard.

Règle 5 : Lancer régulièrement des tests SMART et ne pas accepter forcément pour argent comptant les résultats des tests dans DSM. Vérifier soi-même les attributs SMART critiques (voir tableau avec lignes en surbrillance rouge).

Autre cas d'école : dans un dossier partagé, vous déplacez des fichiers et ils disparaissent définitivement ! Les deux tests SMART sous DSM ne montrent rien d'anormal ! Par contre une vérification des attributs SMART critiques du disque montre qu'il y a un nombre de secteurs instables (champ 197 - "current pending sector count" différent de 0).

ALERTE : le temps est compté. Il est urgent de sauvegarder ce qui ne l'a pas déjà été. Un test régulier et une vérification visuelle des champs SMART critiques auraient peut-être pu mettre le problème en évidence plus tôt.

En aparté, DSM 5 permet d'afficher une vue d'ensemble intéressante par disque en soulignant le nombre de reconnexions, le nombre de mauvais secteurs et le nombre de ré-identifications, ainsi qu'un historique graphique (vue sur un seul mois et vue incrémentale). Par ailleurs, pour créer des tâches récurrentes pour des tests SMART rapides (quelques minutes) et étendus (quelques heures), voir sous DSM 5 : Gestionnaire de stockage (module) > HDD/SDD (menu de gauche) > Planificateur de test (onglet).

De plus, que votre disque soit dans une grappe RAID ou pas, vous perdez de toute façon vos fichiers. Le RAID ne vous est d'aucun secours ici. Le disque défaillant a pu corrompre le système de fichiers. L'intégrité de vos données pour tout le volume RAID est remise en cause. Il faudra recréer le volume avec le nouveau disque. Même s'il existe l'outil e2fsck capable de réparer le système de fichiers et de garder l'intégrité des données, son utilisation encourt des risques et peut entraîner des pertes supplémentaires. Synology n'assure pas de support sur l'emploi de cet outil.

Règle 6 : Un seul disque défaillant peut compromettre un volume RAID !

Règle 7 : Une configuration RAID ne garantit pas les données. Le RAID n'est pas une solution de sauvegarde mais simplement une solution de disponibilité de vos données.

---

Une coupure de courant peut entraîner une perte de données. Ne pas oublier que les écritures se font aussi en différé avec la mémoire cache.

Règle 8 : Un onduleur s'impose !

Règle 9 : (Surtout) pas de configuration RAID sans onduleur !

Règle 10 : Un onduleur sans connexion USB vers le NAS ne sert à rien !

Hormis de passer sur la batterie de secours, le second principe d'un onduleur est de notifier au NAS un problème d'alimentation (panne de courant, sur-tension, sous-tension...).

Bien paramétrer en conséquence l'onglet UPS dans DiskStation Manager (DSM). Pour définir le temps que le NAS a pour enregistrer les données, démonter les volumes et s'éteindre, il faut impérativement tenir compte des caractéristiques propres de l'onduleur (dont le diagramme d'autonomie qui est une courbe sur la durée d'autonomie en fonction de la charge). Ces caractéristiques sont d'ailleurs à prendre en compte dans les critères d'achat pour un onduleur.

Règle 11 : S'assurer au moins une fois par an que le NAS s'arrête proprement en coupant volontairement le courant de l'onduleur. Ce sera l'occasion de voir si la batterie tient toujours la route.

Par mesure de précaution, on pourra temporairement supprimer l'activation du cache d'écriture. Voir sous DSM 5 : Gestionnaire de stockage (module) > HDD/SDD (menu de gauche) > Gestion du cache (onglet).

---

Règle 12 : Avec un budget limité, investir par ordre d'importance dans

  1. des disques de qualité (ne pas hésiter à lire les spécifications et les comparer + parcourir les commentaires des utilisateurs pour avoir leurs retours d'expérience) ; leur coût est aussi fonction de la garantie fournie (privilégier qu'un disque d'échange soit d'abord envoyé par le fabricant avant de lui retourner celui qui est défectueux) ; tenir compte de leurs consommations électriques
  2. un onduleur avec une connexion USB vers le syno (préférer les modèles où la batterie est remplaçable),
  3. une solution de sauvegarde externe,
  4. une configuration RAID (s'il y a un réel besoin pour une solution de disponibilité).

Les points 2 et 3 devraient être impératifs. Le point 4 est optionnel mais impactant pour le point 1 (choix de disques entreprises ou pour NAS).

---

Règle 13 : Après l'achat de disques, s'attendre à devoir en échanger certains avec le(s) fabricant(s) pendant leurs durées de garantie.

Il est courant qu'un disque ne fonctionne plus correctement (champ SMART 197 différent de 0 par exemple) ou tombe en panne (claquements, ne tourne plus...). Ne pas attendre pour l'échanger, appeler le fabricant en cas de doute ou envoyer une demande de support à Synology pour se le faire confirmer.

A savoir :

  1. Les disques échangés sont des disques réparés avec une étiquette collée dessus qui le précise.
  2. Il arrive parfois sur la fin de période de garantie - notamment pour des disques entreprises garantis 5 ans - que le fabricant propose en échange un disque plus récent de capacité égale ou supérieure, réparé voire neuf.

Si l'échange se fait avant l'envoi du disque défectueux, il est fortement recommandé de réutiliser l'emballage du fabricant - point important car il se garde le droit de refuser un disque si l'emballage n'est pas approprié (disque pas suffisamment protégé par exemple).

---

Règle 14 : Un disque est dès le départ défectueux, le faire échanger de suite chez le commerçant. Si le commerçant renvoie le client vers le fabricant, il faut refuser.

Car le fabricant l'échangera avec un disque réparé et non un disque neuf.

---

A vous de faire les bons choix ! ;)

Ces règles sont tirées d'expériences vécues.

Modifié par fdm900
Lien vers le commentaire
Partager sur d’autres sites

  • 2 semaines après...
  • 3 mois après...

bonjour, Certes ce sont de bons conseils et merci fdm900 de les avoir formulés...

Toutefois la lecture de ce topo est un peu glaçante,

en ce sens qu'on aimerait avoir quelques précisions et indications sur ce qu'il faudrait concrètement faire.

Par exemple Règle2 : quelle est la différence entre Synchroniqtion et Sauvegarde ? comment faire l'une ? comment faire l'autre ?

Comment lancer un test SMART de DSM et un autre pour surveiller la conformité du résultat du premier ?

Finalement, si le RAID n'est en rien rassurant, que faut-il au juste faire ?

Lien vers le commentaire
Partager sur d’autres sites

  • 2 mois après...

bonjour, Certes ce sont de bons conseils et merci fdm900 de les avoir formulés...

Toutefois la lecture de ce topo est un peu glaçante,

en ce sens qu'on aimerait avoir quelques précisions et indications sur ce qu'il faudrait concrètement faire.

Par exemple Règle2 : quelle est la différence entre Synchroniqtion et Sauvegarde ? comment faire l'une ? comment faire l'autre ?

Comment lancer un test SMART de DSM et un autre pour surveiller la conformité du résultat du premier ?

Finalement, si le RAID n'est en rien rassurant, que faut-il au juste faire ?

Bonjour,

Précisions rajoutées pour expliquer la différence majeure entre synchronisation et sauvegarde. Pour les effectuer, il y a différentes solutions et ce n'est pas l'objectif de ce tuto de les couvrir.

Se référer au manuel Synology sur le DSM pour lancer les tests SMART.

Pour le RAID, le mieux est de ne pas en faire s'il n'y a pas un réel besoin pour une solution de disponibilité. Et en plus, on perd de l'espace.

Merci pour le feedback.

Modifié par fdm900
Lien vers le commentaire
Partager sur d’autres sites

  • 3 semaines après...

Je rajouterai

à la règle 7 :

- tester son onduleur une fois par ans, et vérifier qu'il éteint bien le NAS au bout de xx minutes

Règle 14: tester ses sauvegardes et surtout ses restaurations régulièrement

Ce sujet devrait être "pinned" à ce topic afin qu'il soit lu par tout le monde ;)

Trés bien écris ! Bravo

Modifié par BigJim
Lien vers le commentaire
Partager sur d’autres sites

Hello,

Exacte, si tt le monde appliquait ces regles, on aurait 2 fois moins de sujets "pannes, plantage et recovery de data" dans le forum. A imprimer et mettre devant ses yeux en face de son bureau pour le relire/apprendre et les appliquer... surtout pour les novice qui commence avec des NAS.

Merci pour le résumé.

Lien vers le commentaire
Partager sur d’autres sites

  • 4 semaines après...

Bonjour,

en lisant ce super tuto, je me suis dit, aller, va voir les infos SMART de tes DD de ton nas.

Et voilà ce que j'ai en images ci-dessous.

Qu'en pensez vous ?

Car au niveau des valeurs des différents attributs, c'est pas forcément au mieux par rapport à ce qui est dit dans le tableau sur wikipedia...

(les données brutes ne me parlent pas du tout aussi ^^)

cTNO76.png

f0Jtzz.png

C'est assez étrange d'ailleurs, car les infos SMART des DD dans le NAS de mes parents semblent bien plus parlante... (ce sont des WD Green 1To).

Lien vers le commentaire
Partager sur d’autres sites

Les seagate n'utilisent/n'utilisaient pas les attributs SMART comme les autres fabricants de disque. C'est/C'était entre autre valable pour les Raw read error et seek error de mémoire.

http://forums.seagate.com/t5/Desktop-HDD-Desktop-SSHD/Seagate-s-Seek-Error-Rate-Raw-Read-Error-Rate-and-Hardware-ECC/td-p/122382

Lien vers le commentaire
Partager sur d’autres sites

  • 3 mois après...
  • 2 mois après...
  • 4 semaines après...

Rejoindre la conversation

Vous pouvez publier maintenant et vous inscrire plus tard. Si vous avez un compte, connectez-vous maintenant pour publier avec votre compte.

Invité
Répondre à ce sujet…

×   Collé en tant que texte enrichi.   Coller en tant que texte brut à la place

  Seulement 75 émoticônes maximum sont autorisées.

×   Votre lien a été automatiquement intégré.   Afficher plutôt comme un lien

×   Votre contenu précédent a été rétabli.   Vider l’éditeur

×   Vous ne pouvez pas directement coller des images. Envoyez-les depuis votre ordinateur ou insérez-les depuis une URL.

×
×
  • Créer...

Information importante

Nous avons placé des cookies sur votre appareil pour aider à améliorer ce site. Vous pouvez choisir d’ajuster vos paramètres de cookie, sinon nous supposerons que vous êtes d’accord pour continuer.