Aller au contenu

Hdd En Panne Suite Maj Dsm 4.3-3776


Messages recommandés

Bonjour,

Hier matin, j'ai lancé le téléchargement et l'installation automatique de la mise à jour 4.3-3776 de DSM sur mon DS411. Dès le début du téléchargement, paf le disque 3 (Un WD20EARS) tombe en panne et donc mon beau RAID10 tout dégradé, etc.

Après le redémarrage du NAS, et donc la mise à jour de faite, ce même disque était marqué "Non initialisé". Je me suis dit, mon Syno a fumé la moquette et j'ai donc tenté de réparer mon RAID10... sans succès car après 20 minutes, re-paf disque 3 (Toujours le même WD20EARS) à nouveaux marqué en panne mais cette fois avec un message rouge lors de la reconstruction du raid : échec de la partition système et donc mon beau RAID10 re-tout dégradé, etc.

Hier soir, j'ai ressorti un vieux WD20EADS, et réparé mon RAID10... avec succès cette fois !

Question 1 : Tout porte à croire qu'il s'agit là d'une erreur matérielle (WD20EARS qui déconne) et non du Synology et/ou du DSM 4.3-3776 ?

Cependant, j'ai installé ce WD20EARS dans mon PC sous Windows 7, je l'ai formaté (Rapidement) et copié des fichiers dessus sans problèmes. Du coup aujourd'hui, je lui ai mis (Toujours au WD20EARS) un bon coup de Low Level Format avec HDD Low Level Format 4.25 et voici le résultat :

********Info SMART avant le LLF :********

Current date and time: 02/09/2013 08:26:48

HDD Low Level Format Tool 4.25; http://hddguru.com
SMART data for [2] WDC WD20EARS-00S8B1 80.00A80 [2000,39 GB]
Attribute Current Worst Raw Note
----------------------------------------------------------------------------------------
1 01 Read error rate 200 200 0
3 03 Spin up time 145 145 9708
4 04 Number of spin-up times 98 98 2324
5 05 Reallocated sectors count 200 200 0
7 07 Seek error rate 200 200 0
9 09 Power-on time 87 87 10019
10 0A Spin-up retries 100 100 0
11 0B Calibration retries 100 100 0
12 0C Power Cycles 99 99 1946
192 C0 Power-off retract count 200 200 343
193 C1 Load/unload cycle count 186 186 44972
194 C2 HDA Temperature 121 103 31 (31 degrees)
196 C4 Reallocate event count 200 200 0
197 C5 Current pending sectors 196 196 1464
198 C6 Offline scan UNC sectors 200 200 1
199 C7 Ultra ATA CRC Error Rate 200 200 0
200 C8 Write error rate at preamp 200 200 19
********Info SMART après le LLF :********
Current date and time: 02/09/2013 15:31:07
HDD Low Level Format Tool 4.25; http://hddguru.com
SMART data for [2] WDC WD20EARS-00S8B1 80.00A80 [2000,39 GB]
Attribute Current Worst Raw Note
----------------------------------------------------------------------------------------
1 01 Read error rate 200 200 0
3 03 Spin up time 145 145 9708
4 04 Number of spin-up times 98 98 2324
5 05 Reallocated sectors count 44 44 1243
7 07 Seek error rate 200 200 0
9 09 Power-on time 87 87 10026
10 0A Spin-up retries 100 100 0
11 0B Calibration retries 100 100 0
12 0C Power Cycles 99 99 1946
192 C0 Power-off retract count 200 200 343
193 C1 Load/unload cycle count 186 186 44972
194 C2 HDA Temperature 110 103 42 (42 degrees)
196 C4 Reallocate event count 1 1 684
197 C5 Current pending sectors 200 196 23
198 C6 Offline scan UNC sectors 200 200 1
199 C7 Ultra ATA CRC Error Rate 200 200 0
200 C8 Write error rate at preamp 200 200 19
Question 2 : Je sais qu'un LLF peut "réparer" enfin ré-allouer les secteurs défectueux (Problème d'origine de mon WD20EARS, j'en suis quasi-sûr) mais d'après vous, puis-je le réutiliser dans mon DS411 sans avoir d'erreurs lors de la reconstruction du RAID10 ?
En tout cas, merci d'avance (Surtout à celles et ceux qui auront tout lu) :-)
Kinopanoramak
Lien vers le commentaire
Partager sur d’autres sites

Ca ressemble fichtrement à des secteurs défectueux non marqués.

Poubelle peut être pas mais comme disque de stockage USB c'est peut-être jouable. Je erais la totale, partitionnement neuf et formatage complet.

Ce genre de problème est la grande faiblesse des systèmes RAID, c'est pour cela qu'il faut absolument faire des sauvegardes externes régulières avec des RAID.

C'est aussi la raison pour laquelle je préconise (et ne suis pas le seul) de ne se servir des RAID qu'n cas de vraie nécessité c'est à dire pour assurer la continuité des fonctionnement d'un serveur de données lors d'arrêt d'un disque afin de ne pas pénaliser les utilisateurs. Dans un pool de bureaux par exemple. Sinon se passer du RAID apporte une tranquillité appréciable.

Et puis et surtout j'espère que tu avais bien fait une vraie sauvegarde de sécurité avant de lancer une mise à jour. Ce genre de grosse opération n'est pas sans risques.

Lien vers le commentaire
Partager sur d’autres sites

Bonjour,

Merci pour les réponses. Je n'ai jamais fait de sauvegarde avant une mise à jour de mes Syno. C'est pour ça que je fais du RAID1 histoire d'avoir une tolérance de panne d'au moins un disque et depuis 2009, c'est la première fois qu'un tel problème survient. Alors oui, mes disques datent (Pour le DS411) de 2009 et oui je sais une telle panne est logique au bout d'un moment mais là, un autre problème vient de pointer le bout de son nez. Je m'explique :

Comme je l'ai écrit plus haut, j'ai ressorti avant hier soir un vieux WD20EADS et réparé mon RAID10 avec succès. Puis mon WD20EARS qui déconne a été formaté en bas niveau sous mon Windows 7. Ce matin, j'ai donc retiré le WD20EADS de mon DS411 pour y remettre le WD20EARS qui déconne fraîchement formaté en bas niveau la veille et j'ai réparé mon RAID10 car un WD20EARS est meilleur qu'un WD20EADS et beaucoup de HDD tournent correctement avec des secteurs défectueux re-mappés. Au bout de 2H, HDD à nouveau en panne et là je me résigne, ce disque est bien HS et donc poubelle (Enfin de la grosse dépanne pour du backup non important).

En rentrant ce midi, j'ai remis le WD20EADS et le Syno me l'a marqué comme "non initialisé" (Bizarre car hier soir le RAID10 avait été reconstruit sans problèmes). J'ai donc pour la énième fois lancé la réparation de mon RAID10 mais ce coup-ci, j'ai un message d'erreur direct dès le début de la reconstruction : Echec de partition système (http://img802.imageshack.us/img802/7334/cmxh.jpg).

Question : Bon pour le moment, à part ce message, la reconstruction a l'air de bien se passer mais est-ce normal ce type d'alerte ?

Au passage, je suis gestionnaire de sauvegardes dans mon EPCI et là rien à voir avec du RAID1 et des Syno. Nous avons des salles répliquées, des robots LTO, des HDD en pagaille, etc. Mais je me posais la question : pour un particulier le mieux, pour sauvegarder plus de 4TO de données (J'ai 2 Syno) c'est un bon cloud mais là vive ma fibre pro à 50 méga ou alors la réplication sur un troisième Syno, juste pour du backup ? Je suis partagé car le tout est question de temps, d'argent, de confiance dans le système de sauvegarde, etc. Vous utilisez quoi comme solution de votre côté ?

Précision 1 : Quand je dis un vieux WD20EADS, en fait il est vieux au niveau date de fabrication du produit mais en réalité, il est neuf car je le gardais précieusement pour ce type de problème sur mes Syno.

Précision 2 : Un gestionnaire de sauvegardes qui ne sauvegarde pas ses données avant une mise à jour, c'est un tocard ! Oui... et non car je n'ai pas la même façon de traiter les données. A la maison c'est du perso donc importance moyenne, voir faible. Par contre au boulot, c'est une autre histoire. Tout est question de l'importance accordées aux datas.

Une fois encore merci des réponses, avis, commentaires et encore plus merci si vous avez tout lu :-)

Kinopanoramak

Lien vers le commentaire
Partager sur d’autres sites

Jamais fait de sauvegarde avant une mise à jour... On a le droit d'aimer les risques. On peut aussi faire d trapèze en haute voltige sans filet... Tant qu'on ne tombe pas, tout va bien.

Avec un syno si ta mise à jour plante (ca arrive voir le forum) il arrive qu'on ne puisse pas le remettre en marche et dans ce cas les données sont extrêmement difficiles (voire impossible) à récupérer RAID ou pas. Alors qu'avec une simple petite sauvegarde sur un bête disque USB, deux clics et ca repart...

On ne le redira jamais assez : un RAID ne doit jamais être considéré comme une sauvegarde, c'est même la meilleure façon de perdre ses données.

Sur le sNAS de particulier les systèmes RAID sont assurés par des logiciels et les plantages de logiciels sont infiniment plus nombreux que les très rares casses de disque.

Par exemple une tout bête petite panne de courant fait planter le logiciel RAID qui va inscrire des bugs dans le miroring. Au redémarrage le RAID va tenter de recréer le miroring mais en tenant compte des petits bugs... Il y a des cas assez fréquents (lire le forum) ou ces petits bugs détruisent peu à peu les données. Plus ou moins totalement, plus ou moins irrémédiablement.

En RAID de n'importe quel type toujours assurer une vraie sauvegarde déportée sur une autre machine et autre disque.

Lien vers le commentaire
Partager sur d’autres sites

Salut,

attention a ton Load_cycle_count, tu n'as pas du désactiver l'économiseur d'énergie de ton WDEARS, en effet, celui ci dégrade prématurément ton disque.

Dans mon cas en exemple, pour 6700 heures d'utilisations, je n'ai que 15 "Load_cycle_count". Tu dois utiliser wdidle3 (sur le site de WD) et désactiver ca en commande dos sur un pc.

Lien vers le commentaire
Partager sur d’autres sites

Dans mon cas en exemple, pour 6700 heures d'utilisations, je n'ai que 15 "Load_cycle_count". Tu dois utiliser wdidle3 (sur le site de WD) et désactiver ca en commande dos sur un pc.

Non, pas besoin de çà

Les syno ont un script au démarrage pour les disque WD, et lance le wdidle3 à chaque démarrage (Et ce depuis au moins DSM 3.1)

Son load cycle count est surement du au fait qu'il a activé l'hibernation des disques

Lien vers le commentaire
Partager sur d’autres sites

Rejoindre la conversation

Vous pouvez publier maintenant et vous inscrire plus tard. Si vous avez un compte, connectez-vous maintenant pour publier avec votre compte.

Invité
Répondre à ce sujet…

×   Collé en tant que texte enrichi.   Coller en tant que texte brut à la place

  Seulement 75 émoticônes maximum sont autorisées.

×   Votre lien a été automatiquement intégré.   Afficher plutôt comme un lien

×   Votre contenu précédent a été rétabli.   Vider l’éditeur

×   Vous ne pouvez pas directement coller des images. Envoyez-les depuis votre ordinateur ou insérez-les depuis une URL.

×
×
  • Créer...

Information importante

Nous avons placé des cookies sur votre appareil pour aider à améliorer ce site. Vous pouvez choisir d’ajuster vos paramètres de cookie, sinon nous supposerons que vous êtes d’accord pour continuer.