Aller au contenu

Augmentation RAID 5 avec un disque défectueux....


Messages recommandés

Bonjour à tous,

Je possède un NAS Synology DS1813+ et jusqu'à il y a un peu j'avais un volume de 4 disques de 3To en raid 5.

Ce week end un des disques est tombé en panne et le volume est passé en mode dégradé.

Je suis allé acheter 2 disques supplémentaires. Dans un premier temps j'ai retiré le disque à problème et je l'ai remplacé par un des nouveaux disques.

La reconstruction s'est passée sans problème.

C'est là que ça se corse. Au lieu d'ajouter mon 2eme disque acheté et d'augmenter le volume, j'ai remis en plus de celui-ci le disque à problème et lancé l'augmentation de volume (je me suis dis que le NAS allait réparer les secteurs défectueux sur celui-ci... Je sais vraiment pas ce qui m'a pris...).

L'augmentation de volume a été lancée ce week end et a commencée à être très très lente à partir de 55%. Finalement ça s'est accéléré et ce matin c'était à 98,5%.

Au moment où je vous parle DSM n'est plus accessible (la page charge non stop). Je ne peux pas non plus afficher le contenu du NAS en local (pareil ça charge ça charge en continu mais rien ne s'affiche).

Je ne sais pas quoi faire... Je dois me faire à l'idée que mes données sont perdues? Que faire? Attendre? Retirer carrément le disque à problème et voir ce qui se passe? Le forcer à redemarrer en le débranchant?

Je suis un peu désemparé là et je me demande comment j'ai pu être aussi idiot en lançant une augmentation avec ce disque...

 

Si j'essaye de me connecter en ftp, je peux voir la liste des dossiers sur le NAS mais dés que j'essaye de rentrer dans un dossier j'ai le message suivant : 

Connexion interrompue après 20s d'inactivité 

Impossible de récupérer le contenu du dosser

Modifié par galfior
Lien vers le commentaire
Partager sur d’autres sites

Je pense qu'en retirant le disque défectueux, ça devrait aller. Le NAS devrait à nouveau indiquer un volume défectueux. Il faudra sans doute redémarrer le NAS. L'ennui, c'est qu'il est difficile de dire comment le NAS a interprété un disque qui a été ôté de la grappe, puis remis après une réparation, et surtout comment il a pu digérer un disque qui est défectueux. Il a très certainement tenté de formater puis de faire l'extension mais je ne peux l'affirmer. Attendre peut-être d'autres avis plus éclairés.

Quelle modèle de 3To ? Ce ne serait pas des WD Red ?

P.S. : il est de bon ton quand on arrive sur un forum de passer par la case présentation....

Lien vers le commentaire
Partager sur d’autres sites

J'aurais tendance à dire d'éteindre le NAS via un appui long sur le bouton M/A, puis de sortir le disque défectueux, mais comme il est en pleine augmentation de volume, je ne voudrais pas que ça pose un problème sur le volume lui-même.

Donc, le mieux serait dans un premier temps de sortir à chaud le disque défectueux. Il y a toujours le risque que ça se passe mal, mais comme le volume semble accessible via ftp (même s'il n'est pas possible d'ouvrir les fichiers), on peut raisonnablement penser que ça devrait aller.

Lien vers le commentaire
Partager sur d’autres sites

Bon j'ai finis par tout simplement retirer le disque et forcer le redemarrage du NAS.

Ca s'est bien passé, le NAS a retrouvé sa vitesse normal et j'ai pu accéder aux DSM et mes fichiers.

Le volume s'est bien entendu retrouvé en mode dégradé et je suis allé acheter un nouveau disque.

La réparation du volume va très vite, c'est déja à 40%.

Plus de peur que de mal :mrgreen:

 

 

 

Concernant le disque à problème je l'ai réinséré juste pour voir et il est en statut non initialisé, étrangement le nombre de secteur défectueux à diminué d'environ 800 à 400.

J'ai conscience qu'il ne faut pas que j'attende grand chose de ce disque mais est ce que je peux tout de même tenter de le refaire marcher correctement?

Genre un formatage bas niveau et ensuite je lui attribue un volume rien que pour lui en ne mettant dessus que des fichiers pas très importants?

Modifié par galfior
Lien vers le commentaire
Partager sur d’autres sites

Il y a 2 heures , Lucien77 a déclaré:

Je n'ai certainement pas ta connaissance du raid made by Synology.....

tu n'a tout simplement aucune connaissance en linux et en raid software linux mdadm qui n'est nullement "made in synology" mais 100% standard

c'est d'ailleur la meme chose pour un raid hardware ... --> commence par ceci, cela te fera le plus grand bien :https://fr.wikipedia.org/wiki/RAID_(informatique)

 

je retourne a mes priorités : mise à jours de mes packages vu la security update openssl

Modifié par gaetan.cambier
Lien vers le commentaire
Partager sur d’autres sites

Il y a 11 heures , galfior a déclaré:

Concernant le disque à problème je l'ai réinséré juste pour voir et il est en statut non initialisé, étrangement le nombre de secteur défectueux à diminué d'environ 800 à 400.

J'ai conscience qu'il ne faut pas que j'attende grand chose de ce disque mais est ce que je peux tout de même tenter de le refaire marcher correctement?

Genre un formatage bas niveau et ensuite je lui attribue un volume rien que pour lui en ne mettant dessus que des fichiers pas très importants?

Avec 800 ou 400 secteurs défectueux, je ne m'amuserais pas à remettre ce disque dans un NAS.

Vous pouvez si ça vous chante tenter un test approfondi avec le logiciel du constructeur, ou bien faire une écriture de zéro ou plus dur encore, un badblock, pour isoler les secteurs défectueux. Mais bon, généralement quand le processus de dégradation est lancé, c'est rapidement la dégringolade.

Lien vers le commentaire
Partager sur d’autres sites

Il y a 19 heures , Lucien77 a déclaré:

Oui, mais là, ce n'est pas une lecture, mais une écriture.

L'ordre de positionner la tête sur la bonne piste tombe dans le vide puisque pas de disque !

 

A+

C'est pas tout à fait comme ça que ça marche. En fait, lorsqu'on lance une augmentation de volume, c'est un processus qui déplace pratiquement toutes les données présentes sur un RAID sain pour les répartir sur l'ensemble des disques. Une fois lancé, il va jusqu'au bout. Si le nouveau disque est sain, il n'y aura pas d'erreur de parité et le RAID sera déclaré sain à la fin du processus. Si par contre, le disque est défectueux soit au début, soit en cours d'opération, tout ou partie des données ne seront pas écrites et des erreurs de parité seront détectées sur ce disque. Il sera déclaré HS en fin de processus et le RAID passera en mode dégradé. Il se peut donc que rien ne soit écrit sur le disque, ce n'est qu'à la fin qu'on le sait.

Dans le cas de galfior, il y a probablement eu des écritures, mais sur un disque avec des secteurs défectueux, elles ont probablement été difficiles voire impossibles. Dans votre cas, le disque est tombé en panne en cours de processus. Dans les deux cas, le résultat est le même, des blocs n'ont pas pu être écrit et pourtant le processus est allé à son terme et s'est soldé par un RAID dégradé.

Dans les fait, vous vous retrouvez avec le même nombre de disques qu'au départ (disons 3), mais votre RAID est dégradé parce que les données ont été déplacées et sont maintenant réparties pour un RAID à 4 disques.

Lien vers le commentaire
Partager sur d’autres sites

il y a 7 minutes, Lucien77 a déclaré:

Oui, autant je peux admettre que l'écriture se fasse sans contrôle, autant je reste perplexe lorsque l'écriture continue alors que le disque n'existe plus physiquement.

 

A+

Comme je l'ai dit, c'est un processus jusqueboutiste. Même si un disque est retiré, il continu malgré tout a redistribuer les blocs. Ceux qui ne sont pas copiés sur le disque absent seront notés avec erreur de parité. Il faut voir que le RAID continu de fonctionner pendant toute la construction. Les données sont toujours présentes tant qu'un autre disque ne tombe pas en panne. C'est le contrôle de parité qui fait que le RAID est sain ou dégradé. Dans tous les cas, il vaut mieux que le processus aille à son terme pour être sûr que le RAID soit en condition de pouvoir être réparé. Si le processus est stoppé en cours de route, les blocs seront répartis de manière anarchique (certains en mode RAID 4 disques et d'autres en RAID 3 disques). La reconstruction dans ce cas peut s'avérer complexe, voire impossible. J'espère pour galfior que son arrêt forcé n'a pas altéré une partie de ses données.

Lien vers le commentaire
Partager sur d’autres sites

il y a 2 minutes, Lucien77 a déclaré:

Nous sommes d'accord sur la méthode, sauf que ça dépasse mon entendement, j'ai été habitué autrement. Tout fout le camp ! :mrgreen:

Un mode bourrin surtout !

A+

Il ne faut pas confondre 2 choses : les données et le support. Si l'accès aux données est impossible, le disque va signaler au système que ce qu'il demande n'est pas disponible. Dans le cas d'un RAID, même si un disque est en panne, le système s'en fout tant qu'on lui donne ce qu'il demande. Si le support est en mode basique, les données perdues ne seront pas accessibles et le système sera alerté. Si c'est un RAID (hors RAID0 bien entendu qui est une ineptie), il faut la perte des blocs correspondants aux données recherchées pour que le système soit alerté.

Le RAID gère les parités. Il va répertorier et tenter de réparer les erreurs quand il les rencontre, et s'il ne peut pas les réparer et qu'il y en a beaucoup, il va placer la grappe en mode dégradé mais ne va pas arrêter son fonctionnement pour autant. Ce n'est pas parce qu'il y a perte d'un bloc du RAID qu'il y a perte de données pour l'utilisateur. Ainsi, même avec un disque en panne soit en cours de fonctionnement, soit en cours de construction, le RAID continue ses opérations en mode dégradé et hormis l'alerte du passage dans ce mode (il faut bien alerter l'administrateur), l'utilisateur n'y voit que du feu.

Donc oui, ce principe de fonctionnement peut paraître étrange, mais c'est aussi la base de la continuité de service.

Lien vers le commentaire
Partager sur d’autres sites

Rejoindre la conversation

Vous pouvez publier maintenant et vous inscrire plus tard. Si vous avez un compte, connectez-vous maintenant pour publier avec votre compte.

Invité
Répondre à ce sujet…

×   Collé en tant que texte enrichi.   Coller en tant que texte brut à la place

  Seulement 75 émoticônes maximum sont autorisées.

×   Votre lien a été automatiquement intégré.   Afficher plutôt comme un lien

×   Votre contenu précédent a été rétabli.   Vider l’éditeur

×   Vous ne pouvez pas directement coller des images. Envoyez-les depuis votre ordinateur ou insérez-les depuis une URL.

×
×
  • Créer...

Information importante

Nous avons placé des cookies sur votre appareil pour aider à améliorer ce site. Vous pouvez choisir d’ajuster vos paramètres de cookie, sinon nous supposerons que vous êtes d’accord pour continuer.