Aller au contenu

Messages recommandés

Bonjour,

Malgré quelques recherches sur le net, je n'ai rien trouvé en ce qui concerne mon histoire.

Pour faire simple je vais raconter ce qui s'est passé chronologiquement :

- Il y a 4 ans environ : acquisition d'un DS411j avec 4x WD Blue de 1,5 To chacun. Le tout monté en SHR.

- A part l'un des disque qui grille au bout de 3 mois et remplacé par la garantie constructeur de WD, tout s'est extremement bien déroulé ces dernières années.

- A plusieurs reprises, le NAS a été mis hors courrant (pas d'onduleur) parfois proprement (arrêt depuis le DSM) mais également parfois de manière pas cool (coupure de courrant ou arrêt forcé par pression prolongé du bouton marche/arrêt). A chaque fois, le NAS a redémarré sans le moindre problème.

- En août dernier, le NAS subit un arrêt "pas cool".

- Au redémarrage, il lance une vérification de la cohérence du volume. Dans le DSM (4.3) je constate que 3 disques sur les 4 ne sont plus reconnus. - Gros stress -.

- Après une nuit de vérification, le contrôle de parité du volume se termine bien : les 4 disques sont ok et aucune donnée n'a été perdu - ouf.

- Là, je me dit, plus jamais d'arrêt en mode "pas cool".

- Mi septembre, le NAS doit être déplacé, arrêt propre avec DSM.

- Au redémarrage, idem : contrôle de la cohérence du volume à la différence près que cette fois-ci le DSM est innaccessible.

- Après quelques heures, tout est à nouveau normal.

- Là je commence à me dire que mon NAS a un problème.

- Et pourtant. Ce matin, je viens de constater chez un proche que son DS210j qui a presque le même âge et 2x WD Blue de 500Go a fait exactement le même gag début août.

Je n'ôse plus toucher ni à l'un ni à l'autre ; et surtout pas les arrêter.

Quelqu'un aurait une suggestion ? Y a-t-il un risque de perte des données ? Est-ce le matériel qui vieilli - 4 ans cela ne me parait pas si vieux pourtant - ? Y a-t-il seulement quelque chose à faire ?

Merci pour vos lumières.

Lien vers le commentaire
Partager sur d’autres sites

Sous quel DSM tournes-tu ?

Les infos SMART des disques n'indiquent aucun block réalloué ?

4 ans ce n'est pas tres vieux pour un NAS, mais pour les disque ca commence à faire long.

Si ce n'est pas encore le cas alors mets en place une sauvegarde régulière des données importantes sur support externe

Lien vers le commentaire
Partager sur d’autres sites

Tests SMART lancé sur les deux NAS.

Je reviens dans quelques heures donner les résultats.

DS411j > de mémoire DSM 4.3, la maj automatique semble ne pas aller plus loin. Il faut que je fasse la Mise à jour manuellement mais au vu des problèmes j'ai préféré parler du problème avant de faire des bêtises.

DS210j > DSM 3.0, le propriétaire du NAS ne savait même pas qu'il existait une mise à jour du DSM. :rolleyes:

Idem, si vous pensez qu'une mise à jours vers DSM 5 ne présente pas de risque, je la ferais.

Lien vers le commentaire
Partager sur d’autres sites

Tout comme Fravadonna et avant de tripatouiller je ferais une sauvegarde de chaque syno, au moins des données ayants une certaine importance et/ou personnelles et uniques irrécupérables ailleurs.

Ces deus synos étaient-ils accessibles par internet ? Parce qu'un même problème au même moment pourrait aussi être lié à une attaque externe d'autant qu'il y en a une vers cette époque si je me souviens bien, dont on a beaucoup parlé ici.

Lien vers le commentaire
Partager sur d’autres sites

C'est synolocker.

Mais je ne pense pas que ce soit le cas.

C'est à mon avis un des trop nombreux cas de nas qui tournent sans onduleur avec des configs raid ou shr. Ca marche quelques temps, jusqu'au jour où ....

Encore une chance que les contrôles de parités aient réussi à corriger les erreurs car pour d'autres ça se passe beaucoup moins bien.

Et aussi, comme le dit Fravadonna, 4 ans pour des disques ça commence a faire quelques heures de vol.

Commencer à envisager un changement de disques et intaller un onduleur pour protéger le raid ne serait pas un luxe.

Lien vers le commentaire
Partager sur d’autres sites

Je donnais cette idée car dans ce genre de cas il faut essayer de voir toutes les solutions possibles.

Mais moi aussi je pense très probable que ce ne soit lié qu'à un problème de coupure de courant. On ne le répètera jamais assez mais ces systèmes RAID ou SHR étant purement logiciel ils sont très sensibles comme tout système logiciel aux pannes de courant. Les dégâts sont imprévisibles, Il peut très bien ne rien se passer, ou un petit souci insignifiant vite résolu et qu'on oublie, ou encore un dégâts énorme.

D'où la très "forte recommandation" de tous ici de mettre un onduleur surtout en cas de fonctionnement sous SHR ou RAID. D'où aussi la non moins forte recommandation de mettre en place un sérieux système de sauvegarde.

A noter enfin que l'arrête du syno par appui long du bouton M/A du syno est équivalent à l'arrêt fait dans le DSM et est donc un "arrêt propre".

Lien vers le commentaire
Partager sur d’autres sites

Merci pour toutes vos réponses.

Pour répondre dans l'ordre :

- Réalocation de blocs dans les Infos SMART (stats identiques sur les deux NAS) :

Reallocated_Sectors_ct : 0 / Status ok

Reallocated_Event_count: 0 / Status ok

- Les deux NAS ne sont normalement pas accessible par internet (en tout cas, tous les services réseau sont désactivés). Ils sont tous les deux utilisés comme disque de back-up dans des réseaux privés. Je dit normalement car ces NAS restent chacuns connectés à une Box classique.

Leur seul point commun est que les abonnements internet sont sur le même DSLAM (mais chez deux FAI différents). De fait, une attaque extérieure me parait peut probable.

Par contre, comme ils ne sont utilisés que pour du backup une fois par 24h, cela implique une mise en veille au moins 20h par jour. Je viens de lire sur le forum que ce n'était pas vraiement une bonne chose d'utiliser la mise en veille automatique. Vous confirmez ?

Ca combiné à l'absence d'onduleur et le grand âge des disques, me fait penser qu'il est vraiment temps d'investir.

Ce qui m'a perturbé c'est que le controle de cohérence soit nécessaire même en cas d'arrêt propre avec le DSM.

Dans tous les cas, merci pour votre aide.


EDIT : J'oubliais.

Y a-t-il une pile dans ce type de NAS ?

S'il oui, au bout de tout ce temps, elle est probablement morte.

Ce problème pourrait il être du à un problème d'horrodatage et donc pourrait être résolu en changemant la pile ?

Modifié par Curistel
Lien vers le commentaire
Partager sur d’autres sites

Pas vraiment du même avis que Mic...

Il y a bien effectivement une pile CR2032 à l'intérieur du Nas sur la carte-mère. Cà on est d'accord.

MAIS c'est justement au bout de 4/5 ans qu'elles posent des problèmes exactement comme sur les PC.

On ne s'en aperçoit pas toujours tout de suite car tant que le secteur est présent, appareil bien branché sur une prise et même si cet appareil est "éteint" un léger courant prélevé au secteur maintiendra alimenté le circuit de la mémoire, la pile CR2032 ne venant en relais que lors de la disparition du secteur (débranchement, panne EDF...). De ce fait on peut tout à fait ne s'en apercevoir que bien plus longtemps après la fin de vie naturelle de la pile.

Une astuce : sur ton syno règle bien l'heure et désactive la mise à l'heure automatique par serveur internet. Vérifie un moment après qu'elle est toujours bonne.

Ensuite éteint le syno et débranche le complètement. Attends une heure ou deux. Rebranche le et rement le en marche. Vérifie l'heure, si il est resté à l'heure la pile est bonne, sinon...

Lien vers le commentaire
Partager sur d’autres sites

Vu ce que ça coûte et étant donné que j'en ais une en stock, je vais pas faire la fine bouche.

Aller hop, on change.

Sinon, quid de la mise en veille.

Faut il vraiment éviter de l'utiliser ?

A l'origine, je l'avais activée pour les économies d'énergie (protéger la planète tout ça tout ça).

Mais si c'est pour augmenter les risque de pannes, je préfère m'en passer.

Lien vers le commentaire
Partager sur d’autres sites

Le problème de la veille, c'est que les disques d'un même volume RAID peuvent ne pas sortir de veille en même temps, ce qui provoque une exclusion d'un ou plusieurs disques et donc la dégradation du volume.

C'est pourquoi il est également recommandé d'utiliser des disques prévus pour le RAID.

Lien vers le commentaire
Partager sur d’autres sites

A propos de pile :

OK pour des piles "noname". Mais en général ça tient bien plus que 4/5 ans.

Mon 710 a toujours sa pile d'origine, et pourtant je l'arrête et le déconnecte souvent. le PC de ma femme qui a au moins 10 ans n'a pas de problème de piles.

Il a dû m'arriver de changer une pile une fois dans toute une vie (je ne suis plus jeune depuis bien longtemps). Et encore, le PC était tellement obsolète que j'ai préféré le jeter : la pile coutait plus cher !

Comme tu le dis, la pile n'est là qu'en dernier recours quand il n'y a plus d'alimentation. Ce sont des batteries Lithium dont le taux de décharge naturelle est quasiment nulle ce qui leur permet d'être conservées pendant plusieurs années, bien au delà de la date inscrite sur le package.

Donc, oui, il peut y avoir des cas assez rares où les batteries sont à changer prématurément, et ce sont probablement des noname, mais dans l'ensemble ça tient bien au delà des 4/5 ans.

Lien vers le commentaire
Partager sur d’autres sites

Pourtant j'ai eu tout un ensemble d'ordinateurs (12 au total) repartis dans des boutiques comme caisses enregistreuses qui ont tous eu des bizarreries surtout dans les datages des tickets de vente après 5 à 8 ans de service. Après avoir changé le sCR2032 tout est rentré dans l'ordre.

Quant aux considérations "pour la planète" et autres fadaises il faut être vraiment objectif et surtout impartial. En quoi d'arrêter un appareil de temps à autres pour "économiser" quelques kWh par an apporte un "mieux" pour la planète alors que cela engendre 9999 fois sur 10000 une altération d'un composant, des dysfonctionnements, voire des pertes d'efficacité qui engendreront des dégâts pour la nature bien plus importants ? Bien ce dire que le remplacement prématuré d'un disque dur coûtera bien plus de pollutions de toutes natures que les rares kWh qu'il aura (peut-être) réussi à économiser et qui en plus et en France au moins ne polluent pratiquement pas ?

Lien vers le commentaire
Partager sur d’autres sites

Ce que je ne comprends pas c'est pourquoi le Syno fait une vérification automatique de parité, ce n'est pas son comportement "habituel".

Dans la plupart des arrêts brutaux que j'ai pu lire ici, certains disques étaient simplement éjectés du RAID puis le Syno marquait le Volume "en panne" ou "dégradé" malgré que les disques soient "sains".

Peut-être est-ce le RAID1 de la partition système qui pose problème : Quelle est la taille de ton volume et combien de temps ont duré dure ses verifications automatiques ?

Modifié par Fravadona
Lien vers le commentaire
Partager sur d’autres sites

@Piwi

Ok, je comprends mieux la problématique.

Ca pourrait expliquer pourquoi je n'avais qu'un disque sur les 4 de détecté.

Sauf... que ce n'était pas une sortie de veille mais un redémarrage du NAS après une coupure.

Jusqu'à maintenant je n'ai jamais eut de problème en sortie de veille (/me touche du bois).

Si seulement les WD Red avaient existé à l'époque.

...

mais bon, à voir les déboires de je me dit que ce n'est pas si mal d'avoir attendu l'écrémage des premières séries.

Perso, le matériel, c'est comme pour les OS Microsoft : j'attends toujours un an avant d'investir. Par précaution.

Lien vers le commentaire
Partager sur d’autres sites

Peut-être que je vais dire une bêtise mais tant pis je me lâche.

Si vraiment les données sont là et que les disques sont sains (vérification smart ok), je tenterais un retrait de disque (un seul à la fois bien entendu), formatage complet sur un PC à l'aide du logiciel constructeur (Seagate, WD, autre) pour effacer les partitions et les données et reconstruction du shr dans le NAS.

Faire ça pour chaque disque. Ca pourrait peut-être résoudre le problème.

Lien vers le commentaire
Partager sur d’autres sites

Ce que je ne comprends pas c'est pourquoi le Syno fait une vérification automatique de parité, ce n'est pas son comportement "habituel".

Dans la plupart des arrêts brutaux que j'ai pu lire ici, certains disques étaient simplement éjectés du RAID puis le Syno marquait le Volume "en panne" ou "dégradé" malgré que les disques soient "sains".

Peut-être est-ce le RAID1 de la partition système qui pose problème : Quelle est la taille de ton volume et combien de temps ont duré dure ses verifications automatiques ?

Pour répondre a ta question, j'ai regardé un peut plus en avant les logs.

Et il semblerait que les deux NAS n'aient pas les mêmes soucis :

Pour le DS210j (DSM 3.0), le volume fait 454 Go (2 disques de 465,76 Go ; 500 GB constructeur) dont 62% sont utilisés. type SHR

Le test SMART d'aujourd'hui a duré 1h20.

Je n'ai pas constaté de visu mais le journal indique :

- 14h55 20s log "arrêté annormalement",

- 14h55 40s log "verif de coérence du volume system (Root)"

- 15h29 52s log "controle de parité du volume %volume%" (NB : normalement son nom est Volume 1)

__________________________________________________________________

Pour le DS411j (DSM 4.3), le volume fait 4,02To (4 disque de 1397,27 Go ; 1,5 TB constructeur) dont 51% sont utilisés. type SHR

Le test SMART d'aujourd'hui a duré un peut plus de 5 heures.

sur le journal c'est un peut plus complexe :

- entre le 26/07/2013 le 09/02/2014 : 5 alertes "improper shutdown"

Puis plus rien jusqu'en septembre. Période durant lequel le NAS tourne parfaitement.

Premier problème : suite à un arrêt forcé (appuye sur le bouton marche arrêt jusqu'à l'arrêt du NAS).

- aucun log avant cela, particulièrement pas de log "improper shutdown" vers 21h30 lors de l'arrêt forcé.

- 06/09/2014 21h40:44s : Volume 1 has crashed

- 06/09/2014 21h45:40s : Volume 1 has crashed

Ca c'est moi qui tente de relancer les 3 disques non reconnus manuellement. Normal

- 06/09/2014 21h58:09 : Notification de l'assemblage RAID / The Raid of volume 1 has been reassembled

- 06/09/2014 21h58:10 : Notification de l'assemblage RAID / The Raid of volume 1 has been reassembled (oui, deux fois)

La je me suis décidé à l'autorisé à lancer le réassemblage demandé.

- 06/09/2014 22h00:08 : Consistency check of system volume (Swap) is complete

- 06/09/2014 22h11:19 : Consistency check of system volume (Root) is complete

Second problème : suite à un arrêt propre via le DSM et une coupure d'électricité au compteur pendant 3 semaines (vacances)

- 10/10/2014 20h33:14 : Consistency check of system volume (Swap) is complete

Et rien d'autre

Bref, un seul a fait un contrôle de parité mais l'autre a du réassembler le RAID.

Notez bien que dans les deux cas, il n'y a aucun problème en sortie de veille. Il n'y a qu'au redémarrage que ça coince.

Modifié par Curistel
Lien vers le commentaire
Partager sur d’autres sites

La verification de parité pour dernier arrêt propre est surprenant car il voudrait dire que la swap était utilisée jusqu'a la mise hors tension du NAS, hors :

1) La swap n'est de préférence jamais être utilisée par le système, et Linux fait tout ce qu'il peut pour cela; donc a priori le système avait un gros besoin de RAM. Que fais-tu tourner sur le NAS ?? Combien de RAM as-tu ?

2) Un arrêt propre via DSM devrait démonter la swap avant de mettre hors tension le NAS; la tu as peut-être affaire a un bug de DSM. Dans tous les cas, si la swap est utilisée c'est que tu fais tourner trop d'applications sur ton NAS.

Lien vers le commentaire
Partager sur d’autres sites

Je crois que Fravadona a mis le doigt sur quelque chose pour le DS411j.

Le DS210j est au repos total : RAM, Proc et réseau aux allentours de 0 dans le moniteur de ressources. Il n'est donc pas concerné.

Par contre, sur le DS411j, ce n'est pas du tout pareil :

Ce NAS n'est utilisé que comme lecteur de grande capacité via.

Il y a un répertoire partagé sur le volume 1. AU démarrage de win 7, j'utilise un script pour monter un lecteur réseau (N:). *

Aucun autre service n'est utilisé, pas de disque USB ni d'imprimante connecté au NAS.

Aucune application supplémentaire téléchargée ni installée.

Temps d'activité du NAS : 4j 19h.

Le moniteur de ressourse affiche :

Au repos (juste après le démarrage du PC) :

- RAM : utilisée à 60% en permanence,

- Processeur : entre 0 et 7% avec quelqeus pics à 30% (disons 1 ou 2 par 5 minutes)

- Trafic réseau : toutes les 5 à 20 secondes environ, il y a un pic à 1 KB/s en upload

Video mp4 lancée en lecture depuis un lecteur sur le PC

- RAM : idem 60%

- Processeur : entre 3% et 10% avec quelqeus pics à 30% (disons 1 ou 2 par 5 minutes)

- Trafic réseau : 40 à 120 kB /s

Copie d'un gros fichier du PC vers le NAS

- RAM : 61%

- Processeur : entre 25% et 60%

- Trafic réseau : 8000 à 12000 kB/s en download

Copie du même gros fichier du NAS vers le PC

- RAM : 61%

- Processeur : entre 19% et 35%

- Trafic réseau : 10000 à 15000 kB/s en upload

Après toutes ces manips, on retombe aux premiers chiffres au repos :

- RAM : utilisée à 60% en permanence, (je précise : 60 et non 61% comme lors des copies)

- Processeur : entre 0 et 10% avec quelqeus pics à 25-30% (disons 1 ou 2 par 5 minutes)

- Trafic réseau : toutes les 5 à 20 secondes environ, il y a un pic à 1 KB/s en upload

_____________________________

* En écrivant ce message je viens de penser à un détail qui pourrait expliquer cette surcharge en RAM :

Il y a quelques années, j'ai utilisé une astuce pour référencer ce lecteur N: dans la bibliothèque. Le but de la manip était de permettre à l'outil de recherche Windows de trouver les fichiers copié sur le NAS. Chose qu'il est normalement incapable de faire sur un lecteur réseau. Si je me souviens bien, l'astuces consistait en créer un raccourcis partagé vers un disque physique normal (C: par exemple) puis de l'éditer pour le faire pointer vers N:. Si je retrouve la procédure je vous collerais un lien.

Dans l'attente de vos avis, je vais tenter de faire sauter ce lien car je ne serais pas étonné que c'est la banque de l'outil de recherche windows qui provoque cette surcharge de la RAM du NAS.

Modifié par Curistel
Lien vers le commentaire
Partager sur d’autres sites

Malheureusement 60% d'utilisation de RAM n'est pas une surcharge, il fait dépasser les 100% pour utiliser la swap (mais a priori cela avait été le cas avant le dernier reboot).

Je pense que si tu éteins, débranches, attends, rebranches et rallumes le NAS tu n'auras aucun soucis

Lien vers le commentaire
Partager sur d’autres sites

Voici la suite (et la fin du problème).

Arrêt du lien entra la bibliothèque windows et le NAS via un lecteur réseau : aucun changement sur la charge en RAM.

Mise à jours vers DSM 5.0 4493 : la charge en RAM est passé à 63% stable.

Dans la foulée, maj vers DSM 5.0 4493 update 5 : le NAS a fait un redémarrage automatique qui s'est déroulé sans problème.

A ce moment là, j'ai lu le dernier message de Fravadona.

Encourragé par le reboot sans problème suite à la maj, j'ai éteint le NAS et débranché son aliment pendant 3/4 d'heure.

Je viens de le rebrancher : démarrage sans le moindre problème.

La RAM reste stable à 63% utilisée. Pas d'inquiétude d'après les dires de Fravadona.

Nouveau reboot histoire d'être sûr : idem, pas le moindre problème.

Je referais un ou deux reboot dans la soirée et demain mais à priori, c'est gagné.

Bref, je ne sais pas trop ce qui a résolu le problème mais le NAS semble fonctionner parfaitement.

A tel point que je commence à me demander si ce n'était pas juste un problème ponctuel et que le fait d'avoir deux NAS aparement "problématiques" dont un qui m'a fait deux plantages de suite n'était pas qu'un simple hasard.

Dans tous les cas, merci à tous pour votre aide et vos suggestions.

Lien vers le commentaire
Partager sur d’autres sites

Rejoindre la conversation

Vous pouvez publier maintenant et vous inscrire plus tard. Si vous avez un compte, connectez-vous maintenant pour publier avec votre compte.

Invité
Répondre à ce sujet…

×   Collé en tant que texte enrichi.   Coller en tant que texte brut à la place

  Seulement 75 émoticônes maximum sont autorisées.

×   Votre lien a été automatiquement intégré.   Afficher plutôt comme un lien

×   Votre contenu précédent a été rétabli.   Vider l’éditeur

×   Vous ne pouvez pas directement coller des images. Envoyez-les depuis votre ordinateur ou insérez-les depuis une URL.

×
×
  • Créer...

Information importante

Nous avons placé des cookies sur votre appareil pour aider à améliorer ce site. Vous pouvez choisir d’ajuster vos paramètres de cookie, sinon nous supposerons que vous êtes d’accord pour continuer.