critical : souci sur pool

viph

Explorer
Joined
Apr 27, 2019
Messages
90
Bonjour à toues et tous,

mon Nas préféré m'alerte de la sorte :
Pool "treize-z3" state is DEGRADED: One or more devices are faulted in response to persistent errors. Sufficient replicas exist for the pool to continue functioning in a degraded state.
comment savoir de quel(s) disque(s) il s'agit ?

un message précédent me fait penser à da6...

scrennshoot du message :
1579961779782.png


Mais la vue de l'ensemble me semble beaucoup plus inquiétante :
1579962320886.png


pouriez vous m'aidez à l'interpréter ?
 

Pitfrr

Wizard
Joined
Feb 10, 2014
Messages
1,523
Bonjour,

Dans l'interface graphique, il doit y avoir la possibilité de voir le statut du volume et là devrait être indiqué l'état des disques.
Mais le plus facile c'est d'ouvrir un terminal et taper zpool status et de poster le résultat ici pour qu'on y voit plus clair.

Le disque /dev/da6 n'est pas automatiquement celui en cause. L'échec d'un self-test ne conduit pas obligatoirement à une dégradation du volume (cela dépend de la raison de l'éche) mais c'est une bonne piste pour y regarder de plus près. Là, et toujours dans un terminal, un smartclt -a /dev/da6 permettra d'afficher les données SMART du disque et de voir son état

Bon après, l'échec du self test date de début décembre et aurait déjà du éveiller des soupçons... :-O
Rien n'a été entrepris entre temps?
Peut-être en effet que /dev/da6 n'en pouvait plus et a eu une défaillance critique...


Un plus: il serait aussi bon d'avoir les détails matériels, comme indiqué dans les règles du forum, pour comprendre mieux le contexte.
 

viph

Explorer
Joined
Apr 27, 2019
Messages
90
Bonjour Pitfrr,

merci pour ton prompt retour.

au temps pour moi, je n'ai pas rappelé l'ensemble du contexte.
je me lance :)
Après des années de synology, j'étais à l'étroit et ai décidé de monté un freenas.
La carte mère asus B250 en µatx (1 pcie x16 et 2 x1) et un G4560 pour faire tourner l'ensemble (2C/4T)
32 Go de ram (non ecc) pour nourrir le tout.
J'ai tenté une seconde carte réseau mais j'ai des blocages en tout genre et je n'ai pas pris le temps de comprendre... et encore moins de résoudre !
à faire un jour puisque j'ai un switch qui permet du "teaming"
Le stockage est assuré par une carte dell H310 en mode IT sur laquelle sont connectés les dix disques : un patchwork de seagate et WD red (qui ont 7 ans).
Je ne considère toujours pas le setup comme étant "en production", voila pourquoi je n'ai pas bougé en décembre :) ... j'apprends !

Entre temps j'ai lancé un scrub manuel et, par magie, da6 est revenu !
le zpool status :
1579974378119.png
 

Pitfrr

Wizard
Joined
Feb 10, 2014
Messages
1,523
Merci pour le contexte.

Juste pour bien comprendre: tu parles d'un volume avec 10 disques mais la capture d'écran de zpool status ne montre que 8 disques (pour un volume en RAIDz3). :-O

Un des disques, l'avant dernier, a 4 dans la colonne des erreurs de lecture. Il s'agit peut-être du /dev/da6, à vérifier.
L'erreur (celle du 24 janvier 2020) vient probablement de là et il peut s'agir d'un problème de connexion/cablâge.
Une fois le scrub terminé, bien vérifier s'il a corrigé des erreurs ou pas (mais comme c'est qu'en lecture, je ne pense pas).

Dans tous les cas, il faut aussi adresser l'erreur plus ancienne du 8 décembre 2019 (problème de self-test sur /dev/da6). Elle est peut-être indépendante de la nouvelle ou peut-être pas... Car un self-test qui échoue n'a pas nécessairement d'impact immédiat mais peut amener d'autres problèmes plus graves à terme.
Et puis comme souvent un problème n'arrive jamais seul, je testerai les autres disques (tests SMART courts et longs pour tout le monde! Et vérification des rapports SMART), à moins que tu n'en sois sûr.

Si le système n'est pas en production alors pas de stress (d'un point de vue criticité des données), parfait! :)
C'est un bon exercice de maintenance!



Alors quelques remarques justement par rapport à la mise en production:
Tu parles de "teaming", je suppose que tu parles d'agrégation de liens? Sinon je vois pas trop... :-O
L'agrégation de liens est intéressante mais inutile à mettre en oeuvre pour une utilisation domestique. Alors je vais reformuler un peu: dans un environnement avec peu d'utilisateurs concurrentiels (comme un environnement domestique par exemple) cela n'apporte pas grand chose (au vu de la complexité de mise en oeuvre... je parle sans connaitre car je ne l'ai jamais mis en place justement... :smile: ). Après, ne serait-ce que pour la beauté technique de la chose par exemple, rien n'empêche de le faire, bien entendu.
Mais je conseillerai alors dans ce cas d'utiliser plutôt du matériel de type serveur que grand public (et je mets la carte Asus B250 dans cette dernière catégorie). Plusieurs raisons mais, par rapport à ce que tu dis: il y a souvent plusieurs cartes réseaux intégrées avec des chipsets plus performants (Intel vs Realtek comme pour la B250 par exemple). De plus, une interface réseau de gestion à distance est souvent disponible et cela peut s'avérer très pratique.
 

viph

Explorer
Joined
Apr 27, 2019
Messages
90
Merci pour ces infos circonstanciées.

oui, teaming = agrégation, je ne trouvais plus le bon mot. Pour l'instant seul un nas zyxel est configuré... seul, ça ne sert pas trop :smile:
J'ai plusieurs machines qui devraient le supporter et j'ai souvent des gros fichiers videos à bouger (et ça ne va pas s'arranger avec des films UHD @100mbps).
alors doubler les débits, cela m'intéresse et serait moins cher que de mettre du 10GE (en attendant sa démocratisation)

Je suis en déplacement aussi regarderai-je tout cela le week end prochain
 

Pitfrr

Wizard
Joined
Feb 10, 2014
Messages
1,523
alors doubler les débits, cela m'intéresse
Oui mais attention, les débits seront doublé que pour des accès concurrentiels, pas pour un seul utilisateur.

Faudra voir à l'usage si la différence se fait sentir (ça serait intéressant d'avoir ton retour d'expérience alors).
 
Top