remplacement de 2 disques

viph

Explorer
Joined
Apr 27, 2019
Messages
90
Bonjour à vous,

Je réalise avec horreur que, sur un Z3, j'ai 2 disques en faute.
Est-il préférable de les remplacer en même temps ou l'un après l'autre ?

erreur de secteurs, déconnexions intempestives...

Device: /dev/da4 [SAT], 24 Offline uncorrectable sectors
Wed, 18 Mar 2020 09:35:24 GMT
Device: /dev/da6 [SAT], 5 Currently unreadable (pending) sectors
Wed, 18 Mar 2020 09:35:24 GMT
Update Train EOL Reached
Wed, 18 Mar 2020 09:35:24 GMT

(oui, il s'est passé un truc le 18 mars!!)
 

Pitfrr

Wizard
Joined
Feb 10, 2014
Messages
1,531
Bonne question!

Je les remplacerai l'un après l'autre sans pour autant pouvoir le justifier complètement.
En effet, avec un volume en RAIDz3, rien n'empêche le remplacement de deux disques en même temps a priori.
Mais je n'ai pas d'expérience avec les volumens en RAIDz3. Peut-être d'autres membres du forum ont un retour d'expérience à ce sujet?
 

Apollo

Wizard
Joined
Jun 13, 2013
Messages
1,458
Avec RAIDZ3, il y a 3 disques dedies a maintenir la parite. Se qui signifie qu'il y a encore parite avec un disque.
Si tu fais the changement un apres l'autre, cela va prendre deux fois plus de temps as se reconstruire et don't augmenter les probabilites d'erreur.

Je pense que le mieux est de remplacer les deux disques ensemble.
La vrai question est de savoir s'il est plus prudent de le faire en retennant les deux disques qui sont en erreur ou bient les mettre Offline avant de lancer le remplacement des disques.
 

viph

Explorer
Joined
Apr 27, 2019
Messages
90
merci pour votre retour
je m'y suis collé... mais !
 
Last edited:

viph

Explorer
Joined
Apr 27, 2019
Messages
90
hummm
comment dire !
j'ai changé da4 et da6, sur la base des numéro de série des disques pour être sûr d'être sûr;
mais là, je retrouve un bazar incompréhensible :
1585844306216.png

da5 et 6 semble offline, or, je suis sûr de moi : c'est 4 et 6 que j'avais mis hors ligne.
Et si je regards le status du pool :
1585844552001.png

ce qui m'a l'air encore plus "puzzling"

Se pourrait-il que le systeme renomme les daX à sa façon et que cela ne soit pas important?

comment l'un peut devenir "non disponible" ? aurais-je décablé par erreur?

aïe !!
 

viph

Explorer
Joined
Apr 27, 2019
Messages
90
je m'auto-
réponds : oui, un des disques était désalimenté :)

1585847596419.png


donc je m'inquiète moins,
et j'en déduis que le nommage est fonction de la position "physique" et du fait d'être monté ou pas.
 
Last edited:

viph

Explorer
Joined
Apr 27, 2019
Messages
90
voilà, les 2 remplacements sont lancés.

à voir combien de temps cela prend...
 
Last edited:

Pitfrr

Wizard
Joined
Feb 10, 2014
Messages
1,531
Oui, faut faire attention, la "numérotation" da0-dax se fait au démarrage dans l'ordre de détection des disques mais n'est absolument pas une référence.
D'un redémarrage à l'autre cela peut changer. Si un disque met un peu plus longtemps à réagir lors d'un redémarrage, il aura une autre numérotation.
 

viph

Explorer
Joined
Apr 27, 2019
Messages
90
90 minutes... 7%
Z3, 8 * 3 TB

curieux : j'ai vu l'empreinte mémoire augmenter progressivement, en parallèle de la charge cpu et des processes.
là tout est "retombé" : 6 GB (sur 32) le cpu à 3-4%
et les disques affichent des températures raisonnables : 25-30 deg Celsius

pas grave, je ne suis pas pressé... tant que ça progresse :cool:
 

viph

Explorer
Joined
Apr 27, 2019
Messages
90
hummmm
70 minutes plus tard... tout pareil
sauf cpu tombé à 1%
 

viph

Explorer
Joined
Apr 27, 2019
Messages
90
hello,
22%... ça progresse !
mais je ne comprends pas pourquoi si peu de sollicitations :
CPU = 2 à 3% (c'est un 2C/4T, G4560)
RAM = 6 à 8 GB sur 32
la glandouille quoi :)
 

Pitfrr

Wizard
Joined
Feb 10, 2014
Messages
1,531
J'ai fait un remplacement de disques récemment mais j'ai pas regardé au niveau de l'utilisation CPU ou RAM... :-(

Ils sont de quelle capacité les disques? Car ça semble progresser très lentement en effet.
J'aurai tendance à imaginer que cela ne devrait pas prendre beaucoup plus qu'un scrub normal mais je me trompe peut-être.
 

Pitfrr

Wizard
Joined
Feb 10, 2014
Messages
1,531
Alors je viens de faire un remplacement de disques.

Sur le moment je n'y avais pas pensé (c'est comme un scrub bien sûr) mais j'utilise zpool status en ligne de commande pour suivre la progression.
Et là ça avance à 250Mo/s (+10h encore d'estimation).

Niveau CPU ça monte 20% en gros et l'utilisation mémoire est quasi nulle.
 

viph

Explorer
Joined
Apr 27, 2019
Messages
90
Hello Pitfrr

les 8 disques sont de 3 To.
6,41 To sont utilisés et 5,61 sont libres.

zpool status affiche bien loin de ce que tu mentionnes:
1585930139215.png


je viens de virtuel-feuilleter la littérature, il semble que 8 disques en Z3 ne soit pas la plus rapide des configurations.
mais je n'ai pas trouvé trace d'un double swap :)
 
Last edited:

Pitfrr

Wizard
Joined
Feb 10, 2014
Messages
1,531
2 jours... oui ça fait long quand même! :tongue:
J'ai pas d'expérience avec les volumes RAIDz3 donc je peux pas dire.
Sur mon volume en RAIDz2, parfois le scrub lui prend une trentaine d'heure sans que je comprenne bien pourquoi (alors que d'habitude c'est 15h en gros)...
 

viph

Explorer
Joined
Apr 27, 2019
Messages
90
le remplacement s'est arrêté de lui même.
des erreurs d'écritures sur l'un des nouveaux disques en serait la cause ?

1585990237647.png


les alarmes indiquent une augmentation des erreurs

1585991054686.png
 
Last edited:

Pitfrr

Wizard
Joined
Feb 10, 2014
Messages
1,531
Et ces erreurs de checksum sur da3?? Des faux contacts dans un cable?

J'ai du mal à suivre... qui remplace qui? :smile:
da7 remplace le disque offline?
Ah... mais si il a des erreurs en écriture sur da7 c'est embêtant?!? C'est un nouveau disque?
 

Apollo

Wizard
Joined
Jun 13, 2013
Messages
1,458
La procedure de Resilvering peux prendre plusieurs jours et l'utilisation CPU n'est pas une reference.
Si tu pouvait faire une capture du status des disques a partir du shell ou CLI avec la commande:
zpool status treize-z3
L'information qui en retourne est bien plus precise que ce que tu a sous Freenas GUI.
 

viph

Explorer
Joined
Apr 27, 2019
Messages
90
Oui, j'avoue m'y perdre aussi. Je suis allé voir la machine : elle est toujours là :)

après reboot et re-tentative de remplacement, ça beugue encore mais je finis par avoir ce message :
1586027648817.png


bon, j'ai commandé un autre disque histoire de sortir du piège: impossible de savoie en l'état si le disque est en faute... ou s'ill y a autre chose.
 

viph

Explorer
Joined
Apr 27, 2019
Messages
90
Merci Apollo,
ok donc no stress.
le retour de zpool status, pendant le resilvering, était :
1586027810937.png


maintenant il est:
1586028006447.png
 
Top