Prise sata cassée -> Volume perdu?

Status
Not open for further replies.

Pitfrr

Wizard
Joined
Feb 10, 2014
Messages
1,531
Ben après, ça dépend de ce que tu veux récupérer comme config?
Si tu as une configuration "compliquée" (plusieurs jails, partages réseau, droits spécifiques....) alors ca peut valoir le coup de tenter de la récupérer. Mais sinon c'est peut être aussi rapide ou presque de la refaire "à la main".

L'inconnue que j'ai c'est l'import du volume sans avoir fait l'export avant. Je crois avoir testé mais je ne me souviens plus... ;-O

Pour récupérer des données sur le support de boot, je pense qu'il vaut mieux passer par un FreeBSD ou un Linux que du Windows qui ne saura pas le lire.
 

Albertdela

Dabbler
Joined
Sep 4, 2017
Messages
26
pouah! Quel boulet je suis! Les développeurs de freenas ne sont pas des idiots (!) et ça depuis la version 8 !!! http://olddoc.freenas.org/index.php/Volumes#Auto_Importing_Volumes Faut les brancher et hop... ça marche! Tout le ZIL est sauvegardé dans le pool, du coup, tu branches et ça retrouve tout! Forcément, on imagine pas tout reconfigurer en production quand tu as 48 disques presque tous différents...
Après, reste les différents partages à reconfigurer mais ça c'est moindre mal... Déjà, j'ai certainement récupéré toutes les données...
Je vous dis ça dans pas tard...
 

Pitfrr

Wizard
Joined
Feb 10, 2014
Messages
1,531
Si les données sont récupérées alors super!

Oui normalement si le volume n'a pas souffert, ça se passe généralement bien, même si l'export n'a pas été fait je crois (mais j'étais pas sûr à 100% non plus pour pouvoir le confirmer).
 

Albertdela

Dabbler
Joined
Sep 4, 2017
Messages
26
Done!
Tout est revenu comme si de rien n'était. J'ai changé le hardware vers un truc un peu plus puissant mais toujours pas au niveau théoriquement nécessaire pour FreeNas. Si un jour j'ai un peu de sous qui restent, je les mettrai dans une config qui tient un peu plus la route. Dans l'urgence ce sera certainement un onduleur dans pas tard...
Merci de tous les conseils, ça m'a permis de prendre conscience de la puissance potentielle mais aussi des moyens adéquats.
Bonne suite à tous.
et merci encore!
 

Pitfrr

Wizard
Joined
Feb 10, 2014
Messages
1,531
Ah génial alors!

Par contre, je ne pourrai que conseiller avant toute chose: mettre en place une solution de backup.
Même si elle n'est pas très élaborée et manuelle (genre un disque externe qu'on met à jour tous les 3 mois par exemple).
Ça permet d'être un peu plus serein, surtout quand le matériel n'est pas à niveau.
Bonne continuation.
 

Albertdela

Dabbler
Joined
Sep 4, 2017
Messages
26
pour le backup, je vais faire ça dans le cours de la semaine prochaine.
En attendant, j'ai fais des SMART test durant la nuit. Le résultat c'est:

  • CRITICAL: Oct. 1, 2017, 12:52 a.m. - Device: /dev/ada2, 23 Currently unreadable (pending) sectors
  • CRITICAL: Oct. 1, 2017, 12:52 a.m. - Device: /dev/ada2, 9 Offline uncorrectable sectors
  • CRITICAL: Oct. 1, 2017, 12:52 a.m. - Device: /dev/ada1, FAILED SMART self-check. BACK UP DATA NOW!
  • CRITICAL: Oct. 1, 2017, 12:52 a.m. - Device: /dev/ada1, 47 Currently unreadable (pending) sectors
  • CRITICAL: Oct. 1, 2017, 12:52 a.m. - Device: /dev/ada1, 60 Offline uncorrectable sectors
  • CRITICAL: Oct. 1, 2017, 12:52 a.m. - Device: /dev/ada1, Failed SMART usage Attribute: 1 Raw_Read_Error_Rate.
  • CRITICAL: Oct. 1, 2017, 12:52 a.m. - The volume Grand_volume (ZFS) state is ONLINE: One or more devices has experienced an unrecoverable error. An attempt was made to correct the error. Applications are unaffected.
Je ne comprends pas bien ce qu'il trouve sur le ada1. Le NOW! j'ai bien compris. Par contre, ce qu'il y a avant j'ai un peu de mal...
Une petite idée?
 

Pitfrr

Wizard
Joined
Feb 10, 2014
Messages
1,531
Ouhlàà... c'est pas top tout ca!
Bon c'est à peu près consistant avec les messages que tu avais dans ton post d'origine.

Donc là tu as:
- ada2: 23 unreadable (non lisible à confirmer) et 9 offline (inutilisables, confirmé)
- ada1: 47 unreadable et 60 offline
Ca veut dire que sur le disque ada2 tu as 9 secteurs défectueux et 23 non lisibles à confirmer. Et sur le disque ada1 tu as 60 secteurs défectueux et 47 à confirmer.

Ces chiffres sont très élevés, trop élevés (à mon goût en tout cas).
Si tes disques sont encore sous garantie, c'est conseillé de les renvoyer (c'est couvert par la garantie normalement).

De là, je vois trois voies possibles:
1- si tu tiens à tes données, faire un backup le plus rapidement puis changer les disques au plus tôt
2- si tu tiens moyennement à tes données, fait un backup des choses essentielles sur un autre support (voir sur un deuxième support encore pour les données critiques) et attend de voir pour les disques jusqu'à ce qu'ils lâchent.
3- si tu ne tiens pas à tes données, tu verras combien de temps tu peux tenir comme ça! et quand ça lâchera, ça lâchera... --> fortement déconseillé!!

Si j'ai bon souvenir et bien compris, tu avais 4 disques dans ton volume en RAIDZ1 (donc un seul disque de redondance).
Un des disques n'est plus dans le volume (celui avec la prise cassée). Il te reste 3 disques. Sur ces 3 disques, 2 présentent des erreurs SMART critiques (celles ci-dessus).
Donc attention: si tu perds encore un disques, tu perds tout!

Il faut que tu aies conscience que tu es dans une situation critique d'un point de vue de tes données.
Si tu ne tiens pas à tes données alors ok.
Par contre si tu y tiens, c'est très très critique!! C'est pour ca que j'insiste lourdement... :tongue:

Pour ada1, ca peut être intéressant d'avoir la sortie de la commande:
smartctl -a /dev/da1
pour voir un peu plus en détail ce message Failed SMART usage Attribute.
 

Albertdela

Dabbler
Joined
Sep 4, 2017
Messages
26
Salut.
De nouveau de très bon conseils!
Je n'ai pas précisé mais j'ai retrouvé tous les disques. Donc j'ai bien un raid Z1 avec 4 disques, c'est probablement pour ça qu'il termine par "applications are unaffected". Néanmoins, je retiens que le ada1 est très malade. Les disques ont au moins 4 ans. Ils ont été achetés à l'occasion d'une promo. Je ne pense pas que la garantie fonctionne encore. Il est clair que les coupures à répétition ont probablement finies par attaqué les secteurs...
C'est en cours d'achat pour le changement mais d'abord le backup...
 

Pitfrr

Wizard
Joined
Feb 10, 2014
Messages
1,531
4 ans c'est peut être un peu vieux pour la garantie en effet.
Ça peut valoir le coup de checker, souvent les constructeurs donnent les infos de garantie sur leur site. C'est un formulaire, on rentre le numéro de série et ça donne l'état de la garantie. On peut avoir des surprises parfois.... ;-)

Bon backup! ;-))
 
Status
Not open for further replies.
Top