Errore disco - cosa fare

Status
Not open for further replies.

abe_one

Explorer
Joined
Nov 11, 2015
Messages
70
Ciao a tutti, ieri sera ho ricevuto una mail da freenas che conteneva la presenza di errori critici, ho aperto l'interfaccia web e questo è il messaggio:

CRITICO: Device: /dev/ada3, 2 Currently unreadable (pending) sectors (changed +1)

Ora io ho 6 hdd da 4 tb in raidz1 e tutte le periferiche sono online e il volume risulta sano.
Come devo procedere?
Devo avviare qualche ricostruzione? ho letto su un po' di forum di far partire dei controlli dello stato smart. Voi cosa mi consigliate?
Attendo un vostro riscontro per procedere, in modo di evitare di fare cappellate.

Grazie
 

abe_one

Explorer
Joined
Nov 11, 2015
Messages
70
Ok la cosa sta peggiorando e il raidz1 risulta degradato. L'unità ada3 sembra essere danneggiata.
Ho pensato di identificarla (fortunatamente ho scritto i seriali su ogni disco in modo da sfruttare l'hot swap), formattarla su un altro computer e reinserirlo come se fosse nuovo, (a patto che l'inizializzazione con mac non dia problemi). Secondo voi è una cosa fattibile?
In teoria il sistema dovrebbe ricostruire autonomamente il disco.
La procedura è del tutto automatica o devo fare qualche azione? cioè togliendo e inserendo un altro disco il sistema fa tutto da solo all'avvio o devo fare io qualcosa?
 

abe_one

Explorer
Joined
Nov 11, 2015
Messages
70
Ciao a tutti, ieri alla fine aspettando un po' ho potuto appurare che il sistema è riuscito a darsi una regolata. Il raid non è degradato ma è sano, restano sempre però 73 settori del disco 3 illeggibili. Quindi i settori illeggibili sono in aumento. Secondo voi da cosa è dovuto?
I dischi sono tutti nuovi e sono wd red da 4tb che a detta di molti sono abbastanza affidabili. Sono stati acquistati a gennaio e di notte il nas si spegne, quindi escluderei un danno da usura.

Non ho estratto il disco in quanto mi puzzava di cavolata, infatti ho collegato il monitor e mi sono guardato tutti i processi di ricostruzione. Il sistema ha risolto alcuni problemi, ma mi ha fatto accorgere di alcune cose:
io ho impostato un raidz1 con 6 dischi, quindi da ADA0 a ADA5, uno di questi dovrebbe essere il disco di parità, e secondo i video e il manuale io visualizzando i dischi che formano il mio volume dovrei vederne solo 5, nel momento in cui uno dei 5 si guasta io potrei fare un REPLACE e selezionare una unità sana, ma io vedo tutte e 6 le unità quindi il replace non mi fa scegliere un altro disco.

Per ultimo vorrei un vostro consigli su come muovermi ora:
Sono riuscito a fare un BK pulito di tutto il sistema dei file (dopo che si è ricostruito), ovviamente i 12 TERA di film rippati negli anni non posso backupparlo perché richiederebbe altrettanto spazio, quindi ci terrei a non perdere i dati.
Come mi muovo per riparare quei settori danneggiati? è un problema di disco? o un problema dovuto ad un errore di scrittura che formattando il disco e facendolo ricostruire riportebbe tutto ala normalità?
Attendo un vostro consiglio, nel frattempo il NAS rimarrà spento.

Grazie a tutti
 

mario000

Explorer
Joined
Jul 25, 2011
Messages
95
ho letto velocemente, ma se non ho capito male, i dischi sono nuovi e in garanzia, non puoi semplicemente sostituirlo, avrai un fermo macchina, il sistema però dovrebbe ricostruire il raid, o sbaglio?
 

abe_one

Explorer
Joined
Nov 11, 2015
Messages
70
come avviene la ricostruzione di preciso? tolgo un disco - ne metto uno nuovo - avvio - parte il processo?
 

mario000

Explorer
Joined
Jul 25, 2011
Messages
95
come avviene la ricostruzione di preciso? tolgo un disco - ne metto uno nuovo - avvio - parte il processo?
bella domanda, ammetto la mia ignoranza a riguardo, questa è la teoria, ma (fortunatamente) non mi è mai capitato di doverlo fare.
Prima di procedere credo ti conviene aspettare altre risposte.
 

mrbenza

Dabbler
Joined
Sep 26, 2013
Messages
44
Allora.. in maniera veloce.. il disco 3 e' guasto.. come detto da mario va sostituito..
detto ciò.. hai fatto un raidZ1, duque hai un solo disco come ridondanza
In parole povere il tuo sistema non perdera' niente fino a quando ci saranno 5 hard disk funzionanti.. puoi benissimo staccare il disco guasto e mandarlo in assistenza, e nell'attesa spegnere il nas..
Per la sostituzione del disco:
non so se la tua MB supporta l'HotSwap e quante porte sata hai disponibili, in caso non avessi piu sata e/o non supporti l'HotSwap puoi:
mettere l'hard disk nuovo al posto di quello vecchio
il raid risulterà Degraded (appunto perche' manca 1 disco, il nas indicerà che il disco3 sarà non accessibile)
da storage selezioni l'intero dataset
in basso > dettagli
vedrai i 7 HD con relativi n° di serie (i vecchi 6 di cui uno offline + quello nuovo)
selezioni l'hd n°3 e in basso selezioni replace
freenas di darà come opzione l'unico HD libero (quello nuovo appunto)
REPLACE
una volta finito partirà il resilvering
La percentuale di resilvering la potrai vedere sempre dalla schermata dettagli del Dataset

spero di essere stato chiaro e di aiuto
 

abe_one

Explorer
Joined
Nov 11, 2015
Messages
70
grazie mille per la risposta illuminante.
Allora anche sul forum internazionale mi hanno detto che il disco è guasto e bisogna procedere con la sostituzione.
Di sata libere non ne ho più. ma potrei sfruttare un adattatore USB3 per fare il replace e una volta terminato spegnere e mettere il disco nuovo al suo posto. Altrimenti prendere una PCI->sata 3 e lavorare con quello.
Comunque mi confermi che l'operazione di sostituzione del disco avviene sia con il disco "guasto" che con il disco nuovo collegati e tramite il tasto replace?
Questo potrebbe essere un problema perché il fornitore rivuole prima il guasto prima di ordinare il nuovo.... ma potrei trovare un accordo per cui mi faccio arrivare uno nuovo lo pago e mi faccio fare un reso.
Secondo voi da cosa può essere dipeso il guasto di 70 settori?
Rischio di perdere dei dati?
Come mai così dall'oggi al domani?
 

mrbenza

Dabbler
Joined
Sep 26, 2013
Messages
44
lascia perdere adattatori di ogni genere.
è una operazione che ho già fatto sul mio nas per fare l'upgrade dei dischi (4).
Fino a quando hai 5 dischi funzionanti il nas lavora in DEGRADED mode ( io sono andato avanti quasi 3 settimane senza il disco ridondante, funziona ugualmente ma ti sconsiglio vivamente di farlo, se si fosse guastato un altro hard disk in quel periodo avrei perso tutto).
la procedura che ti ho elencato funziona alla grande, cmq su you tube c'è anche un video su come procedere.
 

proto

Patron
Joined
Sep 28, 2015
Messages
269

abe_one

Explorer
Joined
Nov 11, 2015
Messages
70
Lo so benissimo che i dischi muoiono ma in meno di 3 mesi? A pranzo funziona e dopo 2 ore senza averci caricato nulla ha 70 settori danneggiati?
 

mrbenza

Dabbler
Joined
Sep 26, 2013
Messages
44
può succedere tranquillamente, a volte dopo 3 mesi, a volte dopo 2 giorni.. altre volte sono guasti già al primo avvio.. [emoji23] [emoji23]
 

abe_one

Explorer
Joined
Nov 11, 2015
Messages
70
Ok ho effettuato l'ordine di un disco nuovo, in modo da seguire la procedura di sostituzione come da manuale, e per farlo ho ordinato una scheda PCIe per avere altre 2 sata per poter collegare il settimo disco.
Ieri sera collego tutto, accendo e freenas vede la scheda, ma non vede il disco..... provo, riprovo, perdo la pazienza, la ritrovo..... ma nulla da fare (maledette schede economiche).

O la va o la spacca: spengo e tolgo il disco incriminato e ci metto il disco nuovo e accendo.

Ogni messaggio di errore appare, ma vengo tranquillizzato da: il raid con i dischi attuali può funzionare.
Clicco su volume e poi visualizza dischi, vedo un disco non formattato e gli dico replace. Parte il resilver.....
Stamattina alle 5:00 ricevo una mail che mi sveglia che mi comunica: 1. Aggiornamento a 9.10 Stable - 2. Raid Healty. Corro e accendo un computer per vedere ed è tutto ok. Nessun errore! File tutti presenti - Allora lancio un back up con carbon copy su il mio disco esterno e perfettamente non copia neanche 1kb e non ne manca neanche 1....

Ottimo lavoro freenas!


Ora però vorrei chiedervi questo:
Mentre cercavo esperienze su raid guasti, ho notato tanti che parlano di scrub, smarthd test ecc ecc, cosa è consigliato fare per mantenere il sistema controllato e efficiente? Io ho tra i servizi lo smart attivato, ma lo scrub non riesco a capire cosa sia, e non ho idea se posso o devo fare qualche altro controllo manuale o programmato.
Chiedo a voi!

Grazie mille!
 

mario000

Explorer
Joined
Jul 25, 2011
Messages
95
ottima notizia!!!
 

enemy85

Guru
Joined
Jun 10, 2011
Messages
757
Lo scrub altro non è che un controllo dei dati per verificare che non vi siano corruzioni. È una procedura che si effettua tramite FN ed è consigliato effettuarla regolarmente. Sulla documentazione è tutto ampiamente spiegato

Inviato dal mio LG-D855 utilizzando Tapatalk
 

abe_one

Explorer
Joined
Nov 11, 2015
Messages
70
lo scrub con quale ricorrenza è consigliato farlo?
"è una procedura che si effettua tramite FN" - FN sarebbe?
Ci sono altri controlli da fargli fare? Lo smart tra i servizi che ho attivato, come è consigliato settarlo?

Sono cosciente di non essere un tecnico, sopratutto in questo ambiente, sono un 3d artist che ha a che fare con altri sistemi operativi e altri terminali di gestione render farm, altrettanto complessi ma che ho imparato ad usare con le giuste limitazioni per non incappare in problemi, qui per me è tutto nuovo ed è un modo per accrescere le conoscenze di questo sistema, ma non per lavoro, solo per curiosità mia. I dati che tengo sul mio server sono film e dati di lavoro che per qualsiasi motivo posso perdere perché in triplice back up su sistemi di archiviazione diversi.

Grazie
 

proto

Patron
Joined
Sep 28, 2015
Messages
269
aggiungerei che il task e' gia' schedulato per default. timeframe: ogni 35 giorni, solitamente domenica, guarda in Storage --> Scrub.
e' un task pesante per cui e' consigliato lasciarlo girare a sistema "scarico", quando non ci sono client connessi, operazioni i/o.
io lascerei cosi' come hanno previsto i tecnici di freenas, a meno che non si sappia esattamente cosa si vuole fare.

per smart faccio un controllo Short a settimana e Long ogni 2.
 

abe_one

Explorer
Joined
Nov 11, 2015
Messages
70
Ciao, sto dettando i test smart e lo scrub ma mi manda in confusione la finestra di settaggio.
Nel campo "giorno del mese" ho 2 tab: "ogni n giorno del mese" e " tutti i selezionati giorni del mese" poi sotto c'è un'altra scelta del giorno....
Stessa cosa sia per lo scrub che per lo smart test.

Ora io vorrei capire, io il nas lo spengo ogni volta che non mi serve, quindi alla sera lo spengo e il pomeriggio del giorno dopo lo riaccendo e via così, manualmente oltretutto.
Come faccio a prevedere e ricordarmi i test? non c'è modo di settarli in modo che autonomamente si accenda il server, faccia i controlli e si spenga? Sarebbe comodo farli di notte.
 

proto

Patron
Joined
Sep 28, 2015
Messages
269
[...]
Ora io vorrei capire, io il nas lo spengo ogni volta che non mi serve [...]

fai uno script. ma per accendere il nas avrai bisogno di un client che gli dica di accendersi.
poi metti uno script sul nas che al post init faccia i controlli che vuoi fare ed esegua lo shutdown. certo, devi anche fare in modo che il tuo script legga l'output dei comandi che hai lanciato in modo da eseguire lo shutdown al termine dell'operazione e magari ti invii delle notifiche con errori via mail...
ma questa e' la soluzione peggiore.

[...]
lo scrub ma mi manda in confusione la finestra di settaggio.

leggi bene il manuale.
 

Kei

Dabbler
Joined
May 26, 2016
Messages
45
Avere 6hdd da 4 tb in raidz1 è pura follia in termini di sicurezza dei dati. Tenendo conto che i WD red hanno una Non-recoverable read errors per bits read di 1 su 10^14, la probabilità (P=(1-10-14)8*10^9*N*S) di completare con successo il resilvering è inferiore al 15 %.
 
Status
Not open for further replies.
Top