One or more devices has experienced an error resulting in data corruption

Status
Not open for further replies.

Bounta

Dabbler
Joined
Mar 24, 2014
Messages
25
Bonjour,
Depuis quelque temps mon nas affiche un message critique
"CRTITIQUE: Le status du volume VolumeD (ZFS) est ONLINE : One or more devices has experienced an error resulting in data corruption. Applications may be affected."
Pourtant, je ne trouve pas de problème particulier et tout semble fonctionner correctement.
Pourriez-vous, m'aiguiller sur le sens de ce message ou sur la façon de régler le problème?
D'avance merci
 

Bidule0hm

Server Electronics Sorcerer
Joined
Aug 5, 2013
Messages
3,710
Peux-tu poster, entre balises code, le résultat de la commande zpool status -v stp ?
 

Bounta

Dabbler
Joined
Mar 24, 2014
Messages
25
Voici, stp
Code:
pool: VolumeD
state: ONLINE
status: One or more devices has experienced an error resulting in data
corruption. Applications may be affected.
action: Restore the file in question if possible. Otherwise restore the
entire pool from backup.
see: http://illumos.org/msg/ZFS-8000-8A
scan: resilvered 12K in 0h0m with 0 errors on Thu Feb 11 15:06:07 2016                                                            
config:

NAME STATE READ WRITE CKSUM
VolumeD ONLINE 0 0 0
mirror-0 ONLINE 0 0 0
gptid/06f19d12-8897-11e4-88b6-10bf487f5376 ONLINE 0 0 0
gptid/078a0461-8897-11e4-88b6-10bf487f5376 ONLINE 0 0 0

errors: Permanent errors have been detected in the following files:

VolumeD:<0x2fce>
 

Bidule0hm

Server Electronics Sorcerer
Joined
Aug 5, 2013
Messages
3,710
Ok, liste ton hardware stp.

Il semblerait que tu ai des erreurs régulièrement ce qui n'est pas normal.

NB: l'erreur qui n'a pas pu être corrigée semble être dans les métadonnées de la pool. Je recommande de faire une backup (ça devrait déjà être fait ceci dit), détruire la pool, et la refaire. Mais pas avant de savoir d'où viennent ces erreurs.
 

DrKK

FreeNAS Generalissimo
Joined
Oct 15, 2013
Messages
3,630

DrKK

FreeNAS Generalissimo
Joined
Oct 15, 2013
Messages
3,630

Bounta

Dabbler
Joined
Mar 24, 2014
Messages
25
Bonjour,

Merci pour la réponse.
Avec mes maigres connaissances, je n'ai pas pu trouver la cause des erreurs, surtout que je ne constate aucun dysfonctionnement pratique.

J'entreprends maintenant de détruire le pool en espérant que cela va résoudre le problème.

Mon hardware:

Asus maximus V formula (récup)
i7-3770K 3.50Ghz
4x8Go RAM
ASUS U3S6
FreeNAS-9.3-STABLE-201602031011
 

Bidule0hm

Server Electronics Sorcerer
Joined
Aug 5, 2013
Messages
3,710
Par ordre de probabilité les causes sont souvent: les câbles SATA, une contrôleur SATA non recommandé, une alim de mauvaise qualité, des erreurs dans la RAM.

Il semblerait que ton contrôleur soit la source du souci mais c'est dur à dire vu que tu n'a pas listé tous le matos (carte mère ? alim ? disques ?).
 

Bounta

Dabbler
Joined
Mar 24, 2014
Messages
25
je ne pense pas que ça soit l'alim ou la ram, car j'ai 5 pools en raid 1 et un seul (toujours le même) a un problème, sinon je devrai avoir des problèmes avec les autres pools, non?
la carte fille ASUS U3S6, je l'utilise depuis un certain temps et le volume problématique n'y est pas connecté.
Je peux tester de changer les câble sata...

mon matériel c'est de la recup:

Carte mère Asus maximus V formula
Alimentation Antec TruePower Quattro - 1000W
le pool problématique 2X Seagate ST4000DM000
 

Bidule0hm

Server Electronics Sorcerer
Joined
Aug 5, 2013
Messages
3,710
Le souci c'est que penser ou non que ce soit la RAM n'avance pas à grand chose. Ce que je conseille c'est d'essayer de changer les câbles SATA et de débrancher/rebrancher les câbles d'alim aux disques (juste pour être sûr qu'il n'y a pas un connecteur mal branché ou une couche d'oxydation sur un contact). Ensuite si ça ne résout pas le pb je conseille de tester la RAM avec Memtest.
 

Bounta

Dabbler
Joined
Mar 24, 2014
Messages
25
Merci pour l'aide.
J'ai vérifié mes câbles SATA et les câbles d'alim.

En vérifiant dans "Etat du volume" (Volume Status) j'ai remarqué que j'ai des statuts différents selon le volume sélectionné.
Pour le volume D, d'où émané l'erreur, j'avais: Scrub Statut: En cour (ne se termine jamais)
Dans "Edit Options" Dé-duplication ZFS était activé.
En le désactivant et en redémarrant l'alerte système disparais.

Du coup, j'ai des doutes sur les options sélectionnées sur mes volumes, que j'ai suivis sur base d'un tuto.

Etat des volumes:
Volume A:

Resynchronisation
Statut: Terminé
Erreurs: 0 Date: Thu Feb 11 15:06:11 2016

Volume B

Resynchronisation
Statut: Terminé
Erreurs: 0 Date: Thu Feb 11 15:06:02 2016

Volume C

Resynchronisation
Statut: Terminé
Erreurs: 0 Date: Thu Feb 18 12:01:08 2016

Volume D (après modification, j'ai repris les mêmes paramétrés que le volume C)
Scrub
Statut: Terminé
Erreurs: 0 Réparé: 0 Date: Wed Mar 16 20:47:26 2016

Volume E

Scrub
Statut: Aucun requis

Quel est le bon statut que je devrais avoir?
Quelles sont les options que je doit introduire pour que le volume fonctionne correctement? Les volumes sont en miroir

D'avance merci
parametre avancé VolumeC.PNG
 

Bidule0hm

Server Electronics Sorcerer
Joined
Aug 5, 2013
Messages
3,710
Ok, peux-tu poster la totalité de la sortie de la command zpool status -v STP ?

Le pb c'est qu'activer la dédup et la désactiver ensuite ne change rien pour les données déjà écrites, elles restent dédupliquées avec tous les contraintes que ça impose. Je suis prêt à parier que ton pb vient de là (pour activer la dédup il faut minimum 5 Go de RAM par To de pool en plus du minimum requis, ce que tu es loin d'avoir surtout si on compte les besoins des autres pools).

Mon conseil est de sauvegarder les données, supprimer la pool, la refaire en faisant attention aux options (celles de la captures paraissent cohérentes, tu peux utiliser celles-là) et remettre les données dessus. Ensuite tu n'oublies pas de configurer les scrubs comme avant et tu regardes après chaque scrub s'il a réparé ou non des données (par ex dans la ligne scan: resilvered 12K in 0h0m with 0 errors on Thu Feb 11 15:06:07 2016 tu devrais avoir 0 au lieu de 12K). S'il ne répare rien alors tout va bien, sinon c'est que le pb vient d'ailleurs.
 

Bounta

Dabbler
Joined
Mar 24, 2014
Messages
25
Bon, j'arrive pas à configurer et me connecter avec PuTTY malgré l'aide dans un ancien post (c'est dire mon niveau :()
Donc je n'ai le résultat que pour les 3 derniers volumes (je n'ai pas encore détruit le volumeD)
Pour être honnête je n'ai jamais configuré les scrubs (et je ne sais pas (encore) comment faire)

Code:
 pool: VolumeC
state: ONLINE
scan: resilvered 24K in 0h0m with 0 errors on Thu Feb 18 12:01:08 2016
config:

NAME STATE READ WRITE CKSUM
VolumeC ONLINE 0 0 0
mirror-0 ONLINE 0 0 0
gptid/b45b4be6-0323-11e3-9200-10bf487f5376 ONLINE 0 0 0
gptid/4397e57e-d0cf-11e5-952d-08606e83069b ONLINE 0 0 0

errors: No known data errors

pool: VolumeD
state: ONLINE
scan: scrub repaired 0 in 4h35m with 0 errors on Wed Mar 16 20:47:26 2016
config:

NAME STATE READ WRITE CKSUM
VolumeD ONLINE 0 0 0
mirror-0 ONLINE 0 0 0
gptid/06f19d12-8897-11e4-88b6-10bf487f5376 ONLINE 0 0 0
gptid/078a0461-8897-11e4-88b6-10bf487f5376 ONLINE 0 0 0

errors: No known data errors

pool: VolumeE
state: ONLINE
scan: none requested
config:

NAME STATE READ WRITE CKSUM
VolumeE ONLINE 0 0 0
mirror-0 ONLINE 0 0 0
gptid/05da5d03-dbae-11e5-8e88-08606e83069b ONLINE 0 0 0
gptid/06b65d6e-dbae-11e5-8e88-08606e83069b ONLINE 0 0 0

errors: No known data errors

pool: freenas-boot
state: ONLINE
scan: scrub repaired 0 in 0h3m with 0 errors on Wed Mar 16 03:48:37 2016
config:

NAME STATE READ WRITE CKSUM
freenas-boot ONLINE 0 0 0
da0p2 ONLINE 0 0 0

errors: No known data errors 
 

Bidule0hm

Server Electronics Sorcerer
Joined
Aug 5, 2013
Messages
3,710
Par défaut il y a un scrub tous les 35 jours il me semble, heureusement car tu est censé configurer ton NAS pour scruber tes pools régulièrement.

Utilises zpool status -v | less et tu pourras scroller avec les flèches haut/bas du clavier (et quitter avec q).
 

Bounta

Dabbler
Joined
Mar 24, 2014
Messages
25
Merci. Je suis qu'un bricoleur sur FreeNas :(.
Je comprends enfin la commande | less pourtant j'avais fait plusieurs essais...
Quels paramètres scrub me conseille-tu, stp?

Code:
pool: VilumeB2
state: ONLINE
scan: resilvered 12K in 0h0m with 0 errors on Thu Feb 11 15:06:02 2016
config:

NAME STATE READ WRITE CKSUM
VilumeB2 ONLINE 0 0 0
mirror-0 ONLINE 0 0 0
gptid/e6f5c635-c127-11e3-8e7e-10bf487f5376 ONLINE 0 0 0
gptid/e78fb977-c127-11e3-8e7e-10bf487f5376 ONLINE 0 0 0

errors: No known data errors

pool: VolumeAnew
state: ONLINE
scan: resilvered 120K in 0h0m with 0 errors on Thu Feb 11 15:06:11 2016
config:

NAME STATE READ WRITE CKSUM
VolumeAnew ONLINE 0 0 0
mirror-0 ONLINE 0 0 0
gptid/0652d6b1-cbe4-11e5-8c07-08606e83069b ONLINE 0 0 0
gptid/0853b3f9-cbe4-11e5-8c07-08606e83069b ONLINE 0 0 0

errors: No known data errors

pool: VolumeC
state: ONLINE
scan: resilvered 24K in 0h0m with 0 errors on Thu Feb 18 12:01:08 2016
config:

NAME STATE READ WRITE CKSUM
VolumeC ONLINE 0 0 0
mirror-0 ONLINE 0 0 0
gptid/b45b4be6-0323-11e3-9200-10bf487f5376 ONLINE 0 0 0
gptid/4397e57e-d0cf-11e5-952d-08606e83069b ONLINE 0 0 0

errors: No known data errors

pool: VolumeD
state: ONLINE
scan: scrub repaired 0 in 4h35m with 0 errors on Wed Mar 16 20:47:26 2016
config:

NAME STATE READ WRITE CKSUM
VolumeD ONLINE 0 0 0
mirror-0 ONLINE 0 0 0
gptid/06f19d12-8897-11e4-88b6-10bf487f5376 ONLINE 0 0 0
gptid/078a0461-8897-11e4-88b6-10bf487f5376 ONLINE 0 0 0
:
errors: No known data errors

pool: VolumeE
state: ONLINE
scan: none requested
config:

NAME STATE READ WRITE CKSUM
VolumeE ONLINE 0 0 0
mirror-0 ONLINE 0 0 0
gptid/05da5d03-dbae-11e5-8e88-08606e83069b ONLINE 0 0 0
gptid/06b65d6e-dbae-11e5-8e88-08606e83069b ONLINE 0 0 0

errors: No known data errors

pool: freenas-boot
state: ONLINE
scan: scrub repaired 0 in 0h3m with 0 errors on Wed Mar 16 03:48:37 2016
config:

NAME STATE READ WRITE CKSUM
freenas-boot ONLINE 0 0 0
da0p2 ONLINE 0 0 0

errors: No known data errors
 

Bidule0hm

Server Electronics Sorcerer
Joined
Aug 5, 2013
Messages
3,710
| less n'est pas une commande, less en est une mais | (pipe = tuyau en français) sert à rediriger la sortie de la commande de gauche sur l'entrée de la commande droite ce qui permet de chainer des commandes simples pour arriver à un résultat parfois complexe :)

Regarde la partie "Misc" de ce topic: https://forums.freenas.org/index.ph...d-identification-and-backup-the-config.27365/ y'a le détail des tâches automatiques que j'ai configuré ;)

Ok, y'a définitivement un souci avec ce serveur, les trois premiers volumes ont tous plusieurs Ko réparés suite à une corruption. La première chose que je ferais maintenant est de tester la RAM avec Memtest car si la RAM a un souci ZFS croie que les données sont corrompues alors qu'elles ne le sont pas et les "répare" avec ce qu'il pense être la bonne version qui est en fait mauvaise à cause de la RAM. C'est pour ça qu'il est plus que fortement recommandé d'utilisé de la RAM ECC.
 
Status
Not open for further replies.
Top