Erreur CRITICAL : besoin d'explication

Status
Not open for further replies.

RTW

Dabbler
Joined
Jul 14, 2015
Messages
20
Bonjour à tous,

Je viens de me connecter à mon freenas et voici les deux erreurs qu'il m'indique :
  • CRITICAL: Nov. 29, 2016, 3:55 p.m. - The volume DATA_R (ZFS) state is ONLINE: One or more devices has experienced an error resulting in data corruption. Applications may be affected.
  • WARNING: Nov. 29, 2016, 4:26 p.m. - The capacity for the volume 'OS' is currently at 82%, while the recommended value is below 80%.
Je comprends bien que le WARNING s'alarme car mon espace disque a dépassé les 80% donc je vais essayer de faire du nettoyage.
Sinon pour l'erreur critique, je crois comprendre que l'un de mes disques contient des erreurs ... mais est ce un problème au niveau matériel ou au niveau logiciel ?


Merci d'avance de votre aide et bonne journée.

gudbes
 

Pitfrr

Wizard
Joined
Feb 10, 2014
Messages
1,531
Bonjour,

L'interface de FreeNAS permet de remonter des alertes sur l'état du système et il faut ensuite rechercher de manière un peu plus approfondie pour voir où est le problème.

Généralement un
Code:
zpool status
permettra de voir s'il y a un problème plus particulier au niveau du stockage pour ensuite continuer les investigations.

D'après le message il s'agit certainement d'une erreur au niveau des disques mais cela reste à confirmer.
Concernant les disques, ensuite le mieux c'est de regarder aux niveau des données et des tests SMART.

Pour avoir de l'aide plus précise sur le problème que tu peux avoir, penses aussi à rajouter les informations sur ton système (ainsi que le résultat de la commande ci-dessus).
 
Last edited:

RTW

Dabbler
Joined
Jul 14, 2015
Messages
20
Merci Pitfrr,

Voila le résultat de la commande :


Code:
root@freenas ~]# zpool status																									 
  pool: DATA_R																													 
state: ONLINE																													 
status: One or more devices has experienced an error resulting in data															 
		corruption.  Applications may be affected.																				 
action: Restore the file in question if possible.  Otherwise restore the															
		entire pool from backup.																									
   see: http://illumos.org/msg/ZFS-8000-8A																						 
  scan: scrub repaired 0 in 5h16m with 21 errors on Sun Nov 27 05:16:41 2016														
config:																															 
																																	
		NAME											STATE	 READ WRITE CKSUM												 
		DATA_R										  ONLINE	   0	 0	 0												 
		  mirror-0									  ONLINE	   0	 0	 0												 
			gptid/27776b94-1687-11e5-a4fa-d0509972ec70  ONLINE	   0	 0	 0												 
			gptid/28296bdf-1687-11e5-a4fa-d0509972ec70  ONLINE	   0	 0	 0												 
																																	
errors: 21 data errors, use '-v' for a list																						 
																																	
  pool: OS																														 
state: ONLINE																													 
  scan: scrub repaired 0 in 0h41m with 0 errors on Sun Nov 20 00:41:59 2016														 
config:																															 
																																	
		NAME											STATE	 READ WRITE CKSUM												 
		OS											  ONLINE	   0	 0	 0												 
		  mirror-0									  ONLINE	   0	 0	 0												 
			gptid/ccb64290-f1dd-11e5-b31c-d0509972ec70  ONLINE	   0	 0	 0												 
			gptid/cd895a27-f1dd-11e5-b31c-d0509972ec70  ONLINE	   0	 0	 0												 
																																	
errors: No known data errors																										
																																	
  pool: freenas-boot																												
state: ONLINE																													 
  scan: scrub repaired 0 in 0h2m with 0 errors on Wed Oct 26 03:47:32 2016														 
config:																															 
																																	
		NAME		STATE	 READ WRITE CKSUM																					 
		freenas-boot  ONLINE	   0	 0	 0																					
		  da0p2	 ONLINE	   0	 0	 0																					 
																																	
errors: No known data errors   


Concernant ma configuration :

- 2 disques en RAID1 de 2To (Volume DATA_R)
- 2 disques en RAID1 de 160 Go (Volume OS).

J'ai ajouté l'option -v pour avoir plus d'explication sur les erreurs et il m'indique des erreurs dans un dossier seulement. Il faudrait peut etre que je le supprime (car ce n'est pas un dossier important) ?

J'espère que cela te suffira et merci encore de ton aide.

gudbes
 

darkwarrior

Patron
Joined
Mar 29, 2015
Messages
336
Hello,

on dirait que tu as eu un souci de corruption de fichiers o_O
il va falloir exécuter un zpool status DATA_R -v pour avoir le détail des fichiers.
J'espère que des sauvegardes de ces fichiers sont disponibles...

Au passage: Quel est la configuration de ton système ?
As-tu une platefome avec de la RAM ECC ?
On verra après pour la cause ;)
 

RTW

Dabbler
Joined
Jul 14, 2015
Messages
20
Bonjour,

Voici le résultat de la commande :

[root@freenas ~]# zpool status -v DATA_R
pool: DATA_R
state: ONLINE
status: One or more devices has experienced an error resulting in data
corruption. Applications may be affected.
action: Restore the file in question if possible. Otherwise restore the
entire pool from backup.
see: http://illumos.org/msg/ZFS-8000-8A
scan: scrub repaired 0 in 5h16m with 21 errors on Sun Nov 27 05:16:41 2016
config:

NAME STATE READ WRITE CKSUM
DATA_R ONLINE 0 0 0
mirror-0 ONLINE 0 0 0
gptid/27776b94-1687-11e5-a4fa-d0509972ec70 ONLINE 0 0 0
gptid/28296bdf-1687-11e5-a4fa-d0509972ec70 ONLINE 0 0 0

errors: Permanent errors have been detected in the following files:

/mnt/DATA_R/Donnees/20160702/Desktop/doc/1.doc
/mnt/DATA_R/Donnees/20160702/Desktop/doc/11.doc
/mnt/DATA_R/Donnees/20160702/Desktop/doc/12.doc
/mnt/DATA_R/Donnees/20160702/Desktop/doc/13.doc
/mnt/DATA_R/Donnees/20160702/Desktop/doc/14.doc
/mnt/DATA_R/Donnees/20160702/Desktop/doc/15.doc
/mnt/DATA_R/Donnees/20160702/Desktop/doc/16.doc
/mnt/DATA_R/Donnees/20160702/Desktop/doc/17.doc
/mnt/DATA_R/Donnees/20160702/Desktop/doc/18.doc
/mnt/DATA_R/Donnees/20160702/Pictures/doc/19.doc
/mnt/DATA_R/Donnees/20160702/Desktop/doc/111.doc
/mnt/DATA_R/Donnees/20160702/Desktop/doc/112.doc
/mnt/DATA_R/Donnees/20160702/Desktop/doc/113.doc
/mnt/DATA_R/Donnees/20160702/Desktop/doc/114.doc
/mnt/DATA_R/Donnees/20160702/Pictures/photos/IMG_1119.MOV
/mnt/DATA_R/Donnees/20160702/Desktop/doc/115.doc
/mnt/DATA_R/Donnees/20160702/Desktop/doc/116.doc
/mnt/DATA_R/Donnees/20160702/Desktop/doc/117.doc
/mnt/DATA_R/Donnees/20160702/Desktop/doc/118.doc
/mnt/DATA_R/Donnees/20160702/Desktop/doc/119.doc
/mnt/DATA_R/Donnees/20160702/Desktop/doc/120.doc




Quel est la configuration de ton système ?

Voila ce que j'ai trouvé comme info :
Platform Intel(R) Core(TM) i3-2100 CPU @ 3.10GHz

Memory 7854MB


As-tu une platefome avec de la RAM ECC ?

Oula aucune idée, c'est un P.C. fait avec des pièces de récup'


J'espère t'avoir donner toutes les infos que tu voulais.

Encore merci

gudbes
 

Pitfrr

Wizard
Joined
Feb 10, 2014
Messages
1,531
Hello,

Si c'est une plateforme fait avec des pièces de récup' alors tu n'as probablement pas de RAM ECC et ca pourrait expliquer l'origine du problème.
Et il semblerait que le i3-2100 ne supporte pas la mémoire ECC de toute facon (ce n'est pas mentionné explicitement sur le site d'Intel).

Une autre piste à étudier aurait peut-être été les infos SMART des disques mais je pense que ton problème vient surement de la RAM non ECC.

Il faut que tu saches que si tu utilises FreeNAS sans suivre les recommandations hardwares il faut que tu le fasses en connaissance de cause car cela peut t'attirer des problèmes et le support que tu pourras recevoir des membres de ce forum est basé sur le respect de ces recommandations.
Donc à moins que tu saches ce que tu fais, il faudra peut-être que tu changes ta configuration hardware pour avoir un système plus fiable et répondant aux recommandations.

Par ailleurs, j'espère que tu as bien un backup de tes données (surtout avec un système sans mémoire ECC)! ;-)
 

darkwarrior

Patron
Joined
Mar 29, 2015
Messages
336
Yep, yep. C'est ce que j'allais dire.
Malheureusement, tu perds potentiellement une grande partie des fonctionnalités de résilience de ZFS, quand tu utilises une machine sans RAM ECC.
ZFS utilises la RAM de ton serveur pour effectuer des opérations de vérifications et dans ton cas tu ne pourras jamais être sûr de la validité des informations, car tu ne disposes pas de RAM ECC...:eek:

Avant tout autre chose, il faut absolument que tu vérifies ta RAM (avec Memtest86) avant de faire quoi que ce soit.
Si tu ne fais pas ça les nouvelles données, ou celles restaurés, pourraient être corrompu très rapidement... :confused:
 

RTW

Dabbler
Joined
Jul 14, 2015
Messages
20
Merci pour les informations. Alors j'ai deux questions c'est quoi une ram ecc et l'avantage comparé aux autres rams ?
Sinon Pitffr tu m'a dit que mon i3 ne supportait pas le ecc il faut donc choisir un processeur qui utilise aussi l'écran ?

Encore merci pour vos conseils.

Gudbes
 

Pitfrr

Wizard
Joined
Feb 10, 2014
Messages
1,531
La RAM ECC c'est de la RAM qui détecte les erreurs (Error Correction Coding) et les corrige (si elle y arrive et sinon elle bloque le système pour éviter des problèmes de corruption de données).
L'avantage par rapport aux autres RAM c'est justement la détection d'erreurs.
Ce type de RAM est principalement utilisée pour les serveurs par exemple.
FreeNAS utilise beaucoup la RAM (comme cache) et donc il est important que ta RAM ne génère pas d'erreurs sinon ces dernières sont propagées dans les données ce qui serait fatal.
C'est probablement ce qui s'est passé dans ton cas et qui a corrompu des fichiers.

Il y a plusieurs raisons pour ces erreurs:
- défaut matériel de la RAM
- erreur d'un bit lors du transfert des données (depuis le disque dur ou le réseau vers la RAM)
- rayonnement cosmique
- ...

Pour profiter pleinement de la RAM ECC, il faut que le processeur, la carte mère et la mémoire le supportent.
C'est pourquoi le choix du matériel est important et c'est également souvent du matériel de type serveur qui est utilisé. Ce n'est pas toujours évident car il y a plusieurs types de mémoires ECC et il vaut mieux utiliser les modèles validés pour la carte mère choisie.


Je ne comprends pas ta dernière question " [...] mon i3 ne supportait pas le ecc il faut donc choisir un processeur qui utilise aussi l'écran ?"
Il n'y a aucun rapport entre le support de la mémoire ECC et l'écran... Je pense que tu fais une confusion mais je ne sais pas où.
Peut-être concernant la gestion graphique intégrée au niveau des processeurs. En effet, pour une utilisation avec FreeNAS, elle n'est d'aucune utilité (certains processeurs grand public comme les i3 et/ou i5 (je sais plus exactement) ont justement une gestion graphique intégrée. Et c'est aussi pourquoi tu verras des configurations avec de processeurs pour serveurs (type Xeon) qui n'ont (généralement) pas cette partie graphique intégrée).
 

darkwarrior

Patron
Joined
Mar 29, 2015
Messages
336
+1

Merci pour les informations. Alors j'ai deux questions c'est quoi une ram ecc et l'avantage comparé aux autres rams ?
Sinon Pitffr tu m'a dit que mon i3 ne supportait pas le ecc il faut donc choisir un processeur qui utilise aussi l'écran ?

Encore merci pour vos conseils.

Gudbes

Il va falloir lire un peu au sujet de la RAM ECC:
Un bon début est ici:
https://fr.wikipedia.org/wiki/Mémoire_à_code_correcteur_d'erreurs

Je suppose que ta 2ème question concerne la RAM ECC également:
Oui, il faut choisir la carte mère et le proc qui supportent la RAM ECC.

Tous les proc sur le lien intel ci-dessous supportent cette fonctionalité:
http://ark.intel.com/search/advanced?s=t&ECCMemory=true
 

RTW

Dabbler
Joined
Jul 14, 2015
Messages
20
Alors j'ai supprimé tous les fichiers où il y a avait les erreurs mais les erreurs apparaissent toujours :

[root@freenas ~]# zpool status -v DATA_R
pool: DATA_R
state: ONLINE
status: One or more devices has experienced an error resulting in data
corruption. Applications may be affected.
action: Restore the file in question if possible. Otherwise restore the
entire pool from backup.
see: http://illumos.org/msg/ZFS-8000-8A
scan: scrub repaired 0 in 5h16m with 21 errors on Sun Nov 27 05:16:41 2016
config:

NAME STATE READ WRITE CKSUM
DATA_R ONLINE 0 0 0
mirror-0 ONLINE 0 0 0
gptid/27776b94-1687-11e5-a4fa-d0509972ec70 ONLINE 0 0 0
gptid/28296bdf-1687-11e5-a4fa-d0509972ec70 ONLINE 0 0 0

errors: Permanent errors have been detected in the following files:

DATA_R/Donnees:<0x6e902>
DATA_R/Donnees:<0x6e90b>
DATA_R/Donnees:<0x6e81c>
DATA_R/Donnees:<0x6e82b>
DATA_R/Donnees:<0x6d634>
DATA_R/Donnees:<0x6e845>
DATA_R/Donnees:<0x6e855>
DATA_R/Donnees:<0x6e864>
DATA_R/Donnees:<0x6e86d>
DATA_R/Donnees:<0x6df73>
DATA_R/Donnees:<0x6e879>
DATA_R/Donnees:<0x6e885>
DATA_R/Donnees:<0x6e895>
DATA_R/Donnees:<0x6e8a2>
DATA_R/Donnees:<0x6c6b1>
DATA_R/Donnees:<0x6e8b1>
DATA_R/Donnees:<0x6e8c1>
DATA_R/Donnees:<0x6e8cd>
DATA_R/Donnees:<0x6e8d9>
DATA_R/Donnees:<0x6e8e8>
DATA_R/Donnees:<0x6e8f2>




Y a t il un moyen de faire un RAZ des erreurs ?

gudbes
 

RTW

Dabbler
Joined
Jul 14, 2015
Messages
20
Merci darkwarrior mais faut il redémarrer le serveur car malheureusement pour le moment les "fausses" erreurs sont toujours là
 
Status
Not open for further replies.
Top