ständige Reboots und Freezes bei Netzwerkzugriff

micneu

Patron
Joined
Mar 23, 2019
Messages
473
die logs liegen doch auf dem boot medium (bei mir ssd).
du kannst das "system dataset" auf die ssd packen
 

Motu1

Dabbler
Joined
Oct 28, 2014
Messages
14
hmm, ich habe den neuen Speicherriegel verbaut, der will aber nicht funktionieren.
Jetzt bräuchte ich einmal euren professionellen Rat zwecks ECC RAM.

Das Board und CPU sind ECC tauglich. startet aber nicht mit den ECC Riegel - es piept nur - 1x kurz und 3x kurz.
Das Board startet aber mit einen standard RAM Riegel problemlos.

Kann ich einen ECC Riegel zum testen mit einen non-ECC Riegel mischen? Rein theoretisch?
Rein praktisch hat es nämlich nicht geklappt.... Mit 2 PCs getestet.

Bin mir einfach unsicher, ob der Riegel defekt ist oder ob ich das Konzept hinter ECC nicht verstehe.

Besagter Riegel ist ein:
Kingston Server Premier - DDR4 - 16 GB - DIMM 288-PIN - 2400 MHz / PC4-19200 - CL17 -
1.2 V - registriert - ECC
 

Fredda

Guru
Joined
Jul 9, 2019
Messages
608
Kingston Server Premier - DDR4 - 16 GB - DIMM 288-PIN - 2400 MHz / PC4-19200 - CL17 -
1.2 V - registriert - ECC
Kann es sein, dass das MB nur mit unbuffered/unregistered ECC klar kommt?

Steht dazu was im Manual? Sonst würde ich mal die HW Kompatibilitätsliste des MB checken, wenn alle dort aufgeführten ECC-RAMs unbuffered sind, kommt das Teil vermutlich nicht mit registered ECC klar.
Kann ich einen ECC Riegel zum testen mit einen non-ECC Riegel mischen? Rein theoretisch?
Wird höchstwarscheinlich nicht funktionieren.
 

Motu1

Dabbler
Joined
Oct 28, 2014
Messages
14
hi zusammen,

langsam verliere ich die Lust an Datensicherheit.
Mein altes System habe ich jetzt komplett überbaut.

Neuen Speicher von Crucial für den Serverbereich hab ich auch gekauft, damit ließ sich das Board letztendlich starten.

Vom USB Speicher als Boot Medium bin ich weg, dafür nutze ich jetzt eine SSD WD Green 120GB.

Schon nach den ersten Installationen kam es immer zu CRC Fehlern auf dem Boot-Medium.
Immer wieder war der Pool degraded...
Ich dachte erst, es lag am Swap, den ließ ich irgendwann weg, dann hatte ich das SATA Kabel in Verdacht, da es viele Jahre schon auf dem Buckel hat.
Irgendwann ließ sich alles mal vernünftig installieren und einrichten.

Und trotzdem kommt es immer noch ab und zu zu CRC Fehlern auf dem Boot-Medium.
Ich habe eine identische SSD bei einen anderen Onlinehändler gekauft und getauscht. Gleiches Spiel.

Genau um solche Fehler abzufangen ist doch der ECC Speicher da?!

Habt ihr noch Tipps? Ich bin es leid, alle paar Tage neu zu installieren und die Konfig wieder hochzuladen...


Code:
root@Database[~]# zpool status -v freenas-boot
  pool: freenas-boot
 state: ONLINE
status: One or more devices has experienced an unrecoverable error.  An
        attempt was made to correct the error.  Applications are unaffected.
action: Determine if the device needs to be replaced, and clear the errors
        using 'zpool clear' or replace the device with 'zpool replace'.
   see: http://illumos.org/msg/ZFS-8000-9P
  scan: none requested
config:

        NAME        STATE     READ WRITE CKSUM
        freenas-boot  ONLINE       0     0     0
          ada4p2    ONLINE       0     0     2

errors: No known data errors
root@Database[~]#

 

Fredda

Guru
Joined
Jul 9, 2019
Messages
608
Und trotzdem kommt es immer noch ab und zu zu CRC Fehlern auf dem Boot-Medium.
Ich habe eine identische SSD bei einen anderen Onlinehändler gekauft und getauscht. Gleiches Spiel.

Genau um solche Fehler abzufangen ist doch der ECC Speicher
Nein. Ist er nicht. Der ECC-Speicher verhindert, dass ein Bitfehler im RAM Daten, die zu Schreiben sind, kaputt macht und
Du so kaputte Daten auf Deinem Pool bekommst.

Die Checksum Fehler, die Du hier siehst, sind auf Protokollebene bei der Kommunikation Festplatte<->FreeNAS.
Diese sind (wie Du schon schriebst) häufig auf schlechte SATA Kabel zurückzuführen.
 

Motu1

Dabbler
Joined
Oct 28, 2014
Messages
14
Diese sind (wie Du schon schriebst) häufig auf schlechte SATA Kabel zurückzuführen.
Was könnte es noch sein?
Die SSD wurde bereits getauscht
Das Kabel wurde gegen ein neues getauscht
der Port auf dem Mainboard wurde bereits gewechselt

Solche Fehler hatte ich über 4 Jahre kein einziges Mal mit einen USB Stick...
 

Fredda

Guru
Joined
Jul 9, 2019
Messages
608
Hmm, also irgendwie scheinst Du leider ein etwas unglückliches Händchen bei der Auswahl Deiner Komponenten zu haben.
Wenn Du mal hier schaust:
Die WD Green scheinen bekannt dafür zu sein, Probleme als FreeNAS Bootdevice zu machen.
 

Motu1

Dabbler
Joined
Oct 28, 2014
Messages
14
@Fredda
Danke!

oh man -.- wenigstens kann ich eine noch zurückschicken.

aber welche SSD ist nun wirklich geeignet?! Muss mich da näher einlesen....
 

Fredda

Guru
Joined
Jul 9, 2019
Messages
608
Ja, irgendwie ist das alles nicht einfach :(

Und grade bei den SSDs hat (gefühlt) in den letzten Jahren eine extreme Entwicklung stattgefunden, so dass dann überhaupt die Frage ist, wenn man in einen zwei Jahre alten Thread/Post/Artikel eine Info liest, ob diese überhaupt noch aktuell relevant ist.

Ich würde wohl einfach mal einen Post aufmachen, wer welche SSD in letzter Zeit erfolgreich als Boot SSD eingesetzt hat.

Ich kann Dir leider keinen Tipp geben, meine Server haben alle Festplatten zum Booten.
 

micneu

Patron
Joined
Mar 23, 2019
Messages
473
Also, ich habe eine alte Samsung SSD 830 mit 64GB als BOOT SSD und für meine VM´s eine CORSAIR Force Series MP510 M.2 SSD 960GB läuft beides wunder bar, du kannst auch im Foster meine FreeNAS Komponenten sehen
 

masru

Dabbler
Joined
Aug 9, 2020
Messages
26
Ich hatte dieselben Probleme mit zwei verschiedenen sehr alten Crucial C300. Seit einiger Zeit teste ich mit einer mittelalten Crucial MX500, die absolut zuverlässig funktioniert.
Nachdem was ich im englischen Bereich hier gelesen habe gab es das Problem mit einem(?) bestimmten Controller, der von mehreren Herstellern eingesetzt wurde.
Ich denke du solltest mit aktuellen Crucial und mit Samsungs allgemein auf der sicheren Seite sein.
 

Motu1

Dabbler
Joined
Oct 28, 2014
Messages
14
Hallo zusammen,
leider haben sich meine Probleme mit der Zeit nicht komplett aufgelöst.

Jetzt hab ich gerade auch mal wieder Lust, mich um das Problem zu kümmern.
letztendlich verursacht eine meine Festplatten die Freezes des System. Sobald diese spezielle HDD (WD Red 4TB) im System steckt, friert das System ein. Die Platte beherbergt nur Video-Daten und stellt eine SMB und AFP Freigabe im LAN bereit.
Ich habe alle Scrubs und Datensicherungen auf dieser Platte deaktiviert und greife auch nicht aktiv auf die Freigabe zu.
Und trotzdem innerhalb von 2 Tagen, ist das System eingefroren; mal nach einer Stunde, mal um die 2 Tage.

Ich verstehe es einfach nicht, Das NAS bootet problemlos den Pool, wirft auch kein Hardwarefehler aus, SMART ist nichts zu sehen.
Die LOGs zeigen auch nichts, zumindest, was ich nicht erkennen kann.

Mal ganz blöd gefragt, welches Betriebssystem unterstützt ZFS, sodass ich den Pool zum testen einhängen kann und die Platte ggf mit "besserer" Software testen kann.

Hatte jemand schon einmal ähnliches ?

LG :)
 

micneu

Patron
Joined
Mar 23, 2019
Messages
473
da ich mir deinen ersten post und heute den footer von deinem letzen post anschaue, um welche hardware genau handelt es sich. bei deinem ersten post würde ich sagen vieleicht ist deine hardware nicht mehr ganz in ordnung (ist ja schon etwas älter)
 

bic

Contributor
Joined
Dec 7, 2021
Messages
182
Hatte jemand schon einmal ähnliches ?
Jo! Ich hatte mir vor ein paar Wochen ein Mini-NAS (nicht vom Speicherplatz, sondern von der Baugröße her) zusammengesteckt und dieses mit 2 Stück 5 TB 2,5" Platten bestückt (mehr passt nicht ins Gehäuse). Diese Platten arbeiten selbsverständlich nach dem Shingled Magnetic Recording Verfahren (SMR) und damit kam Truenas nun überhaupt nicht zurecht und fror genau wie bei Dir ohne jegliche Fehlermeldung immer ein (die Fehlermeldungen bekam ich allerdings dann über TreuCommand).

Da es aber nun von den WD Red diverse Varianten gibt und darunter auch welche sind, die mit SMR arbeiten, könnte es bei Dir auch daran liegen. Schau dir Deine Platte (Serienummer) mal genau an, dass Thema, welche Platte hier was macht, hatten wir hier schon vor kurzem.

An sonst - zur Frage des Betriebsystems mit ZFS-Unterstützung, da bleiben natürlich die üblichen Verdächtigen. Wenn Du es aber schnell und einfach lösen magst, versuch es mit der kostenlosen Trialversion hiervon. Diese Variante läuft auch mit ZFS und vielleicht kannst du damit deine Platte retten. Mein Mini-NAS läuft jedenfalls nun mit der Mini-Version davon, allerdings mit XFS und das problemlos
 

Motu1

Dabbler
Joined
Oct 28, 2014
Messages
14
@micneu
aktuelle Hardware steht in der Signatur

@bic
guter Hinweis. Eine der Platte war über Amazon nachgekauft.
Jedoch scheint das Modell zu stimmen, beide Platten haben die Modellnummer WD40EFRX-68WTONO

Was konntest du über truecommand herausfinden im Detail?

LG :)
 

bic

Contributor
Joined
Dec 7, 2021
Messages
182
Was konntest du über truecommand herausfinden im Detail?
Naja, Details sind da nicht zu erwarten, ich bekam lediglich die Meldung, dass SMR-Platten im Pool sind und daher Gefahr besteht - welche auch immer :frown:
 
Top