Problème emplacement barrette ram

Rosin0416

Patron
Joined
Apr 11, 2016
Messages
214
Bonjour à tous,
J'avais récemment échangé avec vous sur l'utilité pour Freenas / Truenas de compléter les emplacements vides de mémoire vive.
https://www.truenas.com/community/threads/appel-à-ram-ct102472bd160b.99360/#post-689744
J'ai donc acheté deux barrettes de ram CT102472BD160B supplémentaires d'occasion.
Il se peut que j'ai un problème. Ma carte mère supermicro X10SL7-F dispose de 4 emplacements (DIMMA1 / DIMMA2 - DIMMB1 / DIMMB2) de 8go max chacune. Je peux donc monter ma Ram à 32Go.
J'avais jusqu'à récemment 16Go (2x8Go) de ram qui ont toujours été installés sur DIMMA1 et DIMMA2. Ces ram avaient été achetées neuves, testées et fonctionnent depuis 6-7 ans.
Quand j'ai reçu mes deux nouvelles ram, je les ai installées et j'ai démarré le serveur. Il a démarré sans soucis. Je l'ai éteins puis rallumé, là 4 bips pas comme d'habitude, le serveur ne s'est pas allumé. J'ai du appuyer sur le bouton pour lui donner l'ordre de s'éteindre.
Je vous passe quelques détails, mais à un moment donné, j'ai inversé mes anciennes ram avec les nouvelles, mes nouvelles ram (d'occas) installés sur DIMMA1 et DIMMA2 et mes anciennes ram sur DIMMB1et DIMMB2.
Là pareil, le serveur a démarré correctement, et au démarrage suivant, le problème est survenu. Ahh.

Jusqu'ici je me disais que ce devait être mes ram d'occas que je venais d'acheter. Or le problème persiste avec mes ram dont je suis à peu près sur qu'elle fonctionnent correctement.
J'ai voulu tester les rams avec memtest86 version 9.4 free.
Avec les 4 barrettes de ram installées, le processus de test s'est bloqué au test #9 (modulo 20, un&zéro).
Du coup j'ai testé uniquement les deux barrettes que je venais d'acheter que j'ai installé sur DIMMA1 et DIMMA2. Pour l'instant tous les tests sont passés sans aucune erreurs.

A première vue ça n'a pas l'air de venir des ram. Avez-vous une idées de quoi cela pourrait-il venir ?
Etant donné que lorsque ça bip 4 fois (mais pas comme un démarrage normal), y-a-t-il des logs à récupérés quelque part ?

Je continue de tester mes rams (nouvelles puis les anciennes) sur DIMMA1 et DIMMA2.
 

Pitfrr

Wizard
Joined
Feb 10, 2014
Messages
1,531
Bonjour,

Plusieurs pistes pour essayer de comprendre:
  • Les bips: vérifie dans le mode d'emploi (annexe A-1) si cela correspond à quelque chose du tableau, qui permettrait d'identifier le problème.
  • Regarde au niveau de l'IPMI dans les logs ce qui est indiqué, s'il y a une entrée qui te permettrait de savoir ce qui se passe.
Je te conseille de tester pas à pas (avec memtest86 par exemple):
  • Barrette par barrette
  • 2 barrettes
  • puis avec 4 barrettes
J'ai déjà eu le cas sur une carte mère (Asus, grand public) où j'ai eu du mal à lui faire reconnaître 4 barrettes qui pourtant fonctionnaient seules. J'ai abandonné et je suis resté avec 3 barrettes!

Un autre point que tu peux vérifier c'est la version de ton BIOS (et voir s'il y a une mise à jour qui corrigerait peut-être un compatibilité de mémoires).
 

Rosin0416

Patron
Joined
Apr 11, 2016
Messages
214
Bonjour,

Le bios est à sa dernière version depuis plusieurs mois.

En ce qui concerne les bips, j'en ai bien 4 courts qui ne sont pas référencés sur le manuel. Toutefois, j'ai trouvé cette information ici :
https://www.thomas-krenn.com/en/wiki/AMI_BIOS_Beep_Codes_Overview
Cela semble signifier une mauvaise mémoire installée (mémoire "registred" installée alors qu'une mémoire "non-registred" est requise, ou une mémoire non-ECC installée quand une mémoire ECC est requise)

Sauf que dans mon cas ce sont bien des mémoires ECC et non-registred.

J'ai refait des tests en suivants tes conseils.
Pour deux barrettes de ram (DIMMA1 et DIMMA2) pas de problèmes, quand j'ai mis une troisième barrette, le PC a démarré sans problème, j'ai pu lancer memtest86 et lancer un test qui s'est bien déroulé.
J'ai ensuite éteins le PC. Rallumage suivant, 4 bips d'erreur, alors que je n'avais rien touché.

Au niveau IMPI, aucune erreur n'a été relevé par la système (Health Event Log). Peut-être y-a-t-il d'autre log à chercher ailleurs ?
 

Pitfrr

Wizard
Joined
Feb 10, 2014
Messages
1,531
Concernant les tests, as-tu testé chaque barrette indépendamment avec memtest86?
Donc juste une barrette dans un slot (et cela 4 fois donc). Je demande car dans ce que tu décris, je n'ai pas l'impression.
Parce que si tu as une barrette de naze, si tu testes avec plusieurs d'un coup, tu n'arriveras peut-être pas à identifier laquelle c'est.

Ensuite, l'autre chose à tester (ce qui peut être plus compliqué): tester les barrettes sur un autre système. Le problème ne vient peut-être pas des barrettes... :-(

Oui, 4 bips d'erreur ce n'est pas décrit dans les annexes du mode d'emploi.... bien sûr! :tongue:
 

Rosin0416

Patron
Joined
Apr 11, 2016
Messages
214
Le test barrette / barrette est encore en cours.
Je poste dès que j'ai tout fais
 

Pitfrr

Wizard
Joined
Feb 10, 2014
Messages
1,531
Deux possibilités:
  • Le test échoue avec une barrette, facile... :smile:
  • Le test passe sur toutes les barrettes.... pas cool!
    • Soit une barrette a un coup dans l'aile mais ce n'est pas détecté, galère. Après tu peux commencer à faire des tests 2 par 2... (avec toutes les combinaisons) puis ensuite avec 3 barrettes... Bref, ça va être long
    • Tu as une incompatibilité quelque part, mais alors faut trouver! Comme je le disais précédemment, tester avec un autre système aussi peut permettre d'éliminer certains éléments.
    • Dans tous les cas, si tu tombes dans cette catégorie, bonne chance car le diagnostique risque d'être long.
 

Rosin0416

Patron
Joined
Apr 11, 2016
Messages
214
Tu ne crois pas que ça puisse être la partie DIMMB1 et DIMMB2 de la carte mère qui a un problème ?
J'ai toujours inséré mes ram en commençant par DIMMA1. Cela poserait-il un problème si je teste une seule barrette sur les différents emplacement ?
 

Pitfrr

Wizard
Joined
Feb 10, 2014
Messages
1,531
Oui, effectivement, pour éliminer ça aussi, ça peut valoir le coup, une fois que tu as testé les barrettes une par une, de tester les emplacements un à un.
 

Rosin0416

Patron
Joined
Apr 11, 2016
Messages
214
Je posais la question, car dans le manuel page 2.10, il est écrit :
Insert the desired number of DIMMs into the memory slots, starting with DIMMA1 (Channel A, Slot 1, see the next page for the location).
 

Pitfrr

Wizard
Joined
Feb 10, 2014
Messages
1,531
Souvent dans les manuels ils est écrit qu'on ne doit pas peupler les slots de mémoire n'importe comment...
Si y'a qu'une seule barrette alors elle devrait être dans le slot 1 (channel A, slot 1) et non dans le slot 3 (channel B slot 1) par exemple.

Après, dans ton cas, ça te permet d'essayer de procéder par élimination.
Si une barrette fonctionne dans le slot 3 toute seule, alors la barrette est bonne et le slot DIMM est bon.
Par contre si elle ne fonctionne pas, tu peux pas vraiment conclure à savoir si la barrette a un coup dans l'aile ou si la carte mère a un problème.

Comme je le disais plus haut, le diagnostic risque d'être long.... :smile:
 

Rosin0416

Patron
Joined
Apr 11, 2016
Messages
214
Bonjour,
Bon, j'ai testé chaque ram seule sur l'emplacement DIMMA1. Elles ont toutes passées les tests sans erreur.

Malheureusement , je n'ai pas d'autre système me permettant de tester mes barrettes de ram.

ps : le test consiste en 4 pass de 13 tests différents (voir memtest86 pour plus de précisions sur les tests en question)

Je poursuis sur d'autres tests.
 

Pitfrr

Wizard
Joined
Feb 10, 2014
Messages
1,531
Elles ont toutes passées les tests sans erreur.
Ahlàlà... Enfin c'est bien mais du coup, ça complique la compréhension! :smile:
Ca falloir trouver ce qui plaît pas lorsqu'elles sont toutes ensembles.

Je ne sais pas comment tu procèdes, mais j'identifierai chaque barrette mémoire (avec le numéro de série ou juste une numérotation arbitraire) et je ferai une grille de tests du genre:

Barrette RAMEmplacementRésultat
#1DIMMA1ok/nok
#2DIMMA1ok/nok

Et je ferai toutes les combinaisons, avec une barrette, deux barrettes, trois barrettes et quatre barrettes. :-(
(ou peut-être je commencerais par une et quatre barrettes (en faisant les permutations avec les 4 barrettes)... je sais pas trop en fait.)
Mais je pense que c'est le seul moyen de pouvoir ensuite tirer des conclusions.
Bon sans permutations ça te fait dans les 25 tests quand même.
Si tu n'as pas d'autre système pour tester, j'ai pas d'autre idée.

Ca peut aussi valoir le coup de poser la question dans la partie anglophone, peut-être que d'autres membres du forum auront des idées.
 

Rosin0416

Patron
Joined
Apr 11, 2016
Messages
214
Je suis en train de tester les emplacements.
La première barrette s'est bien comportée sur les 4 slots
La seconde barrette a provoqué les 4 bips d'erreur sur DIMMB1.
La troisième barrette : il n'y a pas eu de bips d'erreur, mais l'OS n'arrive pas à se lancer que ce soit sur DIMMB1 & DIMMB2

Je vais voir pour poster sur le forum anglophone, ça va être coton d'expliquer ça en dans un anglais :)
 

Pitfrr

Wizard
Joined
Feb 10, 2014
Messages
1,531
Oui, compliqué...
Comme je le disais, si ça ne marche pas tu peux pas forcément tirer de conclusion. :-(
Par exemple la barrette #2 ne fonctionne pas sur DIMMB1... mais la barrette #3 non plus (avec d'autres symptômes).
Sauf si c'est un cas flagrant genre tu as 3 barrettes qui fonctionnent bien partout mais la quatrième qui bipe dans DIMMB1. Mais il y avait peu de chances que tu tombes sur un cas comme ça hélas... :-O
Continue tes test et n'hésite pas à poster un résultat une fois que tu auras un peu plus de données.
 

Rosin0416

Patron
Joined
Apr 11, 2016
Messages
214
Bonsoir,
Nouveaux tests : chaque barette de ram a été testée seule sur chacun des 4 slot
Protocole de test :
1] lancement d'un liveUSB linux mint avec navigation succincte (ouvrir des logiciels, naviguer dans les dossiers, pas plus d'une minute)
2] extinction
3] lancement memtest86 (1 pass / 13 tests)
4] Ctrl+Alt+Suppr pour redémarrer le système
5] au redémarrage, lancement du LiveUSB linux mint avec navigation succincte (ouvrir des logiciels, naviguer dans les dossiers, pas plus d'une minute)

Plusieurs remarques sur les résultats :
_ aucune erreur n'a été détecté par memtest86
_ à aucun moment je n'ai eu les 4 bips d'erreur au démarrage. Je n'ai eu que les bips normalement émis lorsque tout va bien.
_ pour chaque premier démarrage, je n'ai jamais eu de problème de latence ou autre. C'est lors du second démarrage que ça se gâte et où il arrive des (très, très) grosses latences.
_ les deux barrettes d'occas que je viens d'acheter fonctionnent sur les 4 emplacements sans aucun problème.
_ les deux barrettes que je possédais déjà ont toutes les deux posées problème
_ les problèmes ne sont arrivés que sur le canal B => DIMMB1 et DIMMB2
 

Pitfrr

Wizard
Joined
Feb 10, 2014
Messages
1,531
Alors pour résumer (et reformuler comme ça ça permet de voir si j'ai bien interprété), tu as testé chaque barrette sur chaque slot (donc 16 tests) et tout s'est bien déroulé sauf:
  • Seconde barrette: 4 bips d'erreur sur DIMMB1 (de ton précédent post)
  • Troisième barrette: l'OS ne démarre pas sur DIMMB1 et DIMMB2 (mais par contre memtest86 se lance et ne bronche pas)

Pffff.... coton... :tongue:
Je veux dire par là que les résultats sont pas francs donc difficile de conclure.
En voyant ça je dirais que les barrettes ont l'air bonnes mais que tu as peut-être des problèmes de compatibilité quelque part.
C'est étrange ces latences dont tu parles au deuxième redémarrage?? Je ne sais pas trop quoi en penser...

A ce niveau là, ce que j'essayerai peut-être (mais là on est vraiment dans du tâtonnage):
  • Y'a peut-être une bonne combinaison qui fonctionne mais faut la trouver... y'a que 24 combinaisons, ça va encore... :smile:
    • Ca c'est sans danger, ça peut juste être un peu long...
  • Ensuite tu peux essayer de jouer avec les paramètres du BIOS pour la mémoire mais là c'est coton car souvent ces paramètres sont un peu obscures (quand tu commences à rentrer dans les timings mémoire et tout...). Mais tu peux essayer des choses "simples" comme:
    • Changer la fréquence (abaisser la fréquence)
    • Voir à jouer avec les timings mais là comme je disais, c'est un peu obscur...
  • Dans les pistes un peu plus "chaudes"
    • Pourquoi ne pas essayer un léger overclocking (pour voir comment les barrettes se comportent) mais je sais pas si et comment c'est faisable car ça dépend du BIOS... et puis faut aussi connaître un peu, l'overclocking c'est tout un art. :smile:
Bon ce sont des pistes inspiré de tes résultats que je propose mais c'est plus de l'expérimentation hein... J'essaye de me mettre à ta place et voir ce que je tenterai si je devais essayer de trouver une solution. Je te conseille de faire un peu de recherches avant et si tu arrives à trouver d'autres conseils, c'est pas plus mal d'avoir plusieurs sources.
 

Rosin0416

Patron
Joined
Apr 11, 2016
Messages
214
Bonjour,

Alors pour résumer (et reformuler comme ça ça permet de voir si j'ai bien interprété), tu as testé chaque barrette sur chaque slot (donc 16 tests) et tout s'est bien déroulé sauf:

  • Seconde barrette: 4 bips d'erreur sur DIMMB1 (de ton précédent post)
  • Troisième barrette: l'OS ne démarre pas sur DIMMB1 et DIMMB2 (mais par contre memtest86 se lance et ne bronche pas)
Alors, entre mon post 13 et mon post 14, j'ai recommencé une salve de test plus "rigoureux".
Et dans les derniers tests, à aucun moment je n'ai eu les 4 bips. C'est vraiment étrange.

Bon j'ai quand même avancé un peu.
Je viens de me rendre compte que ce ne sont peut-être pas 4 bips courts, mais que ça pourrait bien être 4 bips longs. ça ne m'a pas sauté aux oreilles tout de suite.
Si je reprends le lien de mon second post (#3), l'auteur dit que pour 4 bips, il peut s'agir de : "CPU not supported; update BIOS to support new CPU".
Par ailleurs, en regardant la doc de mon processeur, j'ai tiqué sur quelque chose :
concernant les caractéristiques de ram il est écrit : "Type de mémoire : DDR3-1333/1600, DDR3L-1333/1600 @ 1.5V"
La RAM CT102472BD160B est donnée pour 1,35V.

Mon CPU est-il fait pour fonctionner avec cette carte et cette ram ?
 

Rosin0416

Patron
Joined
Apr 11, 2016
Messages
214
Pour information :
_ J'ai démonté la carte mère pour voir s'il n'y avait pas des mauvaises soudures sur les pins des connecteurs ram, ou des condo gonflés,... => RAS
_ J'ai démonté le processeur et nettoyer les contacts.
_ J'ai remis les 4 barrettes de ram, lancé le système sur windows et lancé IPDT, le logiciel de diagnostic d'intel. => RAS
Le problème c'est que j'arrive à booter une fois sans problème. Et quand je relance le système, impossible de lancer un OS quel qu'il soit pour lancer un diagnostic quand ça déconne.

Y'a peut-être une bonne combinaison qui fonctionne mais faut la trouver... y'a que 24 combinaisons, ça va encore... :smile:
J'en ai essayé quelque une, celles qui avaient une chance de fonctionner, mais ça n'a rien donné, soit j'ai les 4 bips d'erreur, soit ça redémarre en boucle, soit j'arrive sur un OS, mais j'ai des grosses latences (à ne rien pourvoir faire).

Pour ce qui est des paramètres bios,... J'y connais pas grand chose. Je vais essayé de regarder ça.
 

Pitfrr

Wizard
Joined
Feb 10, 2014
Messages
1,531
J'avais regardé au niveau du CPU concernant la RAM savoir quel était le maximum supporté par contre j'ai pas pensé à la tension.
Effectivement, cela peut être une piste. Par contre je ne m'y connais pas assez pour pouvoir dire si c'est cela qui pose problème ici malheureusement...
Ca prête à confusion car sur le site d'intel, comme tu l'as dit, le CPU est indiqué supporter la mémoire DDR3 et DDR3L et là y'a ce "@1,5V"... sauf que la DDR3L est à 1,35V et non à 1,5V alors je comprends pas! :tongue: Est-ce que ça veut dire qu'il est compatible DDR3@1,5V et DDR3L@1,35V? C'est ce que je pense mais c'est pas très clair.
Bref, est-ce juste une histoire de voltage? J'aurai tendance à dire que non mais sans garantie.

Côté carte mère, le CPU est bien supporté, donc je pense pas qu'il y ait de problème là. D'autant plus que tu as aussi dit que tu avais la dernière version du BIOS.

Le problème c'est que j'arrive à booter une fois sans problème. Et quand je relance le système, impossible de lancer un OS
C'est vraiment étrange cette histoire... Peut-être une piste à étudier mais j'ai du mal à interpréter ce que ça pourrait vouloir dire.


Là je vois pas quoi faire d'autre dans ton cas. :-(
Je suis conscient que c'est pas pratique mais reste plus qu'à tester la RAM sur un autre système ce qui permettra (peut-être) de l'exclure et donc de conclure que c'est un problème de compatibilité non résolu (assez frustrant).
Après, c'est le risque que l'on court lorsque l'on sort de la liste des mémoire validées par le fabricant de la carte mère. Mais vu comment la liste est courte aussi c'est un peu agaçant.

Pour ce qui est des paramètres bios,... J'y connais pas grand chose. Je vais essayé de regarder ça.
Alors en relisant, c'est aussi peut-être une piste à étudier: peut-être qu'un paramètre par défaut fout le boxon... mais ça risque d'être coton à trouver.
 

Rosin0416

Patron
Joined
Apr 11, 2016
Messages
214
Bonjour,

Pour ce qui concerne l'intitulé "Type de mémoire : DDR3-1333/1600, DDR3L-1333/1600 @ 1.5V", cela a l'air d'être commun à tous les processeurs compatibles avec cette carte, y compris les xeon.

Finalement concernant les bips, il s'agirait quand même de bips court. Je n'ai pas eu l'occasion d'entendre un bip long, du coup...

Enfin grosse avancée : j'ai été voir s'il y avait des logs dans le bios, eh oui.
Il y avait les messages suivants :
Smbios 0x01 DIMMB1 Single bit ECC memory error (x20 fois)
Smbios 0x02 DIMMB1 Multi bit ECC memory error (x3 fois)
Smbios 0x01 DIMMB2 Single bit ECC memory error (x1 fois)

Après plusieurs tests, il s'avère que
_ces codes d'erreur sont générés quand j'arrive à lancer un système et qu'il est se mets en mode grosse latence. Lorsque j'ai les 4 bips d'erreur, le système n'enregistre pas à ce moment là.
_après avoir réalisé de nombreuses combinaisons de barrette/slots, il semble que les message n'apparaissent que sur DIMMB1 et DIMMB2. Toutefois pour quasiment toute les combinaisons testées, je n'ai que les 4 bips d'erreurs, qui se sont pas référencé dans dans les logs. Comme dit plus haut, les erreurs semblent être référencées plus tard dans le démarrage système.


Après, c'est le risque que l'on court lorsque l'on sort de la liste des mémoire validées par le fabricant de la carte mère. Mais vu comment la liste est courte aussi c'est un peu agaçant
Cette référence de ram est utilisée par beaucoup sur le forum. Je ne peux toujours pas le certifier, mais je ne pense pas que ce soit les ram. Il y a un problème physique ou soft quelque part. Maintenant quoi ?
C'est bizarre que ça marche une fois bien, et au démarrage suivant ça déconne et c'est systématique.
Pourquoi une fois et pas deux ? Par exemple si j'ai une barrette sur chaque emplacement, si ça déconne, il suffit que j'éteigne le système, j'interverti deux barrettes et c'est reparti pour un tour (un seul tour, pas plus!).
 
Top