Problème incompréhensible de freeze sur un PC bipro...

Problème incompréhensible de freeze sur un PC bipro... - Hardware - Linux et OS Alternatifs

Marsh Posté le 22-03-2005 à 15:58:50    

Bonjour,
 
J'utilise RedHat 9 sur un PC équipé des éléments suivants :
 
 - carte mère TYAN S2460
 - biprocesseur AMD 1900  
 - 1 Go de RAM
 - carte graphique ATI Mach 64
 - carte réseau Ethernet Intel Pro 1000
 - disque dur IBM 20 Go
 
 
Ce PC a récemment planté lors de gros calculs... Impossible de le redémarrer. J'ai donc :
 
 - changé la carte mère par une autre TYAN S2460
 - changé les 2 processeurs par deux processeurs qui fonctionnaient sur d'autres postes ainsi que les ventilateurs associés
 - changé l'alimentation par une Zalman 400 W
 - changé la nappe entre le disque dur et la carte mère
 - changé le lecteur de disquette
 - changé la carte video
 - changé la carte réseau
 - changé les 2 barettes de RAM de 512 Mo et testé celles-ci avec memtest86 (aucune erreur)
 - et dernièrement, changé le disque dur et tenté de réinstaller RedHat 9 et de mettre à jour son noyau en 2.6.10
 
Quelques soient les essais, le problème est toujours le même : au bout d'un certain temps, le PC ne répond plus. Par exemple, l'installation de RedHat 9 s'est passé sans souci mais à présent que je tente de recompiler le noyau en 2.6.10, au bout d'un certain temps (assez variable, 2 à 10 minutes), je m'aperçois à l'aide du tracé de l'utilisation processeur que celle-ci tombe à 2% et que la taille de la RAM allouée ne bouge plus (quelques soient les barettes de toutes façons). Et au bout d'un certain temps, si je lance d'autre appli, le PC freeze complétement. Et il faut rebooter. Ou s'il n'est pas freezé et que je tente un "reboot"... Il m'indique "the system is going to shutdown now !", il ferme le bureau de RedHat... écran noir... et plus rien.
 
J'ai pensé à une surchauffe des CPU... Dans le BIOS, ils sont entre 45° et 50°. Quand je les teste avec xmbmon sous RedHat, il indique 76° pour l'un et 77° pour l'autre. Qui croire ?? Si je bloque un peu le ventilo, les informations de vitesse de rotation transmises par le BIOS ou xmbmon sont identiques (on voit bien que le nombre de RPM ralenti).
 
Auriez-vous d'autres idées de tests à effectuer ? J'ai tout changé ou presque...  :sweat:  
 
Merci !  :jap:


Message édité par benj63 le 23-03-2005 à 09:17:19
Reply

Marsh Posté le 22-03-2005 à 15:58:50   

Reply

Marsh Posté le 22-03-2005 à 17:15:14    

up...  :sweat:


Message édité par benj63 le 23-03-2005 à 09:17:26
Reply

Marsh Posté le 22-03-2005 à 17:19:22    

Et beh, c'est vraiment bizarre comme problème :/
Tu peux toucher le rad des CPU pendant que ça compile, voir si c'est chaud ?
Sinon, c ptet une incompatibilitée avec la mobo :/

Reply

Marsh Posté le 22-03-2005 à 17:24:53    

benj63 a écrit :


J'ai pensé à une surchauffe des CPU... Dans le BIOS, ils sont entre 45° et 50°. Quand je les teste avec xmbmon sous RedHat, il indique 76° pour l'un et 77° pour l'autre. Qui croire ??


Aucun des 2, les sondes de temp des cartes meres sont pas fiables. Le mieux serait de coller une petite sonde externe pour vérifier ça, parce que ça fait vraiment penser  à une surchauffe ton histoire. Pate thermique bien appliquée ? Une toute fine couche bien étalée ? Contact core/ventirad optimal ? Pas en biais ?

Reply

Marsh Posté le 22-03-2005 à 19:57:58    

T'as essayé avec un LiveCD ?

Reply

Marsh Posté le 22-03-2005 à 20:19:44    

oui l'idée de leto3 est très bonne pour écarter un problème soft.

Reply

Marsh Posté le 22-03-2005 à 21:30:04    

Et accessoirement ca ecarterait aussi un problème de disque dur .
Ensuite si tu dis que la mémoire vive passe memtest sans problème , il reste plus beaucoup de coupables potentiels: processeurs, carte graphique .

Reply

Marsh Posté le 22-03-2005 à 22:01:41    

C'est que niveau matos, à moins que je me trompe, t'as tout changé !!
La question bête type "Mais où c'est que t'as perdu tes clés ?", est-ce que tu te rappelles si tu as fait une modif spéciale après laquelle il s'est mis à merder ? genre passer au 2.6 ou je ne sais quel mise à jour (et que du coup tu as réinstallé récemment) (en même temps ce sera éliminé par le test avec une LiveCD.
Bonne soirée

Reply

Marsh Posté le 23-03-2005 à 13:47:23    

A priori, ça a l'air d'être résolu... En lisant le post d'AirbaT, je me suis dit que la pâte thermique devait être mal appliquée. J'ai donc enlevé les deux ventirad, et je me suis aperçu que l'un des deux ventirad n'était pas tout à fait dans le bon sens (le CPU n'était pas parfaitement au milieu, le ventirad reposait en partie sur le socket). Après avoir réétalé la pâte, depuis ce matin je n'ai plus de problèmes...
 
Je n'ai pas testé avec un LiveCD car le disque dur était changé et je venais de réinstaller entièrement RedHat, donc ça ne pouvait pas être (à priori) un problème de soft.
 
Merci en tout cas pour vos conseils !  :jap:


Message édité par benj63 le 23-03-2005 à 13:48:12
Reply

Marsh Posté le 23-03-2005 à 22:19:32    

J'utilise une config similaire, ça fonctionne nickel  ;)  (cf ma config).
Ton problème venait sans doute d'une surchauffe, car le système correctement installé et configuré est d'une stabilité à toute épreuve. Si tu devais à nouveau connaître ce type de mésaventure à nouveau des problèmes, je peux -par expérience- te donner les conseils suivants :
 
- veiller à utiliser de la RAM ECC Registered (mode ECC ou Scrub)
- prendre garde à effectuer de bons réglages au niveau du BIOS
- favoriser l'utilisation d'un noyau Linux de la branche 2.6.x en SMP
- préférer des AMD Athlon MP aux AMD Athlon XP en SMP
- éventuellement prendre une alim plus puissante (genre +500 W)
- utiliser un boîtier bien ventilé (genre Antec & co)


Message édité par THRAK le 23-03-2005 à 22:20:05

---------------
THRAK (def.) : 1) A sudden and precise impact moving from intention, direction and commitment, in service of an aim. 2) 117 guitars almost striking the same chord simultaneously.
Reply

Sujets relatifs:

Leave a Replay

Make sure you enter the(*)required information where indicate.HTML code is not allowed