Valeurs SMART ? -problème PC qui fige-

Valeurs SMART ? -problème PC qui fige- - Disque dur - Hardware

Marsh Posté le 25-07-2016 à 02:23:41    

Bonjour, j'ai quelques soucis de plus en plus fréquents avec mon PC ces temps-ci. A savoir que de temps en temps, et notamment quand je vais sur youtube ou quand je fais des manipulations de gros fichiers (transferts), j'ai la souris et le clavier qui ne répondent plus...
 
J'arrive alors à me connecter sur le PC via le reseau avec SSH pour faire un reboot "software" (toutes les commandes ne fonctionnent alors pas à travers SSH, notamment je ne peux pas relancer l'interface graphique, le PC est sous Gentoo et relancer xdm échoue)
 
Suite au soft reboot j'ai toujours des problèmes avec le système de fichier qui est alors automatiquement réparé... (syslog-ng)
 
Je me demande si le problème est hard ou soft du coup :??:
 
Et smart est assez obscure à interpréter pour moi:
 

FX-8350 Corsair # smartctl -A /dev/sda
smartctl 6.4 2015-06-04 r4109 [x86_64-linux-3.18.5] (local build)
Copyright (C) 2002-15, Bruce Allen, Christian Franke, www.smartmontools.org
 
=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 18
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x0000   006   000   000    Old_age   Offline      -       6
  3 Spin_Up_Time            0x0000   100   100   000    Old_age   Offline      -       0
  4 Start_Stop_Count        0x0000   100   100   000    Old_age   Offline      -       0
  5 Reallocated_Sector_Ct   0x0000   100   100   000    Old_age   Offline      -       0
  9 Power_On_Hours          0x0000   100   100   000    Old_age   Offline      -       10296
 12 Power_Cycle_Count       0x0000   100   100   000    Old_age   Offline      -       2952
232 Lifetime_Writes         0x0000   100   100   000    Old_age   Offline      -       7808751694
233 Media_Wearout_Indicator 0x0000   099   000   000    Old_age   Offline      -       99
 
FX-8350 Corsair # smartctl -A /dev/sdb
smartctl 6.4 2015-06-04 r4109 [x86_64-linux-3.18.5] (local build)
Copyright (C) 2002-15, Bruce Allen, Christian Franke, www.smartmontools.org
 
=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   100   099   051    Pre-fail  Always       -       237
  3 Spin_Up_Time            0x0007   073   073   011    Pre-fail  Always       -       8970
  4 Start_Stop_Count        0x0032   097   097   000    Old_age   Always       -       3198
  5 Reallocated_Sector_Ct   0x0033   100   100   010    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000f   100   100   051    Pre-fail  Always       -       0
  8 Seek_Time_Performance   0x0025   100   100   015    Pre-fail  Offline      -       0
  9 Power_On_Hours          0x0032   097   097   000    Old_age   Always       -       16484
 10 Spin_Retry_Count        0x0033   100   100   051    Pre-fail  Always       -       0
 11 Calibration_Retry_Count 0x0012   100   100   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   097   097   000    Old_age   Always       -       3090
 13 Read_Soft_Error_Rate    0x000e   100   099   000    Old_age   Always       -       237
183 Runtime_Bad_Block       0x0032   100   100   000    Old_age   Always       -       0
184 End-to-End_Error        0x0033   100   100   000    Pre-fail  Always       -       0
187 Reported_Uncorrect      0x0032   100   100   000    Old_age   Always       -       329                                                                
188 Command_Timeout         0x0032   100   100   000    Old_age   Always       -       0                                                                  
190 Airflow_Temperature_Cel 0x0022   065   049   000    Old_age   Always       -       35 (Min/Max 34/37)                                                
194 Temperature_Celsius     0x0022   064   045   000    Old_age   Always       -       36 (Min/Max 34/40)                                                
195 Hardware_ECC_Recovered  0x001a   100   100   000    Old_age   Always       -       97017294                                                          
196 Reallocated_Event_Count 0x0032   100   100   000    Old_age   Always       -       0                                                                  
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       20                                                                
198 Offline_Uncorrectable   0x0030   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x003e   100   100   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x000a   100   100   000    Old_age   Always       -       0
201 Soft_Read_Error_Rate    0x000a   099   099   000    Old_age   Always       -       10
 
FX-8350 Corsair # smartctl -A /dev/sdc
smartctl 6.4 2015-06-04 r4109 [x86_64-linux-3.18.5] (local build)
Copyright (C) 2002-15, Bruce Allen, Christian Franke, www.smartmontools.org
 
=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   100   100   051    Pre-fail  Always       -       0
  3 Spin_Up_Time            0x0007   068   068   011    Pre-fail  Always       -       10230
  4 Start_Stop_Count        0x0032   096   096   000    Old_age   Always       -       4460
  5 Reallocated_Sector_Ct   0x0033   100   100   010    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000f   100   100   051    Pre-fail  Always       -       0
  8 Seek_Time_Performance   0x0025   100   100   015    Pre-fail  Offline      -       10730
  9 Power_On_Hours          0x0032   095   095   000    Old_age   Always       -       25622
 10 Spin_Retry_Count        0x0033   100   100   051    Pre-fail  Always       -       0
 11 Calibration_Retry_Count 0x0012   100   100   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   096   096   000    Old_age   Always       -       4314
 13 Read_Soft_Error_Rate    0x000e   100   100   000    Old_age   Always       -       0
183 Runtime_Bad_Block       0x0032   100   100   000    Old_age   Always       -       0
184 End-to-End_Error        0x0033   100   100   000    Pre-fail  Always       -       0
187 Reported_Uncorrect      0x0032   100   100   000    Old_age   Always       -       0
188 Command_Timeout         0x0032   100   100   000    Old_age   Always       -       0
190 Airflow_Temperature_Cel 0x0022   064   051   000    Old_age   Always       -       36 (Min/Max 33/37)
194 Temperature_Celsius     0x0022   063   046   000    Old_age   Always       -       37 (Min/Max 33/39)
195 Hardware_ECC_Recovered  0x001a   100   100   000    Old_age   Always       -       72868
196 Reallocated_Event_Count 0x0032   100   100   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0030   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x003e   100   100   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x000a   100   100   000    Old_age   Always       -       0
201 Soft_Read_Error_Rate    0x000a   253   253   000    Old_age   Always       -       0


 
Où devrais-je investiguer ? :jap:
 
Edit: le premier disque est en fait un SSD contenant le système entier, les 2 HDD sont des "gros" de 1 et 1,5 T contenant les /home.


Message édité par TotalRecall le 25-07-2016 à 10:02:22
Reply

Marsh Posté le 25-07-2016 à 02:23:41   

Reply

Marsh Posté le 25-07-2016 à 07:14:24    

Bonjour, merci de détailler la config et de tester chacune des barrettes de RAM avec Memtest
 

Reply

Marsh Posté le 25-07-2016 à 10:00:46    

Le rapport SMART est imbitable et on n'a même pas les références des disques mais ça :

Citation :

 1 Raw_Read_Error_Rate     0x0000   006   000   000    Old_age   Offline      -       6


C'est bizarre !
Tu n'as pas un utilitaire constructeur pour tester le SSD ?
Et sinon +1 pour le memtest (ou autre) et la config, ainsi que les températures, le monitoring de l'alim...

 

PS : je me suis permis d'éditer ton post pour remplacer ton quote par une balise [fixed], ce qui permet au rapport SMART de devenir déjà beaucoup plus lisible.

Message cité 1 fois
Message édité par TotalRecall le 25-07-2016 à 10:03:08

---------------
Topic .Net - C# @ Prog
Reply

Marsh Posté le 25-07-2016 à 16:13:08    

TotalRecall a écrit :

Le rapport SMART est imbitable et on n'a même pas les références des disques mais ça :

Citation :

 1 Raw_Read_Error_Rate     0x0000   006   000   000    Old_age   Offline      -       6


C'est bizarre !
Tu n'as pas un utilitaire constructeur pour tester le SSD ?
Et sinon +1 pour le memtest (ou autre) et la config, ainsi que les températures, le monitoring de l'alim...
 
PS : je me suis permis d'éditer ton post pour remplacer ton quote par une balise [fixed], ce qui permet au rapport SMART de devenir déjà beaucoup plus lisible.


 
Bonsoir et merci pour la"réparation" de mon post :)
 
Le SSD est un OCZ Vertex 4 128 Go, firmware 1.5
 
Je n'ai pas de Windows pour un éventuel utilitaire :??:
 
Je vais faire un memtest (je ne sais plus ce que j'ai comme barrette mémoire, il y en a 4 pour un total de 12 Go, je vais regarder mes historique d'achat materiel.net/ldlc...)
 
la carte mère est une GA-990XA-UD3, proc FX-8350, alim fanless pareil je regarde les historique et je reviens.
 
Le sdb est un Samsung HD154UI, le sdc est un Samsung HD103UJ


Message édité par Mac Gyver 974 le 25-07-2016 à 16:19:01
Reply

Marsh Posté le 25-07-2016 à 16:20:08    

Les OCZ Vertex 4 il me semble bien que ça fait justement partie des séries de chez OCZ qui crevaient comme des mouches avec les Vector et quelques autres. Et le tiens a pas mal d'heures au compteur. Si je voulais troller je dirais même que pour un OCZ il fait figure de vétéran :whistle:

 

Vu la valeur qui a retenu mon attention si j'étais toi avant de tenter quoi que ce soit d'autre je ferai des backups et plutôt que torturer la RAM je m'inquiéterais sérieusement du SSD !!!

Message cité 1 fois
Message édité par TotalRecall le 25-07-2016 à 16:22:42

---------------
Topic .Net - C# @ Prog
Reply

Marsh Posté le 25-07-2016 à 16:34:43    

TotalRecall a écrit :

Les OCZ Vertex 4 il me semble bien que ça fait justement partie des séries de chez OCZ qui crevaient comme des mouches avec les Vector et quelques autres. Et le tiens a pas mal d'heures au compteur. Si je voulais troller je dirais même que pour un OCZ il fait figure de vétéran :whistle:
 
Vu la valeur qui a retenu mon attention si j'étais toi avant de tenter quoi que ce soit d'autre je ferai des backups et plutôt que torturer la RAM je m'inquiéterais sérieusement du SSD !!!


 
C'est pas cool du tout ce que tu me dis là  :cry:  
 
Pas besoin de backup je n'ai que l'OS dessus, /home est monté sur le 1,5 Tera.
 
Par contre je n'ai pas d'autre hdd/ssd sous la main pour le remplacer  :cry: Je ne perdrais donc pas de données (normalement), mais sans OS comment il va tourner mon PC  :cry:

Reply

Marsh Posté le 25-07-2016 à 16:43:06    

le SMART 197 sur sdb est aussi un facteur de problème, tu as 20 secteurs qui sont dans un état incertains, on ne sait pas si ils sont bons ou mauvais, mais le disque a détecté une erreur dessus.
 
faudrait à minima un formatage lent, ou une écriture de 0 (low level format) dessus pour rectifier ça.


---------------
un jour, moi aussi, je serais grand...
Reply

Marsh Posté le 25-07-2016 à 16:48:56    

Bof, si la valeur est stable (ce qui est sans doute le cas vu que la valeur est à 100 même si la donnée brute indique effectivement des secteurs suspects) ça ne me parait pas l'urgence. Tous les autres indicateurs sont au vert. Le LLF / Zero fill ça n'arrange pas forcément les soucis physiques et sur un disque utilisé c'est un gros boulot :o
Apres c'est vrai que s'ils sont particulièrement mal placés (faudrait pas de bol quand même !!!) ça peut causer des soucis au système.

 

Désolé si j'ai l'air un peu borné (:d ) mais moi je reste sur le SSD tant qu'on n'aura pas la preuve du contraire.


Message édité par TotalRecall le 25-07-2016 à 16:50:10

---------------
Topic .Net - C# @ Prog
Reply

Marsh Posté le 25-07-2016 à 17:21:53    

Ouep je suis du même avis que TotalRecall dans l'immédiat, d'autant plus que sdb c'est mes données (/home) donc ne peut pas causer un figeage général.  
 
Mais ce sont mes données sdb, et ce hdd n'est plus tout neuf.  
 
Je devais d'ailleurs acheter un nouveau HDD pour le remplacer.
 
Mais si je dois en plus changer le SSD c'est un peu hors budget :(
 
Ou sinon je me sers du nouveau HDD que je compte acheter pour également installer le système... ça m'évitera les écueils des SSD :/  
 
A moins qu'il en existe des fiables, en usage intense, enfin dans le sens grand nombre d'heure par jour, tout les jours. Les HDD ont l'air de bien mieux supporter cela ? Mais apparemment j'avais mal choisi mon SSD aussi ??
 
Je ne peux pas formater sdb malheureusement pour le moment, étant donné que c'est lui qui contient la majorité de mes données... Et il est rempli à 99% d'après df :( (
 
D'où aussi son remplacement par un plus gros, et surement un modèle particulièrement fiable, type serveur + un autre pour sauvegarde, mes données étant de la plus haute importance, ce sont mes données perso ! vidéo, photos perso etc... Je ne peux pas me permettre de les perdre...

Reply

Marsh Posté le 25-07-2016 à 17:31:57    

Je sais que c'est facile à dire quand on n'est pas celui qui paie, mais un SSD de 128Go aujourd'hui ça coûte une quarantaine d'euros...
 
Et sinon plus haut je t'avais aussi demandé de vérifier tes tensions et températures, ça n'est pas parce que le SSD est suspect qu'il faut zapper les contrôles élémentaires !


---------------
Topic .Net - C# @ Prog
Reply

Marsh Posté le 25-07-2016 à 17:31:57   

Reply

Marsh Posté le 25-07-2016 à 17:41:05    

Ouep remarque, je viens de voir que ça a baissé depuis noël 2012, date d'achat du Vertex 4 128 G !
 
Pour les autres infos je suis pas sur d'avoir tout en fait, avec lm_sensors :??:
 

Citation :

sensors
fam15h_power-pci-00c4
Adapter: PCI adapter
power1:       64.99 W  (crit = 125.19 W)
 
k10temp-pci-00c3
Adapter: PCI adapter
temp1:        +16.4°C  (high = +70.0°C)
                       (crit = +70.0°C, hyst = +67.0°C)
 
it8720-isa-0228
Adapter: ISA adapter
in0:          +0.93 V  (min =  +0.00 V, max =  +4.08 V)
in1:          +1.50 V  (min =  +0.00 V, max =  +4.08 V)
in2:          +3.34 V  (min =  +0.00 V, max =  +4.08 V)
+5V:          +2.98 V  (min =  +0.00 V, max =  +4.08 V)
in4:          +3.09 V  (min =  +0.00 V, max =  +4.08 V)
in5:          +0.88 V  (min =  +0.00 V, max =  +4.08 V)
in6:          +4.08 V  (min =  +0.00 V, max =  +4.08 V)
5VSB:         +2.16 V  (min =  +0.00 V, max =  +4.08 V)
Vbat:         +3.31 V  
fan1:           0 RPM  (min =   10 RPM)  ALARM
fan2:        2045 RPM  (min =   10 RPM)
fan3:        1534 RPM  (min =   10 RPM)
fan5:           0 RPM  (min =    0 RPM)
temp1:        +41.0°C  (low  = +127.0°C, high = +127.0°C)  sensor = thermistor
temp2:        +34.0°C  (low  = +127.0°C, high = +127.0°C)  sensor = thermal diode
temp3:        +16.0°C  (low  = +127.0°C, high = +70.0°C)  sensor = Intel PECI
cpu0_vid:    +0.000 V
intrusion0:  ALARM    

                                                               

Reply

Marsh Posté le 25-07-2016 à 17:55:25    

Les valeurs des températures semblent ok, les tensions affichées sont totalement fantaisistes donc on ne peut rien en déduire. Trouve un autre logiciel...


---------------
Topic .Net - C# @ Prog
Reply

Marsh Posté le 25-07-2016 à 18:11:14    

Je  regarderais dans le BIOS, il me semble qu'elles sont pas fantaisistes  :D enfin, des que je pourrais redémarrer.

Reply

Sujets relatifs:

Leave a Replay

Make sure you enter the(*)required information where indicate.HTML code is not allowed