Faulty réguliers sur raid 5 mdadm

Faulty réguliers sur raid 5 mdadm - Installation - Linux et OS Alternatifs

Marsh Posté le 22-08-2011 à 21:37:19    

Bonjour à tous !
 
Voilà, j'ai monté un petit serveur pour un ami qui voulait avoir pas mal de stockage sur son LAN.
On est parti sur 4 disques Seagate Green 2To 5900t/m en raid 5.
 
Il y a deux semaines, après avoir fraîchement installé Debian (squeeze), je crée la grappe, formate le md0 en ext3,  
et je la partage avec samba. Tout marchait comme sur des roulettes mais en l'espace de quelques jours j'ai eu deux disques (différents)
qui se sont mis en faulty,  
 
Après l'erreur le disque est plus visible par debian. Après un reboot il remonte comme il faut, je le rajoute donc à la grappe, et le raid se resynchronise comme il faut.
 
Pas d'erreurs SMART sur les deux disques qui se sont mis en caraffe.
 
Voici un extrait du syslog juste au moment de l'erreur :

Code :
  1. Aug 22 20:13:55 serveur kernel: [22720.900079] sd 1:0:0:0: [sdb] Unhandled error code
  2. Aug 22 20:13:55 serveur kernel: [22720.900080] sd 1:0:0:0: [sdb] Result: hostbyte=DID_BAD_TARGET driverbyte=DRIVER_OK
  3. Aug 22 20:13:55 serveur kernel: [22720.900083] sd 1:0:0:0: [sdb] CDB: Write(10): 2a 00 00 00 00 49 00 00 08 00
  4. Aug 22 20:13:55 serveur kernel: [22720.900088] end_request: I/O error, dev sdb, sector 73
  5. Aug 22 20:13:55 serveur kernel: [22720.900099] end_request: I/O error, dev sdb, sector 73
  6. Aug 22 20:13:55 serveur kernel: [22720.900109] raid5: Disk failure on sdb1, disabling device.
  7. Aug 22 20:13:55 serveur kernel: [22720.900133] sd 1:0:0:0: [sdb] Unhandled error code
  8. Aug 22 20:13:55 serveur kernel: [22720.900135] sd 1:0:0:0: [sdb] Result: hostbyte=DID_BAD_TARGET driverbyte=DRIVER_OK
  9. Aug 22 20:13:55 serveur kernel: [22720.900137] sd 1:0:0:0: [sdb] CDB: Read(10): 28 00 c4 52 be 47 00 00 08 00
  10. Aug 22 20:13:55 serveur kernel: [22720.900142] end_request: I/O error, dev sdb, sector 3293756999
  11. Aug 22 20:13:55 serveur kernel: [22720.981090]  disk 1, o:0, dev:sdb1
  12. Aug 22 20:13:55 serveur mdadm[1371]: Fail event detected on md device /dev/md0, component device /dev/sdb1
  13. Aug 22 20:57:41 serveur kernel: [    1.707618] sd 1:0:0:0: [sdb] 3907029168 512-byte logical blocks: (2.00 TB/1.81 TiB)
  14. Aug 22 20:57:41 serveur kernel: [    1.707656] sd 1:0:0:0: [sdb] Write Protect is off
  15. Aug 22 20:57:41 serveur kernel: [    1.707658] sd 1:0:0:0: [sdb] Mode Sense: 00 3a 00 00
  16. Aug 22 20:57:41 serveur kernel: [    1.707673] sd 1:0:0:0: [sdb] Write cache: enabled, read cache: enabled, doesn't support DPO or FUA
  17. Aug 22 20:57:41 serveur kernel: [    1.707786]  sdb:
  18. Aug 22 20:57:41 serveur kernel: [    1.735501]  sdb1
  19. Aug 22 20:57:41 serveur kernel: [    1.735684] sd 1:0:0:0: [sdb] Attached SCSI disk
  20. Aug 22 20:57:41 serveur kernel: [    3.105713] md: bind<sdb1>
  21. Aug 22 20:57:41 serveur kernel: [    3.106445] md: kicking non-fresh sdb1 from array!
  22. Aug 22 20:57:41 serveur kernel: [    3.106450] md: unbind<sdb1>
  23. Aug 22 20:57:41 serveur kernel: [    3.116044] md: export_rdev(sdb1)
  24. Aug 22 20:57:41 serveur kernel: [    3.382822] md: bind<sdb1>
  25. Aug 22 20:57:41 serveur kernel: [    3.383799] raid5: device sdb1 operational as raid disk 1
  26. Aug 22 20:57:41 serveur kernel: [    3.384215]  disk 1, o:1, dev:sdb1
  27. Aug 22 20:57:41 serveur kernel: [    3.384575] md: unbind<sdb1>
  28. Aug 22 20:57:41 serveur kernel: [    3.396037] md: export_rdev(sdb1)
  29. Aug 22 20:58:58 serveur kernel: [   87.109363] md: bind<sdb1>
  30. Aug 22 20:58:59 serveur kernel: [   87.384099]  disk 1, o:1, dev:sdb1
  31. Aug 22 21:22:28 serveur kernel: [ 1496.716736]  disk 1, o:1, dev:sdb1


 
Ça a l'air d'être une erreur de lecture sur un secteur.  
 
Cela peut venir d'ou a votre avis ? Vu que c'est un deuxième disque et, pas le même que la première fois, je me suis dit que ça pouvait peut-être plus venir d'autre chose, mais quoi ?
 
Merci de vos éclaircissements !!
Bonne soirée à vous.

Reply

Marsh Posté le 22-08-2011 à 21:37:19   

Reply

Marsh Posté le 22-08-2011 à 21:54:04    

Infos complémentaires :  
 
Niveau température, tout semble normal :  

Code :
  1. ~# hddtemp /dev/sd[a-d]
  2. /dev/sda: ST2000DL003-9VT166: 40°C
  3. /dev/sdb: ST2000DL003-9VT166: 40°C
  4. /dev/sdc: ST2000DL003-9VT166: 44°C
  5. /dev/sdd: ST2000DL003-9VT166: 41°C


 
Etat SMART des 4 disques :  
http://pastebin.com/vxyabVrs

Reply

Marsh Posté le 23-08-2011 à 20:02:08    

conf hard de ton serveur (cm/proc/controleurs avec à chaque fois marque/modèle) ?


Message édité par fighting_falcon le 23-08-2011 à 20:02:35

---------------
[mon feed]
Reply

Marsh Posté le 23-08-2011 à 21:35:06    

Carte mère : ASUS M4A78LT-M-LX
Processeur : AMD Athlon II X2 215
Contrôleur sata : AMD SB710
 
Par le plus grand des hasards, j'ai mis des cables sata non coudés et j'ai l'impression qu'ils forcent un peu quand on ferme le panneau latéral, ça pourrait pas venir de çà ?
 
Après je vois qu'un problème de carte mère. Donc soit SAV, soit achat d'une carte PCI avec ports Sata.
 

Reply

Marsh Posté le 30-08-2011 à 19:39:33    

effectivement, un câblage un peu branlant n'est pas trop recommandé ...
tes câbles sont de bonne qualité ?
 
donc si je comprends bien, tu utilises les ports sata de ta carte mère directement
 
faudrait s'assurer que y'ait pas de bugs dans le pilote correspondant aussi ...


---------------
[mon feed]
Reply

Sujets relatifs:

Leave a Replay

Make sure you enter the(*)required information where indicate.HTML code is not allowed