grop plantage serveur HELP fedora/Samba

grop plantage serveur HELP fedora/Samba - Installation - Linux et OS Alternatifs

Marsh Posté le 21-07-2005 à 08:38:17    

bonjour,
 
ce matin gros plantage de mon serveur fedora/samba...
 
voici la partie de /var/log/message interessante :
 

Jul 20 16:58:32 samba kernel: Unable to handle kernel paging request at virtual address 001000ec
Jul 20 16:58:32 samba kernel:  printing eip:
Jul 20 16:58:32 samba kernel: 02178e92
Jul 20 16:58:32 samba kernel: *pde = 00004001
Jul 20 16:58:32 samba kernel: Oops: 0000 [#1]
Jul 20 16:58:32 samba kernel: SMP  
Jul 20 16:58:32 samba kernel: Modules linked in: sg i2c_dev i2c_core dm_mod button battery ac md5 ipv6 ohci_hcd cfi_probe gen_probe scb2_flash mtdcore chipreg map_funcs e100 mii e1000 floppy st ext3 jbd DAC960 aic7xxx sd_mod scsi_mod
Jul 20 16:58:32 samba kernel: CPU:    1
Jul 20 16:58:32 samba kernel: EIP:    0060:[<02178e92>]    Not tainted VLI
Jul 20 16:58:32 samba kernel: EFLAGS: 00010206   (2.6.9-1.667smp)  
Jul 20 16:58:32 samba kernel: EIP is at __mb_cache_entry_find+0x21/0x55
Jul 20 16:58:32 samba kernel: eax: 00100100   ebx: 00100100   ecx: 00000000   edx: 001000dc
Jul 20 16:58:32 samba kernel: esi: 61eb88e8   edi: 5e2bed80   ebp: 001e273c   esp: 2062ad60
Jul 20 16:58:32 samba winbindd[3511]: [2005/07/20 16:58:32, 0] tdb/tdbutil.c:tdb_log(725)  
Jul 20 16:58:32 samba kernel: ds: 007b   es: 007b   ss: 0068
Jul 20 16:58:32 samba winbindd[3511]:   tdb(/var/cache/samba/netsamlogon_cache.tdb): rec_free_read bad magic 0x42424242 at offset=25444  
Jul 20 16:58:32 samba kernel: Process smbd (pid: 16289, threadinfo=2062a000 task=556982b0)
Jul 20 16:58:32 samba kernel: Stack: 00000000 61eb88e8 00000000 61c59100 08045bfc 02178f63 5e2bed80 001e273c  
Jul 20 16:58:32 samba kernel:        5e2bed80 2bbfb904 08045bfc 1f028998 001e273c 628e204c 001e273c 51606000  
Jul 20 16:58:32 samba kernel:        2c1755a4 00000000 51606000 51607000 1f028998 628e1780 2062add0 00000000  
Jul 20 16:58:32 samba kernel: Call Trace:
Jul 20 16:58:32 samba kernel:  [<02178f63>] mb_cache_entry_find_next+0x4a/0xdf
Jul 20 16:58:32 samba kernel:  [<628e204c>] ext3_xattr_cache_find+0x144/0x152 [ext3]
Jul 20 16:58:32 samba kernel:  [<628e1780>] ext3_xattr_set_handle2+0x46/0x417 [ext3]
Jul 20 16:58:32 samba kernel:  [<628e16ed>] ext3_xattr_set_handle+0x6db/0x728 [ext3]
Jul 20 16:58:33 samba kernel:  [<628d8b94>] ext3_do_update_inode+0x2f7/0x31e [ext3]
Jul 20 16:58:33 samba kernel:  [<628e28f1>] ext3_set_acl+0x106/0x19d [ext3]
Jul 20 16:58:33 samba kernel:  [<628e2be4>] ext3_init_acl+0x100/0x136 [ext3]
Jul 20 16:58:33 samba kernel:  [<628d5b1a>] ext3_new_inode+0x5e4/0x685 [ext3]
Jul 20 16:58:33 samba kernel:  [<628db344>] ext3_create+0x52/0xb3 [ext3]
Jul 20 16:58:33 samba kernel:  [<021601cb>] vfs_create+0xb8/0xef
Jul 20 16:58:33 samba kernel:  [<02160593>] open_namei+0x177/0x5b8
Jul 20 16:58:33 samba kernel:  [<0215320b>] filp_open+0x23/0x3c
Jul 20 16:58:33 samba kernel:  [<0215351d>] sys_open+0x31/0x7d
Jul 20 16:58:33 samba kernel: Code: <3>Debug: sleeping function called from invalid context at include/linux/rwsem.h:43
Jul 20 16:58:33 samba kernel: in_atomic():0[expected: 0], irqs_disabled():1
Jul 20 16:58:33 samba kernel:  [<0211dbf3>] __might_sleep+0x7d/0x8a
Jul 20 16:58:34 samba kernel:  [<0214edd5>] rw_vm+0xe5/0x28c
Jul 20 16:58:34 samba kernel:  [<02178e67>] mb_cache_entry_get+0x7f/0x89
Jul 20 16:58:34 samba kernel:  [<02178e67>] mb_cache_entry_get+0x7f/0x89
Jul 20 16:58:34 samba kernel:  [<0214f239>] get_user_size+0x30/0x57
Jul 20 16:58:34 samba kernel:  [<02178e67>] mb_cache_entry_get+0x7f/0x89
Jul 20 16:58:34 samba kernel:  [<021061c4>] show_registers+0x115/0x16c
Jul 20 16:58:34 samba kernel:  [<0210635b>] die+0xdb/0x16b
Jul 20 16:58:34 samba kernel:  [<0212028c>] vprintk+0x136/0x14a
Jul 20 16:58:34 samba kernel:  [<02119997>] do_page_fault+0x421/0x5e7
Jul 20 16:58:34 samba kernel:  [<02178e92>] __mb_cache_entry_find+0x21/0x55
Jul 20 16:58:34 samba kernel:  [<02155e2a>] bh_lru_install+0xa9/0xb1
Jul 20 16:58:34 samba kernel:  [<022b7b17>] __cond_resched+0x14/0x39
Jul 20 16:58:34 samba kernel:  [<02155f16>] __getblk+0x2b/0x49
Jul 20 16:58:34 samba kernel:  [<628d6a32>] ext3_getblk+0xb4/0x1fc [ext3]
Jul 20 16:58:35 samba kernel:  [<02119576>] do_page_fault+0x0/0x5e7
Jul 20 16:58:35 samba kernel:  [<02178e92>] __mb_cache_entry_find+0x21/0x55
Jul 20 16:58:35 samba kernel:  [<02178f63>] mb_cache_entry_find_next+0x4a/0xdf
Jul 20 16:58:35 samba kernel:  [<628e204c>] ext3_xattr_cache_find+0x144/0x152 [ext3]
Jul 20 16:58:35 samba kernel:  [<628e1780>] ext3_xattr_set_handle2+0x46/0x417 [ext3]
Jul 20 16:58:35 samba kernel:  [<628e16ed>] ext3_xattr_set_handle+0x6db/0x728 [ext3]
Jul 20 16:58:35 samba kernel:  [<628d8b94>] ext3_do_update_inode+0x2f7/0x31e [ext3]
Jul 20 16:58:35 samba kernel:  [<628e28f1>] ext3_set_acl+0x106/0x19d [ext3]
Jul 20 16:58:35 samba kernel:  [<628e2be4>] ext3_init_acl+0x100/0x136 [ext3]
Jul 20 16:58:35 samba kernel:  [<628d5b1a>] ext3_new_inode+0x5e4/0x685 [ext3]
Jul 20 16:58:35 samba kernel:  [<628db344>] ext3_create+0x52/0xb3 [ext3]
Jul 20 16:58:35 samba kernel:  [<021601cb>] vfs_create+0xb8/0xef
Jul 20 16:58:35 samba kernel:  [<02160593>] open_namei+0x177/0x5b8
Jul 20 16:58:36 samba kernel:  [<0215320b>] filp_open+0x23/0x3c
Jul 20 16:58:36 samba kernel:  [<0215351d>] sys_open+0x31/0x7d
Jul 20 16:58:36 samba kernel:  Bad EIP value.
Jul 20 16:59:34 samba winbindd[3511]: [2005/07/20 16:59:34, 0] tdb/tdbutil.c:tdb_log(725)  
Jul 20 16:59:34 samba winbindd[3511]:   tdb(/var/cache/samba/netsamlogon_cache.tdb): rec_free_read bad magic 0x42424242 at offset=25444  
Jul 20 16:59:43 samba smbd[16294]: [2005/07/20 16:59:43, 0] lib/util_sock.c:get_peer_addr(1150)  
Jul 20 16:59:43 samba smbd[16294]:   getpeername failed. Error was Transport endpoint is not connected  
Jul 20 16:59:43 samba smbd[16294]: [2005/07/20 16:59:43, 0] lib/util_sock.c:get_peer_addr(1150)  
Jul 20 16:59:43 samba smbd[16294]:   getpeername failed. Error was Transport endpoint is not connected  
Jul 20 16:59:43 samba smbd[16294]: [2005/07/20 16:59:43, 0] lib/access.c:check_access(328)  
Jul 20 16:59:43 samba smbd[16294]: [2005/07/20 16:59:43, 0] lib/util_sock.c:get_peer_addr(1150)  
Jul 20 16:59:43 samba smbd[16294]:   getpeername failed. Error was Transport endpoint is not connected  
Jul 20 16:59:43 samba smbd[16294]:   Denied connection from  (0.0.0.0)  
Jul 20 16:59:43 samba smbd[16294]: [2005/07/20 16:59:43, 0] lib/util_sock.c:get_peer_addr(1150)  
Jul 20 16:59:43 samba smbd[16294]:   getpeername failed. Error was Transport endpoint is not connected  
Jul 20 16:59:43 samba smbd[16294]:   Connection denied from 0.0.0.0  
Jul 20 16:59:43 samba smbd[16294]: [2005/07/20 16:59:43, 0] lib/util_sock.c:write_socket_data(430)  
Jul 20 16:59:43 samba smbd[16294]:   write_socket_data: write failure. Error = Connection reset by peer  
Jul 20 16:59:43 samba winbindd[3511]: [2005/07/20 16:59:43, 0] tdb/tdbutil.c:tdb_log(725)  
Jul 20 16:59:43 samba smbd[16294]: [2005/07/20 16:59:43, 0] lib/util_sock.c:write_socket(455)  
Jul 20 16:59:43 samba winbindd[3511]:   tdb(/var/cache/samba/netsamlogon_cache.tdb): rec_free_read bad magic 0x42424242 at offset=25444  
Jul 20 16:59:43 samba smbd[16294]:   write_socket: Error writing 5 bytes to socket 5: ERRNO = Connection reset by peer  
Jul 20 16:59:44 samba smbd[16294]: [2005/07/20 16:59:44, 0] lib/util_sock.c:send_smb(647)  
Jul 20 16:59:44 samba smbd[16294]:   Error writing 5 bytes to client. -1. (Connection reset by peer)  
Jul 20 16:59:48 samba smbd[16297]: [2005/07/20 16:59:48, 0] lib/util_sock.c:get_peer_addr(1150)  
Jul 20 16:59:48 samba smbd[16297]:   getpeername failed. Error was Transport endpoint is not connected  
Jul 20 16:59:48 samba smbd[16297]: [2005/07/20 16:59:48, 0] lib/util_sock.c:get_peer_addr(1150)  
Jul 20 16:59:48 samba smbd[16297]:   getpeername failed. Error was Transport endpoint is not connected  
Jul 20 16:59:48 samba smbd[16297]: [2005/07/20 16:59:48, 0] lib/access.c:check_access(328)  
Jul 20 16:59:48 samba smbd[16297]: [2005/07/20 16:59:48, 0] lib/util_sock.c:get_peer_addr(1150)  
Jul 20 16:59:48 samba smbd[16297]:   getpeername failed. Error was Transport endpoint is not connected


 
de plus dans le logwatch d'il i a quelques jours voila ce que j'ai vu :

WARNING:  Kernel Errors Present
   (scsi2:A:6:0): parity error detected in Comm...:  1 Time(s)
   (scsi2:A:6:0): parity error detected in Data...:  2 Time(s)
   (scsi2:A:6:0): parity error detected in Mess...:  1 Time(s)
   vesafb: probe of vesafb0 failed with error -6...:  1 Time(s)


 
et aussi ca :

WARNING:  Kernel Errors Present
   DAC960#0:          Errors - Parity: 0, So...:  10 Time(s)
   vesafb: probe of vesafb0 failed with error -6...:  4 Time(s)


 
J'ai fait un memtest durant toute une nuit ... 7pass zero pb.J'ai mis a jour le logiciel samba.
 
Lors d'un plantage tout le serveur est crashé, plus de console, plus de ping plus rien.
 
Olivier

Reply

Marsh Posté le 21-07-2005 à 08:38:17   

Reply

Marsh Posté le 01-08-2005 à 09:40:25    

aucune idées ? pas meme des betises ?

Reply

Marsh Posté le 01-08-2005 à 10:28:49    

De toute évidence, t as un probleme hardware.
 
Maintenant je sais pas si le memtest est bon, c est quelle version?
 
Tes disques sont ok aussi? Des erreurs de pagination ca peut arriver a partir d une partoche swap sur un disque...
 
C est quelle unité sur scsi2:A:6:0? Un disque j imagine? Y a quoi dessus?
 
Une recompilation de noyau avec des sources plus récentes a changé qqc?

Reply

Marsh Posté le 03-08-2005 à 12:11:35    

salut,
 
excuse moi pour le temps de reponse mais j'etais completement taquet ces 2 derniers jours ... et comme ca ne plantait plus ...
 
-Ma version de memtest est la 3.2, par contre un truc me gene c'est mis ECC: disabled, ca veut dire koi ca ? que l'ECC est disable sous memtest ou disable tout le temps ?
-J'ai fait un fsck.ext3 de mes disques sans pb, pas d'erreur sur le raid.
-Voici l'organisation de mes disques. J'ai aussi un autre raid sur /dev/rd/c0dO, partition /Samba


Fdisk:
Peripherique Boot      Start         End      Blocks   Id  System
/dev/rd/c0d1p1   *           1          25      200781   83  Linux
/dev/rd/c0d1p2              26         471     3582495   83  Linux
/dev/rd/c0d1p3             472         726     2048287+  82  Linux swap
/dev/rd/c0d1p4             727        2187    11735482+   5  Extended
/dev/rd/c0d1p5             727        1746     8193118+  83  Linux
/dev/rd/c0d1p6            1747        1937     1534176   83  Linux
 
 
bash-3.00# mount
/dev/rd/c0d1p2 on / type ext3 (rw)
none on /proc type proc (rw)
none on /sys type sysfs (rw)
none on /dev/pts type devpts (rw,gid=5,mode=620)
usbfs on /proc/bus/usb type usbfs (rw)
/dev/rd/c0d0p1 on /Samba type ext3 (rw,acl)
/dev/rd/c0d1p1 on /boot type ext3 (rw)
none on /dev/shm type tmpfs (rw)
/dev/rd/c0d1p5 on /opt type ext3 (rw)
/dev/rd/c0d1p6 on /var type ext3 (rw)
none on /proc/sys/fs/binfmt_misc type binfmt_misc (rw)


 
J'ai tenté de recompiler le noyau. En dernier recours.
L'idée de la swap defectueuse me plait bien, comment puis-je vérifier cette partition la ? et faire un test surface disque ?
En laissant le serveur fonctionnel evidement, sinon c trop facile ;-)
 
Olivier

Reply

Marsh Posté le 03-08-2005 à 12:16:26    

Tu peux demonter ton fichier swap sur le disque. C est pas recommandé, mais au moins, tu verras si ca pourrait venir de la ou pas.
 
Ne le fais que si tu es a l aise en memoire ram.
 
Ca se fait via swapoff.
 
ECC: disabled dans memtest, ca veut dire qu il fait ses tests sans ECC. Pour l activer, c est dans les options de memtest, mais soit sur avant de le faire que ton matériel le supporte.

Reply

Sujets relatifs:

Leave a Replay

Make sure you enter the(*)required information where indicate.HTML code is not allowed