xen ocfs2 et perte d'accès au partage iscsi

xen ocfs2 et perte d'accès au partage iscsi - Hardware - Linux et OS Alternatifs

Marsh Posté le 14-10-2009 à 22:45:26    

Bonjour à tous,
 
Depuis six moi maintenant que j'ai monté un cluster xen avec des machines virtuelles paravirtualisées sur un partage iscsi.
Je peux utiliser le live migration, les temps d'accès sont bon. L'accès au partage iscsi se fait via deux cartes réseaux en bonding, chacune
sur un réseau different afin de securiser l'accès au nas. Mais voila, je me suis rendu compte que des fois des kernel oops aparaissaient
concernant le file system ocfs2 ou bien carrément un reboot du serveur dom0. Quand ca ? Quand par exemple je fais une sauvegarde de
mes vm vers un autre nas ou bien quand je copie une vm. Bref, cela arrive quand l'accès iscsi est fortement solicité pendant un temps
assez long(environ supérieur à 30s). Je ne sais pas par ou commencer, apparement nous pouvons modifier les timeout iscsi mais rien de tout cela du
coté de xen. Je pense que le demon xen n'arrive plus à communiquer avec les machines virtuelles et du coup "l'enleve" de la xm list.
Qu-en pensez vous, avez vous déjà rencontrer ce genre de problème ?
Je precise que j'administrate aussi un cluster vmware et aucun probleme de ce coté la. Par contre le cluster vmware utilise des carte HBA en multipath
contrairement a xen.
 
Merci d'avance

Reply

Marsh Posté le 14-10-2009 à 22:45:26   

Reply

Marsh Posté le 19-10-2009 à 00:33:57    

bonjour,
 
c'est difficile de répondre à cette question comme ca.
 
Mais au sujet d'ocfs2 il faut savoir que le format est limité a 32 000 dossiers, une fois ce chiffre dépassé y a des freeze, le load average de la machine explose lors d'I/O sur la partoche.
 
Avec un find sur ma machine j'ai 40 000 dossiers la. Regarde de ce coté peut etre

Reply

Marsh Posté le 19-10-2009 à 20:20:05    

Perso, avec Xen, inutile d'utiliser du FS "clusterisé" : il n'y a pas de raisons d'avoir des accès concurrents.  
Perso, iSCSI + LVM + multipath = pas de soucis et ça avance bien (280 sur dbench)


---------------
Spécialiste du bear metal
Reply

Marsh Posté le 23-10-2009 à 12:46:47    

dam1330 : effectivement sur le disque iscsi il y a que des images de disques, sachant qu'elles contiennent des OS, il y a environ 40000 dossiers par images. Je ne sais pas comment cela est pris en compte au niveau FS. On dépasse vite les 32000 fichiers dans les fichiers images, ce qui est normal pour un os.
Parcontre c'est execement le cas que tu dis, lors d'un copier ou coller à partir de la partoche le loadavegrade explose et la machine reboot (cp prend 13% du cpu). Pas tout le temps, mais très souvent :
 

Code :
  1. PID USER      PR  NI  VIRT  RES  SHR S %CPU %MEM    TIME+  COMMAND                                                             
  2. 16891 root      20   0 13468  760  628 R    5  13   0:00.16 cp                                                                 
  3.   262 root      15  -5     0    0    0 S    1  0.0   0:22.78 kswapd0                                                             
  4. 3606 root      15  -5     0    0    0 S    1  0.0   0:01.48 ocfs2dc                                                             
  5. 16650 root      20   0     0    0    0 S    1  0.0   0:02.60 pdflush                                                             
  6. 3312 root      15  -5     0    0    0 S    0  0.0   1:34.05 scsi_wq_1


 
J'ai augmenter le timeout ocfs2 à cinq minutes mais rien n'y fait. Je pense de plus en plus à des cartes hba mais le loadaverage est quand même anormalement élevé. Ca ne devrait pas rebooter.
 
Plam : tu fais comment le live migration dans ton cas ?
 

Reply

Marsh Posté le 23-10-2009 à 13:28:14    

pourquoi tu mets pas du LVM sur ton iSCSI ?


---------------
uptime is for lousy system administrators what Viagra is for impotent people - mes unixeries - github me
Reply

Marsh Posté le 23-10-2009 à 13:52:56    

ouais des fichiers images c'est pas top.
 
Avec ocfs2 je peux monter à 80 de charge

Reply

Marsh Posté le 23-10-2009 à 14:07:54    

La live migration ne pose pas de soucis, pourquoi cette question ? Il n'y a jamais d'accès concurrent, le premier xen relache le disque avant que le deuxième le prenne. Pas besoin d'ocfs ! LVM ça me suffit largement dans mon cas, et c'est très rapide :)


---------------
Spécialiste du bear metal
Reply

Marsh Posté le 23-10-2009 à 14:21:44    

dam1330 a écrit :

ouais des fichiers images c'est pas top.
 
Avec ocfs2 je peux monter à 80 de charge


 Et la machine elle reboot pas ? C'est ça que je comprends pas pourquoi elle reboot ?
 
black_lord et Plam : ok pour lvm ou bien ext3 si pas d'extension du partage mais comment tu fais si tu crées une machine virtuelle sur le noeuds A pour que le noeud B la voit en live ?

Reply

Marsh Posté le 23-10-2009 à 14:26:21    

le noeud B ne monte la target iSCSI que si il en a besoin, donc jamais en même temps que le noeud A :spamafote:


---------------
uptime is for lousy system administrators what Viagra is for impotent people - mes unixeries - github me
Reply

Marsh Posté le 23-10-2009 à 18:20:12    

zit a écrit :


 Et la machine elle reboot pas ? C'est ça que je comprends pas pourquoi elle reboot ?
 
black_lord et Plam : ok pour lvm ou bien ext3 si pas d'extension du partage mais comment tu fais si tu crées une machine virtuelle sur le noeuds A pour que le noeud B la voit en live ?


 

black_lord a écrit :

le noeud B ne monte la target iSCSI que si il en a besoin, donc jamais en même temps que le noeud A :spamafote:


 
Exactement !


---------------
Spécialiste du bear metal
Reply

Marsh Posté le 23-10-2009 à 18:20:12   

Reply

Marsh Posté le 26-10-2009 à 10:21:03    

Plam a écrit :


 
Exactement !


ok je suppose que la solution est fiable mais ce n'est pas un vrai cluster. Comment faire du load balancing ? Comment démarrer une machine sur n'importe quelle noeud sans ce soucier de qui à accès au iscsi. ?
Bref que d'avantage avec un systeme de fichiers distribuées. Mais je pense que nous nous égarons du sujet.


Message édité par zit le 26-10-2009 à 10:46:22
Reply

Marsh Posté le 26-10-2009 à 21:10:23    

Une fois que ta une VM de lancée, pourquoi chercher à faire du load balancing ? Libre à toi de créer 20 VM pour load balancer du apache, avec des VM sur plein de machines physiques différentes ? (du coup tu fais aussi de la haute dispo).  
 
Faut pas oublier que les VM c'est facilement manipulable. Après, du partage de fichier c'est différent.


---------------
Spécialiste du bear metal
Reply

Marsh Posté le 13-01-2010 à 11:25:39    

Plam a écrit :

Une fois que ta une VM de lancée, pourquoi chercher à faire du load balancing ? Libre à toi de créer 20 VM pour load balancer du apache, avec des VM sur plein de machines physiques différentes ? (du coup tu fais aussi de la haute dispo).  
 
Faut pas oublier que les VM c'est facilement manipulable. Après, du partage de fichier c'est différent.


Si tu creais pleins de VM pour un  apache par exemple comment sur des machines physiques differentes, il y aura bien qu'une seule IP pour toute les machines donc il faut du load balancing ( a moins que je ne me trompe plam).
Pour le problème de reboot, il faut indiquer dans grub "noreboot" et le tour et joué ! Il y a quelque problème de charge lors des accès ISCI mais le serveur ne reboot pas ce qui est déjà une bonne chose.

Reply

Marsh Posté le 13-01-2010 à 12:33:06    

Une seul IP ? bah pas forcément (DNS avec plusieurs entrées)


---------------
Spécialiste du bear metal
Reply

Sujets relatifs:

Leave a Replay

Make sure you enter the(*)required information where indicate.HTML code is not allowed