Supervision Hardware des disques

Supervision Hardware des disques - Linux et OS Alternatifs

Marsh Posté le 18-07-2005 à 10:31:09    

Salut à tous,
 
Je voudrais savoir ce que vous utilisez pour surveiller l'état de vos disques dur. En gros si il y en a un qui est en panne etc ...
Les serveurs sont des HP DL380.
 
Merci d'avance.
 


---------------
"Every solution breeds new problems"
Reply

Marsh Posté le 18-07-2005 à 10:31:09   

Reply

Marsh Posté le 18-07-2005 à 10:33:08    

commande :
smartctl
et normalement ton serveur doit avoir une interface de supervision (démarrer/arrêter la machine, affichage de l'écran...) et il indique aussi l'état des disques durs.


Message édité par jlighty le 18-07-2005 à 10:34:34
Reply

Marsh Posté le 18-07-2005 à 10:48:22    

ben les agents Insight manager sont installés et remontent des infos dans le EventLog. Les machines à superviser sont sous Windows 2000. La machine en charge de la supervision est une RHEL 3 avec Nagios.
La seule possibilité que j'ai trouvé pour l'instant est de superviser les disques en utilisant le EventLog et l'agent NC_Net.
 
 
 


---------------
"Every solution breeds new problems"
Reply

Marsh Posté le 18-07-2005 à 10:58:49    

Ah oui, j'avais installé sous Linux un agent SNMP de chez HP, grâce à lui il me retournait les différentes informations sur l'état des disques durs.
PS: ton serveur ne tourne pas sous Windows  ?

Reply

Marsh Posté le 18-07-2005 à 11:05:32    

Les serveurs à superviser sont sous windows mais le serveur de supervision est sous RedHat Enterprise 3.
C'est bien ce qu'il me semblait pour l'agent... mais il semblerait que ca ne fonctionne plus de la même façon depuis le version 7 de insight manager.


---------------
"Every solution breeds new problems"
Reply

Marsh Posté le 18-07-2005 à 11:10:06    

On avait qu'un seul serveur à superviser donc on passait naturellement par Insight manager du serveur et l'agent SNMP nous retournait les infos sur l'état du système RAID.
Si ta supervision ne marche plus correctement, le seul moyen est de récupérer les infos SNMP et de concevoir une interface simple pour mettre en forme les données.


Message édité par jlighty le 18-07-2005 à 11:10:23
Reply

Marsh Posté le 19-07-2005 à 15:14:23    

Bon j'ai réussi à superviser l'état des disques...
Donc j'ai utilisé l'agent fourni par HP et je l'ai configuré pour envoyer des traps snmp lorsqu'il y a un pb. Ensuite sur le serveur Nagios j'ai configuré snmptt qui permet de récupérer les traps et d'invoquer un script en fonction de la nature du trap.  
Ensuite tout ca est envoyé à un nsca qui affiche ca dans Nagios.
C'est un peu l'usine à Gaz mais ca marche bien.


---------------
"Every solution breeds new problems"
Reply

Marsh Posté le 19-07-2005 à 19:57:25    

Je comprend pas trop pourquoi tu as un NSCA après snmptt.
 
Tu peux définir un check passif par host dans Nagios. Ensuite tu configures snmptt pour qu'il execute un submit_check_result avec les paramètres qui vont bien après réception d'une trap snmp

Reply

Marsh Posté le 20-07-2005 à 14:30:18    

Sauf erreur de ma part, submit_check_result utilise nsca pour envoyer ses informations au démon nsca qui tourne sur la machine Nagios.


---------------
"Every solution breeds new problems"
Reply

Marsh Posté le 20-07-2005 à 14:34:13    

Pour être plus clair voici un extrait du fichier snmptt.conf :
 

Code :
  1. EVENT cpqDa6LogDrvStatusChange .1.3.6.1.4.1.232.0.3034 "Status Events" CRITICAL
  2. FORMAT Logical Drive Status Change: Status is now $6.
  3. EXEC /usr/local/nagios/libexec/eventhandlers/submit_check_result $r RAID 1 "Logical Drive Status Change: Status is now $6"
  4. SDESC
  5. Logical Drive Status Change.
  6. This trap signifies that the agent has detected a change in the
  7. status of a drive array logical drive.  The variable
  8. cpqDaLogDrvStatus indicates the current logical drive status.
  9. Variables:
  10.   1: sysName
  11.   2: cpqHoTrapFlags
  12.   3: cpqDaCntlrHwLocation
  13.   4: cpqDaLogDrvCntlrIndex
  14.   5: cpqDaLogDrvIndex
  15.   6: cpqDaLogDrvStatus
  16. EDESC


 
et le contenu du script check_submit_result
 

Code :
  1. #!/bin/sh
  2. # Arguments
  3. #       $1 = name of host in service definition
  4. #       $2 = name/description of service in service definition
  5. #       $3 = return code
  6. #       $4 = output
  7. /bin/echo -e "$1\t$2\t$3\t$4\n" | /usr/local/nagios/nsca/send_nsca localhost -c /usr/local/nagios/nsca/send_nsca.cfg


 


---------------
"Every solution breeds new problems"
Reply

Marsh Posté le 20-07-2005 à 14:34:13   

Reply

Marsh Posté le 21-07-2005 à 00:32:42    

Salut
Tu m'a fais douter :)
 
NSCA est utile si tu veux soumettre des resultats de check passif d'host distant.
Or en l'occurence tu es en local : tu n'as pas besoin de passer par le daemon nsca pour soumettre le résultat.
 
 
Le submit_check_result livré avec le package debian (sans les commentaires) :  
 

Code :
  1. echocmd="/bin/echo"
  2. CommandFile="/var/run/nagios/nagios.cmd"
  3. datetime=`date +%s`
  4. cmdline="[$datetime] PROCESS_SERVICE_CHECK_RESULT;$1;$2;$3;$4"
  5. `$echocmd $cmdline >> $CommandFile`


Reply

Marsh Posté le 21-07-2005 à 10:23:49    

;-)
 
A ben forcément j'ai pas regardé dans la bonne archive ... je me suis limité aux plugins mais dnas les archives de Nagios y a un dossier contrib effectivement.
Ca me paraissait bizarre mais dans le doute j'ai utilisé NSCA. Bon ben c'est cool ca va faire une couche en moins dans mon usine à gaz :-)
 
Bonne journée.
 


---------------
"Every solution breeds new problems"
Reply

Sujets relatifs:

Leave a Replay

Make sure you enter the(*)required information where indicate.HTML code is not allowed