Surveillance temperature local serveurs

Surveillance temperature local serveurs - Infrastructures serveurs - Systèmes & Réseaux Pro

Marsh Posté le 22-08-2013 à 23:43:36    

Bonjour à tous,
 
Il y a peu de temps nous avons eu une panne de la climatisation principale dans notre salle serveurs (2 armoires serveurs, 1 armoire réseau).
La climatisation secondaire prévue n'a pas réussi à maintenir une température acceptable (43°C enregistrés au max) car elle avait été dimensionnée lorsque nous avions 3/4 serveurs ...
 
Nous sommes en train de faire le nécessaire afin de sécuriser notre installation cependant mon responsable et moi-même souhaitons mettre en place des alertes (SMS) pour nous prévenir en cas de problème car actuellement les alertes de température sont envoyées par des onduleurs Dell, grâce au module environnemental. Les mails n'étant pas lus lorsque nous dormons nous ne pouvons pas intervenir en cas de problème pendant la nuit !
 
Nous disposons d'un environnement de supervision Nagios / Centreon qui fait de la supervision active (check SNMP mais pas de traps) et peut gérer l'envoi d'alertes mail, SMS (ou déclenchement de scripts d'arrêt en dernier recours).
 
J'ai repéré une sonde IP qui semble convenir à notre besoin : http://www.sensorip.com/index.php/produits/sensor-ip-2
Je souhaite récupérer les valeurs température & humidité en SNMP, générer un graph pour le suivi et envoyer des alertes SMS en cas de dépassements de seuils.
 
Y a-t-il des personnes qui ont implémenté ce type de boitier avec Nagios ?
Je suis preneur de toute suggestion ou retour d'expérience sur des problématiques similaires.
 
Merci d'avance.


---------------
Feed-back
Reply

Marsh Posté le 22-08-2013 à 23:43:36   

Reply

Marsh Posté le 23-08-2013 à 08:50:14    

J'imagine que tu peux interroger le boitier en SNMP, de ce fait, tu peux scripter une sonde pour Nagios qui récupère la température.
 
C'est assez simple à faire, et il y a des exemples un peu partout sur le net.
 
Pour la partie SMS, je laisse la parole aux autres...


Message édité par still_at_work le 23-08-2013 à 08:50:50

---------------
In my bed, but still_at_work.
Reply

Marsh Posté le 23-08-2013 à 09:51:16    

Syslogng envoie un mail sur un serveur mail, le serveur mail forward en sms, simple comme bonjour.
Edith : ou Nagios envoie un mail sur un serveur mail, le serveur mail forward ...


Message édité par MysterieuseX le 23-08-2013 à 09:51:55
Reply

Marsh Posté le 23-08-2013 à 10:51:16    

que faire si l'infra est tombée parce que la température est trop élevé ?
 
qu'est ce qui tombe en premier et a quelle température ?
le disque dans un tiroir de baie, le tiroir, le(s) controleurs, les serveurs, les switchs, les routeurs ?
 
aura t on encore un element pour envoyer l'alerte ?
 
(c'est du vécu)
 
.....
recherches plutot une solution indépendante qui averti via un gsm

Reply

Marsh Posté le 23-08-2013 à 11:19:35    

papin44 a écrit :

que faire si l'infra est tombée parce que la température est trop élevé ?
qu'est ce qui tombe en premier et a quelle température ?
le disque dans un tiroir de baie, le tiroir, le(s) controleurs, les serveurs, les switchs, les routeurs ?
aura t on encore un element pour envoyer l'alerte ?
(c'est du vécu)
.....
recherches plutot une solution indépendante qui averti via un gsm


 
La solution de supervision est sur un cluster VMware redondé, il faudrait que je perde simultanément :
 - 2 serveurs (ESXI en HA)
 - 4 switch (coeur de réseau + réseau ISCSI)
 - les 2 contrôleurs de la baie EqualLogic
 - 2 onduleurs (qui sont sur 2 liaisons électriques différentes)
 - 2 liaisons internet (1 fibre + 1 lien cuivre de secours)
 - 2 firewalls NetAsq en HA
 - sonde environnementale + sondes serveurs (qui seront également configurées en secours)
 
L'objectif ici est bien de prévenir AVANT que la température ne soit critique, afin d'intervenir en astreinte sur site 24/7 (en 1h max).
Côté méthodologie : on refroidit la pièce à 20°C, on pense déclencher l'alerte à max 26°C et lancer un script d'arrêt global si on dépasse 35°C comme ça peu de risque de panne hardware due à la chaleur.
 
Le scénario de perte des 2 climatisations + supervision en même temps (bien qu'existant) a moins de chance de se produire qu'un incendie ou une inondation !
C'est pour cela que je souhaitais partir sur une solution qu'on puisse intégrer à Nagios plutôt que de mettre en place un système autonome (qui sera également plus cher). Toutefois je ne souhaite pas écarter de piste, as-tu des systèmes autonomes à me conseiller ?


Message édité par dam09fr le 23-08-2013 à 11:20:13

---------------
Feed-back
Reply

Marsh Posté le 23-08-2013 à 11:24:37    

tout le materiel est dans la meme salle ?
 
exemple :
 
http://www.netwalkerstore.com/PBSC [...] D=10392113

Reply

Marsh Posté le 23-08-2013 à 11:57:35    

papin44 a écrit :

tout le materiel est dans la meme salle ?


Malheureusement oui, nous ne disposons pour le moment pas d'une seconde salle ou d'un PRA sur site distant (projet à venir)...
Nous avons cependant des solutions de backup hors site afin d'assurer la sécurité de nos données en cas de sinistre local.
 
Edit : merci pour le lien je vais regarder ça en détail !


Message édité par dam09fr le 23-08-2013 à 11:57:56

---------------
Feed-back
Reply

Marsh Posté le 23-08-2013 à 13:00:00    

Chez nous, nous avons un boitier / Sonde en complément d'alerte mails.
 
Qui nous envoie des SMS, en cas de coupures de courant, hausse de la température, hausse de l'humidité de l'air.
 
Il faut une carte sim dedans. Le Boitier a une batterie en cas de coupure de courant. Et nous sommes alerté même si nos serveurs mails sont en rade.
 
Je peux regarder la référence si cela t'intéresse.

Reply

Marsh Posté le 23-08-2013 à 16:13:06    

tony83400 a écrit :

Chez nous, nous avons un boitier / Sonde en complément d'alerte mails.
Qui nous envoie des SMS, en cas de coupures de courant, hausse de la température, hausse de l'humidité de l'air.
Il faut une carte sim dedans. Le Boitier a une batterie en cas de coupure de courant. Et nous sommes alerté même si nos serveurs mails sont en rade.
Je peux regarder la référence si cela t'intéresse.


Si ça ne te dérange pas ça m'intéresse beaucoup !
Si tu te rappelle ou tu l'a acheté également ...
Merci d'avance;


---------------
Feed-back
Reply

Marsh Posté le 23-08-2013 à 17:43:51    

Çà n’envoie pas de SMS, mais ici j'ai un boîtier APC Netbotz pour contrôleur la température et l'humidité de ma salle info, ça marche bien.


---------------
Mario Kart for Ever
Reply

Marsh Posté le 23-08-2013 à 17:43:51   

Reply

Marsh Posté le 24-08-2013 à 09:01:59    

dam09fr a écrit :


Si ça ne te dérange pas ça m'intéresse beaucoup !
Si tu te rappelle ou tu l'a acheté également ...
Merci d'avance;

 

Je te dis cela lundi.

 

Je crois que c'était une petite boîte qui faisait ça. Par contre c'était pas donné à l'époque

Reply

Marsh Posté le 26-08-2013 à 12:43:25    

Reply

Marsh Posté le 26-08-2013 à 17:53:49    


Tout à fait !
Je vais faire le point avec mon chef pour voir si on met le budget dans une solution qui gère l'envoi de SMS directement ou si on passe par Nagios + script SMS.
De ce que j'ai pu en voir les solutions autonomes coutent au moins 500€ de plus mais bon on n'a rien sans rien !
 
J'ai également une autre piste : monter un serveur SMS directement dans le local serveurs (comme ça je peux le mutualiser avec d'autres besoins) !


---------------
Feed-back
Reply

Marsh Posté le 28-08-2013 à 13:47:03    

:hello:
 
Sinon tu as une solution pas cher que j'ai mis en place dans ma société :)
 
Je vois que tu as une Baie DELL, si tu possèdes un serveur DELL tu peux installer Server Administrator.  
Les serveurs possèdent des sondes de températures dont un Temp Ambiant.
 
Via Serveur administrator tu peux définir un seuil Normal, Warning et Critique, et avec Nagios tu peux récupérer cela très simplement :).
 
Ensuite pour la passerelle à toi de voir. Nous on avait juste demander à Nagios de nous envoyé un mail toutes les 3 mins si pas de changement d'état


---------------
|--Topic [ACH] [VDS]--|La vie est un phoenix qui renaît de ses larmes.
Reply

Marsh Posté le 28-08-2013 à 14:38:31    

tony83400 a écrit :

Chez nous, nous avons un boitier / Sonde en complément d'alerte mails.
 
Qui nous envoie des SMS, en cas de coupures de courant, hausse de la température, hausse de l'humidité de l'air.
 
Il faut une carte sim dedans. Le Boitier a une batterie en cas de coupure de courant. Et nous sommes alerté même si nos serveurs mails sont en rade.
 
Je peux regarder la référence si cela t'intéresse.


 
Chez nous, sonde aussi mais couplée à un contact électrique qui se déclenche en cas de franchissement d'un seuil de température.
 
Le contact est sur le système d'alarme.
 
Du coup, si la température dépasse le seuil, la société de télésurveillance nous appelle.

Reply

Marsh Posté le 29-08-2013 à 10:34:48    

blouskaille a écrit :

:hello:
Sinon tu as une solution pas cher que j'ai mis en place dans ma société :)
Je vois que tu as une Baie DELL, si tu possèdes un serveur DELL tu peux installer Server Administrator.  
Les serveurs possèdent des sondes de températures dont un Temp Ambiant.
Via Serveur administrator tu peux définir un seuil Normal, Warning et Critique, et avec Nagios tu peux récupérer cela très simplement :).
Ensuite pour la passerelle à toi de voir. Nous on avait juste demander à Nagios de nous envoyé un mail toutes les 3 mins si pas de changement d'état


J'ai bien étudié cette possibilité mais je préfèrerai avoir une solution matériellement indépendante.
L'une des raisons est que si tu dois éteindre le serveur, tu n'a plus de données !
 
Edit : par contre c'est la solution que je voudrais mettre en place (pour le moment) sur un autre de nos sites, est-ce que tu pourrais m'indiquer quelle sonde Nagios tu utilise pour récupérer la température ? En effet en SNMP je crois qu'il faut réaliser un traitement de la valeur récupérée ce qui n'est pas possible avec check_snmp ...


Message édité par dam09fr le 29-08-2013 à 10:40:41

---------------
Feed-back
Reply

Marsh Posté le 30-08-2013 à 12:51:42    

nous avons ce prestataire pour la surveillance industrielle

 

http://www.microlide.com/

 

édit: si tu es dans une grosse structure avec un service technique conséquent, ils ont probablement déjà un logiciel de 'GTC' qui surveille de nombreuses fonctions du batiment et averti par mail/téléphone/bipper en cas de problème

Message cité 1 fois
Message édité par fourbe2 le 30-08-2013 à 12:54:24
Reply

Marsh Posté le 30-08-2013 à 13:00:34    

fourbe2 a écrit :

nous avons ce prestataire pour la surveillance industrielle http://www.microlide.com/
édit: si tu es dans une grosse structure avec un service technique conséquent, ils ont probablement déjà un logiciel de 'GTC' qui surveille de nombreuses fonctions du batiment et averti par mail/téléphone/bipper en cas de problème


 
Je ne suis pas du tout dans un contexte "industriel" et mon service technique (hors informatique) est limité à 1 personne (qui en vaut bien 2 ou 3) !
Les locaux sont principalement des bureaux pour du personnel administratif donc pas de système de ce type d'installé.
Il y a bien une centrale d'alarme/incendie mais je ne modifierai pas sa configuration pour notre besoin.


---------------
Feed-back
Reply

Marsh Posté le 30-08-2013 à 13:44:29    

quand je dis industrielle, c'est au niveau du modèle économique.
as-tu au moins été voir le site ??
http://www.microlide.com/index.php?id=9&numprod=3

 
Citation :

Caracteristiques
Acquisition, enregistrement et surveillance autonomes et permanents des températures, contacts secs, hygrométries, pressions…
Intervalle de prise de mesure de 1 à plusieurs minutes paramétrable
Visualisation directe des données sur grand écran LCD sous forme de graphique
Enregistrement des données : sauvegarde pendant un an (intervalle de prise de mesure de 15 min)
Gestion des alarmes : 2 sorties relais pour la transmission
•    2 niveaux d’alarmes
•    2 sorties par contacts secs configurables
•    1 buzzer interne
Impression des données tableau et graphique
Batterie interne 6V 1H. Possibilité de mise en place d’une batterie de secours externe grande capacité.
1 port imprimante et 1 port série
Sondes : PT100 4 fils (capteurs précis et rallongeables) calibrées
Plage de mesure température : -40°C à +70°C
Précision : +/- 1°C
Transfert des données sur PC avec logiciel MINILog
Transfert des alarmes à distance par téléphone ou SMS
Accès sécurisé aux données depuis un PC distant via la ligne téléphonique

Message cité 1 fois
Message édité par fourbe2 le 30-08-2013 à 13:44:58
Reply

Marsh Posté le 02-09-2013 à 18:51:41    

fourbe2 a écrit :

quand je dis industrielle, c'est au niveau du modèle économique.
as-tu au moins été voir le site ??
http://www.microlide.com/index.php?id=9&numprod=3


 
Oui, oui, bien sur que je suis allé voir...
Je ne demande pas des conseils / avis pour ne pas en tenir compte.
 
J'ai mis l'adresse de côté et je prévoyais d'envoyer un mail pour avoir plus d'infos ainsi qu'une tarification !


---------------
Feed-back
Reply

Marsh Posté le 07-09-2013 à 10:43:41    

Dans ma boite, pour le monitoring on utilise une url de monitoring accessible sur internet qui est checkée toutes les minutes par un service à 30$ / mois, service qui nous envoie un SMS si l'url ne réponds pas ou lève une erreur http.
 
Ca lève donc une erreur en cas de coupure de jus, coupure réseau, serveur qui plante, etc ...


---------------
Aimer les femmes intelligentes est un plaisir de pédéraste. (Charles Baudelaire) - Vous vulgarisez :o (Jean-Kevin Dubois)
Reply

Marsh Posté le 07-09-2013 à 15:11:25    

philippe06 a écrit :

Dans ma boite, pour le monitoring on utilise une url de monitoring accessible sur internet qui est checkée toutes les minutes par un service à 30$ / mois, service qui nous envoie un SMS si l'url ne réponds pas ou lève une erreur http.
 
Ca lève donc une erreur en cas de coupure de jus, coupure réseau, serveur qui plante, etc ...


 
Ce type de service te permet de gérer les problèmes une fois que la panne est là ... l'objectif recherché c'est d'anticiper l'interruption et ses conséquences !


---------------
Feed-back
Reply

Marsh Posté le 07-09-2013 à 22:07:34    

dam09fr a écrit :

 

Ce type de service te permet de gérer les problèmes une fois que la panne est là ... l'objectif recherché c'est d'anticiper l'interruption et ses conséquences !

 

Pas nécessairement, il est possible de faire très facilement un script cgi / php qui check certains paramètres et lève une erreur 500 sur la base de ces paramètres. Il peut s'agir d'un seuil de température d'une machine.

 

Mais bon sonde + module gsm ca marche aussi, du moment que le module GSM capte suffisamment dans la salle blanche et qu'une SIM adaptée à cet usage a été insérée dans le module GSM.


Message édité par philippe06 le 07-09-2013 à 22:08:12

---------------
Aimer les femmes intelligentes est un plaisir de pédéraste. (Charles Baudelaire) - Vous vulgarisez :o (Jean-Kevin Dubois)
Reply

Marsh Posté le 08-09-2013 à 00:18:35    

Perso j' ai ce type de sonde au boulot .
 
J' ai écrit un script permettant de générer de beaux graphiques lol , mais personnellement je me suis jamais pensé sur l' envoi de sms .... uniquement des alertes mails . Je supervise également la température de nos blades hp via snmp ainsi que quelques serveurs blade , si tu as besoin d' aide , ca sera avec plaisir

Reply

Marsh Posté le    

Reply

Sujets relatifs:

Leave a Replay

Make sure you enter the(*)required information where indicate.HTML code is not allowed