Surveillance temperature local serveurs - Infrastructures serveurs - Systèmes & Réseaux Pro
Marsh Posté le 23-08-2013 à 08:50:14
J'imagine que tu peux interroger le boitier en SNMP, de ce fait, tu peux scripter une sonde pour Nagios qui récupère la température.
C'est assez simple à faire, et il y a des exemples un peu partout sur le net.
Pour la partie SMS, je laisse la parole aux autres...
Marsh Posté le 23-08-2013 à 09:51:16
Syslogng envoie un mail sur un serveur mail, le serveur mail forward en sms, simple comme bonjour.
Edith : ou Nagios envoie un mail sur un serveur mail, le serveur mail forward ...
Marsh Posté le 23-08-2013 à 10:51:16
que faire si l'infra est tombée parce que la température est trop élevé ?
qu'est ce qui tombe en premier et a quelle température ?
le disque dans un tiroir de baie, le tiroir, le(s) controleurs, les serveurs, les switchs, les routeurs ?
aura t on encore un element pour envoyer l'alerte ?
(c'est du vécu)
.....
recherches plutot une solution indépendante qui averti via un gsm
Marsh Posté le 23-08-2013 à 11:19:35
papin44 a écrit : que faire si l'infra est tombée parce que la température est trop élevé ? |
La solution de supervision est sur un cluster VMware redondé, il faudrait que je perde simultanément :
- 2 serveurs (ESXI en HA)
- 4 switch (coeur de réseau + réseau ISCSI)
- les 2 contrôleurs de la baie EqualLogic
- 2 onduleurs (qui sont sur 2 liaisons électriques différentes)
- 2 liaisons internet (1 fibre + 1 lien cuivre de secours)
- 2 firewalls NetAsq en HA
- sonde environnementale + sondes serveurs (qui seront également configurées en secours)
L'objectif ici est bien de prévenir AVANT que la température ne soit critique, afin d'intervenir en astreinte sur site 24/7 (en 1h max).
Côté méthodologie : on refroidit la pièce à 20°C, on pense déclencher l'alerte à max 26°C et lancer un script d'arrêt global si on dépasse 35°C comme ça peu de risque de panne hardware due à la chaleur.
Le scénario de perte des 2 climatisations + supervision en même temps (bien qu'existant) a moins de chance de se produire qu'un incendie ou une inondation !
C'est pour cela que je souhaitais partir sur une solution qu'on puisse intégrer à Nagios plutôt que de mettre en place un système autonome (qui sera également plus cher). Toutefois je ne souhaite pas écarter de piste, as-tu des systèmes autonomes à me conseiller ?
Marsh Posté le 23-08-2013 à 11:24:37
tout le materiel est dans la meme salle ?
exemple :
http://www.netwalkerstore.com/PBSC [...] D=10392113
Marsh Posté le 23-08-2013 à 11:57:35
papin44 a écrit : tout le materiel est dans la meme salle ? |
Malheureusement oui, nous ne disposons pour le moment pas d'une seconde salle ou d'un PRA sur site distant (projet à venir)...
Nous avons cependant des solutions de backup hors site afin d'assurer la sécurité de nos données en cas de sinistre local.
Edit : merci pour le lien je vais regarder ça en détail !
Marsh Posté le 23-08-2013 à 13:00:00
Chez nous, nous avons un boitier / Sonde en complément d'alerte mails.
Qui nous envoie des SMS, en cas de coupures de courant, hausse de la température, hausse de l'humidité de l'air.
Il faut une carte sim dedans. Le Boitier a une batterie en cas de coupure de courant. Et nous sommes alerté même si nos serveurs mails sont en rade.
Je peux regarder la référence si cela t'intéresse.
Marsh Posté le 23-08-2013 à 16:13:06
tony83400 a écrit : Chez nous, nous avons un boitier / Sonde en complément d'alerte mails. |
Si ça ne te dérange pas ça m'intéresse beaucoup !
Si tu te rappelle ou tu l'a acheté également ...
Merci d'avance;
Marsh Posté le 23-08-2013 à 17:43:51
Çà n’envoie pas de SMS, mais ici j'ai un boîtier APC Netbotz pour contrôleur la température et l'humidité de ma salle info, ça marche bien.
Marsh Posté le 24-08-2013 à 09:01:59
dam09fr a écrit :
|
Je te dis cela lundi.
Je crois que c'était une petite boîte qui faisait ça. Par contre c'était pas donné à l'époque
Marsh Posté le 26-08-2013 à 12:43:25
ReplyMarsh Posté le 26-08-2013 à 17:53:49
yazyaz a écrit : ce genre de boitier ? |
Tout à fait !
Je vais faire le point avec mon chef pour voir si on met le budget dans une solution qui gère l'envoi de SMS directement ou si on passe par Nagios + script SMS.
De ce que j'ai pu en voir les solutions autonomes coutent au moins 500€ de plus mais bon on n'a rien sans rien !
J'ai également une autre piste : monter un serveur SMS directement dans le local serveurs (comme ça je peux le mutualiser avec d'autres besoins) !
Marsh Posté le 28-08-2013 à 13:47:03
Sinon tu as une solution pas cher que j'ai mis en place dans ma société
Je vois que tu as une Baie DELL, si tu possèdes un serveur DELL tu peux installer Server Administrator.
Les serveurs possèdent des sondes de températures dont un Temp Ambiant.
Via Serveur administrator tu peux définir un seuil Normal, Warning et Critique, et avec Nagios tu peux récupérer cela très simplement .
Ensuite pour la passerelle à toi de voir. Nous on avait juste demander à Nagios de nous envoyé un mail toutes les 3 mins si pas de changement d'état
Marsh Posté le 28-08-2013 à 14:38:31
tony83400 a écrit : Chez nous, nous avons un boitier / Sonde en complément d'alerte mails. |
Chez nous, sonde aussi mais couplée à un contact électrique qui se déclenche en cas de franchissement d'un seuil de température.
Le contact est sur le système d'alarme.
Du coup, si la température dépasse le seuil, la société de télésurveillance nous appelle.
Marsh Posté le 29-08-2013 à 10:34:48
blouskaille a écrit : |
J'ai bien étudié cette possibilité mais je préfèrerai avoir une solution matériellement indépendante.
L'une des raisons est que si tu dois éteindre le serveur, tu n'a plus de données !
Edit : par contre c'est la solution que je voudrais mettre en place (pour le moment) sur un autre de nos sites, est-ce que tu pourrais m'indiquer quelle sonde Nagios tu utilise pour récupérer la température ? En effet en SNMP je crois qu'il faut réaliser un traitement de la valeur récupérée ce qui n'est pas possible avec check_snmp ...
Marsh Posté le 30-08-2013 à 12:51:42
nous avons ce prestataire pour la surveillance industrielle
édit: si tu es dans une grosse structure avec un service technique conséquent, ils ont probablement déjà un logiciel de 'GTC' qui surveille de nombreuses fonctions du batiment et averti par mail/téléphone/bipper en cas de problème
Marsh Posté le 30-08-2013 à 13:00:34
fourbe2 a écrit : nous avons ce prestataire pour la surveillance industrielle http://www.microlide.com/ |
Je ne suis pas du tout dans un contexte "industriel" et mon service technique (hors informatique) est limité à 1 personne (qui en vaut bien 2 ou 3) !
Les locaux sont principalement des bureaux pour du personnel administratif donc pas de système de ce type d'installé.
Il y a bien une centrale d'alarme/incendie mais je ne modifierai pas sa configuration pour notre besoin.
Marsh Posté le 30-08-2013 à 13:44:29
quand je dis industrielle, c'est au niveau du modèle économique.
as-tu au moins été voir le site ??
http://www.microlide.com/index.php?id=9&numprod=3
Citation : Caracteristiques |
Marsh Posté le 02-09-2013 à 18:51:41
fourbe2 a écrit : quand je dis industrielle, c'est au niveau du modèle économique. |
Oui, oui, bien sur que je suis allé voir...
Je ne demande pas des conseils / avis pour ne pas en tenir compte.
J'ai mis l'adresse de côté et je prévoyais d'envoyer un mail pour avoir plus d'infos ainsi qu'une tarification !
Marsh Posté le 07-09-2013 à 10:43:41
Dans ma boite, pour le monitoring on utilise une url de monitoring accessible sur internet qui est checkée toutes les minutes par un service à 30$ / mois, service qui nous envoie un SMS si l'url ne réponds pas ou lève une erreur http.
Ca lève donc une erreur en cas de coupure de jus, coupure réseau, serveur qui plante, etc ...
Marsh Posté le 07-09-2013 à 15:11:25
philippe06 a écrit : Dans ma boite, pour le monitoring on utilise une url de monitoring accessible sur internet qui est checkée toutes les minutes par un service à 30$ / mois, service qui nous envoie un SMS si l'url ne réponds pas ou lève une erreur http. |
Ce type de service te permet de gérer les problèmes une fois que la panne est là ... l'objectif recherché c'est d'anticiper l'interruption et ses conséquences !
Marsh Posté le 07-09-2013 à 22:07:34
dam09fr a écrit : Ce type de service te permet de gérer les problèmes une fois que la panne est là ... l'objectif recherché c'est d'anticiper l'interruption et ses conséquences ! |
Pas nécessairement, il est possible de faire très facilement un script cgi / php qui check certains paramètres et lève une erreur 500 sur la base de ces paramètres. Il peut s'agir d'un seuil de température d'une machine.
Mais bon sonde + module gsm ca marche aussi, du moment que le module GSM capte suffisamment dans la salle blanche et qu'une SIM adaptée à cet usage a été insérée dans le module GSM.
Marsh Posté le 08-09-2013 à 00:18:35
Perso j' ai ce type de sonde au boulot .
J' ai écrit un script permettant de générer de beaux graphiques lol , mais personnellement je me suis jamais pensé sur l' envoi de sms .... uniquement des alertes mails . Je supervise également la température de nos blades hp via snmp ainsi que quelques serveurs blade , si tu as besoin d' aide , ca sera avec plaisir
Marsh Posté le 22-08-2013 à 23:43:36
Bonjour à tous,
Il y a peu de temps nous avons eu une panne de la climatisation principale dans notre salle serveurs (2 armoires serveurs, 1 armoire réseau).
La climatisation secondaire prévue n'a pas réussi à maintenir une température acceptable (43°C enregistrés au max) car elle avait été dimensionnée lorsque nous avions 3/4 serveurs ...
Nous sommes en train de faire le nécessaire afin de sécuriser notre installation cependant mon responsable et moi-même souhaitons mettre en place des alertes (SMS) pour nous prévenir en cas de problème car actuellement les alertes de température sont envoyées par des onduleurs Dell, grâce au module environnemental. Les mails n'étant pas lus lorsque nous dormons nous ne pouvons pas intervenir en cas de problème pendant la nuit !
Nous disposons d'un environnement de supervision Nagios / Centreon qui fait de la supervision active (check SNMP mais pas de traps) et peut gérer l'envoi d'alertes mail, SMS (ou déclenchement de scripts d'arrêt en dernier recours).
J'ai repéré une sonde IP qui semble convenir à notre besoin : http://www.sensorip.com/index.php/produits/sensor-ip-2
Je souhaite récupérer les valeurs température & humidité en SNMP, générer un graph pour le suivi et envoyer des alertes SMS en cas de dépassements de seuils.
Y a-t-il des personnes qui ont implémenté ce type de boitier avec Nagios ?
Je suis preneur de toute suggestion ou retour d'expérience sur des problématiques similaires.
Merci d'avance.
---------------
Feed-back