sauvegarde infra avec 8 To de données et 80 serveurs

sauvegarde infra avec 8 To de données et 80 serveurs - Stockage - Systèmes & Réseaux Pro

Marsh Posté le 07-12-2010 à 12:15:54    

Bonjour voilà j'ai des questions sur le backup de notre  infra j'ai un peu la tête dans le guidon et je manque de recul.
Nous avons des serveurs physique et virtuel (4 hôtes ESX, 80 vm dont des poste de travail, sinon serveur TFS, SharePoint, etc …).
 
 
12  serveurs physiques : un DC, un serveur de périph, => 850 Go au total à l’heure actuelle
80 machines virtuelles sur une baie DAS dell md1000, géré par un serveur Nexenta : environ 7.2To de données.
 
Il me faudrait sauvegarder tous ça l’objectif de la direction  j+1 en cas de petit problème : virus détruisant la config d’une machine, serveur hors garantie HS etc ….
Et 4 jours en cas de désastre : incendie, dégâts des eaux, etc …
 
Moi je serais parti sur des bandes LTO4 ou 5 avec un robot et GFS mais mon supérieur ne veut pas de bande et backuper sur un NAS, et si possible mettre un 2 eme NAS chez un hébergeur.
 
Vous auriez fait quoi comment et avec quoi mais grossièrement hein ! je ne vous demande pas une étude complète:).
 
 
Merci par avance.


---------------
si un jour on te reproche que ton travail n'est pas celui d'un professionel . dit toi bien que se sont des professionels qui on construit le titanic et des amateurs l'arche de noë...
Reply

Marsh Posté le 07-12-2010 à 12:15:54   

Reply

Marsh Posté le 07-12-2010 à 15:01:23    

je pense qu'il faut faire une difference entre données a sauvegarder (historisation) et sauvegarde en cas de crash
en effet pour repartir en cas de soucis , rien ne vaut le mirroir
 
tu vas pas sauvegarder sur bande 7 to de données , soit les enveloppe de tes vm
vaut mieux faire une copie le soir du vmdk et d'un autre coté , sauvegarder tes data
 
qu'en penses tu ?

Reply

Marsh Posté le 07-12-2010 à 16:23:23    

Citation :

je pense qu'il faut faire une différence entre données a sauvegarder (historisation) et sauvegarde en cas de crash


 
Je suis assez d'accord. Mais comment faire tous cela quel support quels outils ?
parce que 7 To en une nuit faut que sa dépote? On envois sa sur un NAS? mais du coup c'est plus de la HA que de la sauvegarde non ?
 
et pour les Datas on reste sur bande ?
 

Reply

Marsh Posté le 07-12-2010 à 17:44:48    

- 2eme serveur + 2eme baie MD1000 (à l'opposé du batiment dans une seconde salle)
- Vsphere essential+
- virtualisation du stockage (falconstor ou datacore) avec cross mirroring, au choix en mode synchrone (necessite liason Gb entre les serveurs) ou asynchrone (la pas de pb de liaison, tu peux mettre le 2eme système sur un autre site - type bailleur pour serveur dans datacenter, jamais fait à voir - sans avoir besoin de fibre noir)
- outil de snapshoting (pour les systemes des VM)
Backup DD: une grappe prod, une autre backup pour chaque baie. Cross mirroring entre les baies pour que l'une soit la réplication de l'autre.
 
En gros, il faut revoir votre architecture.
 
 
Sinon:
Problèmes de la bande dans ton cas:
- Il te faudra un robot multilecteur sinon tu va mettre des jours entiers pour tout backuper: compte + de 30k€ HT (pour un invest pas delirant par rapport à ce tarif, je te renvoie à la 1ere proposition)
- Nb de bandes à gérer et à vérifier
 
Problème du NAS:
Ce n'est pas adapté à une telle config (ce n'est que du NAS) et à ton niveau de service.
En 4 jours tu ne pourras jamais remonter ton archi car il te faudra: racheter serveur+baie (deja là tu perds 2 jours si ton fournisseur à le matériel en stock), reconfigurer le bignou, reinstaller et configurer ESX, restaurer les backup...


Message édité par akabis le 07-12-2010 à 17:55:44
Reply

Marsh Posté le 08-12-2010 à 13:23:50    

merci de ton aide Akabis, je vais faire quelque recherche  car voici les termes et les technos que je ne maitrise pas :
virtualisation du stockage (falconstor ou datacore) ?
 
fibre noir, je suppose qu'il s'agit d'un niveau de service sur une fibre mais lequel?
 
Pour le snapshot des machines il y a l'appliance fournit par vmware.
Et pour stocker sa on a un server de 6To (un Nexenta sur un serveur dell hors garantie ....)
tu pense que a restaurer on est hors course niveau du RTO que j'ai dit ?
 
en plus il me reste 12 machines physique à backuper, et l'appliance vmware n'a apparemment pas une granularité très fine!  
 
 

Reply

Marsh Posté le 08-12-2010 à 14:30:27    

drazor a écrit :

merci de ton aide Akabis, je vais faire quelque recherche  car voici les termes et les technos que je ne maitrise pas :
virtualisation du stockage (falconstor ou datacore) ?


Je vais simplifier au maximum, d'ou quelques approximations.
La VS permet de simuler un SAN (ou un espace de stockage) quelque soit le type ou le lieu de stockage.
Ca permet de mutualiser le stockage (disséminé sur X serveurs ou baies) par ex.  
De provisionner (thin provisionning): tu alloues autant que tu veux (même plus que la quantité dispo) mais tu n'utilises que ce qu'il y a d'effectif.
Une autre application est de creer deux espaces de stockage distinct physiquement dont l'une est la réplication de l'autre.
 

drazor a écrit :


fibre noir, je suppose qu'il s'agit d'un niveau de service sur une fibre mais lequel?


En parlant de fibre noir, je voulais dire une fibre inter batiment, sans opérateur dessus.
Car un Gb (montant/descendant) sur fibre opérateur, ça coute un bras (je crois que ça tourne autour de 3/5k€ ht par mois)
 

drazor a écrit :


Pour le snapshot des machines il y a l'appliance fournit par vmware.
Et pour stocker sa on a un server de 6To (un Nexenta sur un serveur dell hors garantie ....)
tu pense que a restaurer on est hors course niveau du RTO que j'ai dit ?


Oui pour le snapshot des VM l'outil intégré suffit, non pour le snapshot des serveurs physique vous ne serez pas dans les délais sans outils adaptés.
 
Sinon
4 jours pour remonter 80 VM et 12 serveurs physique (ça veut dire recuper les snapshot et backup, les remonter, tester et mettre en ligne) est un delai réalisable à condition d'être au point et donc de tester grandeur nature.
Pour te donner un ex toute mon archi est redondé, bascule auto... ben lors d'un test (crash total des deux structures en même temps) on a mis 4h pour tout remonter au lieu de 1h prévu: manque d'entrainement et de procédures.
 
Autre point, il faut automatiser au max les remonter mais même la je trouve que 4 jours c'est juste (ca te donne 1h/homme par machine sur 96h) .
C'est pour ça que l'archy redondé me semble la plus adapté.
 

drazor a écrit :

 
en plus il me reste 12 machines physique à backuper, et l'appliance vmware n'a apparemment pas une granularité très fine!  


J'utilise Vmware data recovery et la granularité est au niveau du fichier, aucun pb la dessus. Mais pareil, que pour les VM de la ferme Vmware.
 
 
Sinon j'ai une question:
Pourquoi ne pas avoir virtualisé les serveurs restants?
Je vous conseille fortement de repenser l'architecture (je crois l'avoir déjà dit), les frais ne seront peut être pas si énorme que ça.


Message édité par akabis le 08-12-2010 à 15:10:16
Reply

Marsh Posté le 09-12-2010 à 09:53:56    

drazor a écrit :

Citation :

je pense qu'il faut faire une différence entre données a sauvegarder (historisation) et sauvegarde en cas de crash


 
Je suis assez d'accord. Mais comment faire tous cela quel support quels outils ?
parce que 7 To en une nuit faut que sa dépote? On envois sa sur un NAS? mais du coup c'est plus de la HA que de la sauvegarde non ?
 
et pour les Datas on reste sur bande ?
 


pour les data , a tu une idée de la volumetrie : differentielle et full ?
 
7 to en effet, faut rester synchro , tu peux pas ecrire 7 to en une nuit
(50 Mo /s soit 180 Go /h )

Reply

Marsh Posté le 09-12-2010 à 10:06:33    

si on aborde la question de full+incremental, il ne faut pas oublier que pour une incremental valide il faut la full associée
 
admettons qu'il y 8To en full le weekend et 4To en incremental chaque nuit du lundi au jeudi
avec une rétention de 1 semaine, ton NAS devra posséder 8+4x4 = 24To
 
bref je trouve qu'il y a trop de flou, pour preuve il y a plein de réponses différentes sans pour autant qu'elles soient abbérante... le mieux est de faire une réelle étude complète avec plusieurs scénarios possibles

Reply

Marsh Posté le 09-12-2010 à 11:21:51    

Clairement il faut identifier les volumes plus précisément et la criticité des données.
- Est ce qu'il est nécessaire de repasser sur tous les serveurs chaque nuit pour faire une incrémental ou différentiel ? En gros est ce que certaines machines ne peuvent pas se contenter d'une hebdo par semaine ?
- En cas de crash majeur, est ce que la direction souhaite absolument revenir à J-1 ou alors le w-e précédent peut suffire ?
 
Donc tout dépend de l'activité de la société et donc de l'importance de l'infra
Perso je trouve que proposer d'embler une replication de baie ... etc . peut s'avérer surdimensionner pour bcp de structures.
Des sauvegardes sur disque (associer à de la de-duplication) + export sur bandes en journée peut être largement suffisant du moment qu'on se dote des bons outils.
 
4 jours me parait clairement suffisant pour remonter une infra comme la votre (le plus simple étant naturellement la partie virtualisée) du moment que le pra est testé, procéduré etc ...
Il faut juste avoir un contrat chez un hebergeur / centre de secours qui met à dispo le materiel en quelques heures.


---------------
Les hommes n'acceptent le changement que dans la nécessité et ils ne voient la nécessité que dans la crise.
Reply

Marsh Posté le 09-12-2010 à 14:37:27    

Le problème n'est pas la sauvegarde (quoique) mais le RTO qui est de 96h et le RPO de 24h.
 
L'incrémental est à mon avis mal venu: une erreur entre la dernière full et le jour de resto souhaité et tout est perdu depuis la dernière full.
=> le RPO est compromis
 
La différentielle pose moins de soucis. Encore faut il ne pas avoir trop d'espace entre chaque full (ce qui renvoie à la partie: autre problème).
Par contre cela posera problème avec le RTO: je vois mal respecter le delais de 96h pour remonter 92 serveurs (amusez vous avec vos bandes pour remettre en route 92 serveurs dans les conditions que vous avancez).
 
Autre problème:  
7 To de full à faire sur des serveurs en prod.
La fenètre de backup est, mais là c'est à confirmer, au maximum d'une durée de 12h (18h à 6h le lendemain, même s'ils reprennent à 8h du mat, il faut laisser le temps des vérifications de backup suivant les logiciels).
7 To sur 12h ça donne du 583Go/h en backup: impossible avec un seul lecteur.
Il faut 3 voir 4 lecteurs LTO4 mini pour assurer la cadence.
Et la les prix sont stratosphériques pour une robotique quadri lecteur. Et je n'aborde même pas la partie réseau et le prix du centre de secours (c'est de l'ordre de 250€HT/mois mini le U: maintenant tous les serveurs assez puissant pour faire tourner cette infra font au mini 2U et il faudra au moins 2 serveurs, ce qui donne 4U soit 1000€/mois).
 
Donc la question de la surdimension ne se pose pas (comme l'indique Tournet).
Il va falloir prendre le meilleur à budget équivalent.
La réplication peut s'imposer car l'aspect temps de gestion de backup n'est pas à négliger sur cette volumetrie, sans compter les autres couts en liaison avec les points cités précedement.
Au final, la réplication sera une meilleure solution pour un budget inférieur.
 
Après ajouter une robotique de backup pour faire du D2D2T (dans le cadre de l'externalisation des medias) est tout à fait envisageable à peu de frais.
 
Car les propositions de Tounet et  Couak me semble légère compte tenu du RTO qui est quand même trop juste à mon avis compte tenu de la volumétrie et du nombre de machine.
Depuis une bande, la restauration est plus lente qu'un backup.
 
Pour le NAS, je trouve que ça fait vraiment "cheap" par rapport à l'infra que tu as. Le terme cheap n'est pas du tout péjoratif, mais cette solution va bien pour une PME qui se balade avec 4/5 serveurs et qui veut commencer à protéger ses données.
A un niveau comme celui ci, c'est vraiment pas adapté et en plus tu ne pourra respecter ton RTO car il y aura toujours les délais pour avoir le matériel de remplacement.
 
Bref, vu les montants en jeu (et pas seulement l'investissement, mais le cout pour l'entreprise en cas de perte de ces ou d'une partie de ces 7To) pour un truc qui tient la route et non du bricolage, il faut repenser l'architecture completement (ca ne veut pas dire que vous ne conserverz pas ce que vous avez) en intégrant la partie backup et restauration suivant votre niveau de service (RPO/RTO).
Je vois mal faire quelque chose de bien en ne pensant que backup.


Message édité par akabis le 09-12-2010 à 15:00:17
Reply

Marsh Posté le 09-12-2010 à 14:37:27   

Reply

Marsh Posté le 09-12-2010 à 15:05:09    

Mwai, t'arrives à lire entres les lignes, ou alors tu as des infos que je n'ai pas :)
 
Pour moi, il serait bien déjà d'être certain du RTO et du RPO et de discuter de cela avec la direction, il faut surtout sensibiliser et définir l'impact que cela aura sur le cout.  
Il faut aussi revoir la sauvegarde, est ce qu'une full de 7 Go est vraiment nécessaire chaque nuit ? J'ai bcp de mal à le croire.
 
Tu es très compétent Akabis, il n y a pas de doute. Mais le discours fait un peu technico commercial prévoyant ceinture et bretelles :)


---------------
Les hommes n'acceptent le changement que dans la nécessité et ils ne voient la nécessité que dans la crise.
Reply

Marsh Posté le 09-12-2010 à 16:06:56    

Tounet a écrit :

Mwai, t'arrives à lire entres les lignes, ou alors tu as des infos que je n'ai pas :)


Je lis ce qui est dit tout simplement:

drazor a écrit :


Il me faudrait sauvegarder tous ça l’objectif de la direction  j+1 en cas de petit problème : virus détruisant la config d’une machine, serveur hors garantie HS etc ….
Et 4 jours en cas de désastre : incendie, dégâts des eaux, etc …


Et je trouve que 96h c'est large.  
La plupart du temps c'est: tout ce qui concerne le cashflow, RTP=0 et entre 24h et 72h au max pour le reste.
 

Tounet a écrit :


Il faut aussi revoir la sauvegarde, est ce qu'une full de 7 Go est vraiment nécessaire chaque nuit ? J'ai bcp de mal à le croire.


Je n'ai jamais parlé de ça.
Je dis juste qu'il y a au moins une full régulière.
 

Tounet a écrit :


Mais le discours fait un peu technico commercial prévoyant ceinture et bretelles :)


Je n'ai jamais été, ne suis pas et ne serais jamais commercial (je n'ai rien contre eux, ce n'est tout simplement pas mon metier).
Par contre ça fait plusieurs années que je travaille avec les directions (depuis peu je dépends directement du DG, j'ai donc assez longment discuté sur ces points... c'est un peu le principal sujet de discussion avec les améliorations de perf et baisse d'OPEX) et directions métiers, je sais que si on garantie à 100% l'intégrité des données et si on garantie la reprise d'activité (là on négocie, je te rejoins mais j'ai rarement vu des RTO si large), on trouve facilement les budgets pour financer les projets de ce type.  
Et ça dérange personne d'avoir bretelles, ceinture et élastique pour faire tenir le pantalon, bien au contraire... tout le monde dort mieux.


Message édité par akabis le 09-12-2010 à 16:16:27
Reply

Sujets relatifs:

Leave a Replay

Make sure you enter the(*)required information where indicate.HTML code is not allowed