Backup blijft kern van dataprotectie

Traditionele backup in licht van nieuwe strategieën

Backup is de universele term voor tools voor dataprotectie. De mate van bescherming loopt uiteen van RAID en backup tot replicatie en snapshots. De diverse tools helpen IT-professionals bij de recovery van verschillende types data. Maar bij de meeste ondernemingen ontbreekt een plan waarin staat welke tool onder welke omstandigheden moet worden gebruikt

 

In de praktijk hebben de meeste datacenter- en clouddiensten vaak de intentie om backup-technieken als RAID, replicatie of snapshots in hun backupplan toe te passen. Het probleem is vaak om deze processen goed te beheren omdat data vaak uit verschillende bronnen afkomstig is. Sommige leveranciers van backup software integreren snapshot- en replicatiebeheer, waarmee een multi-tier protectiestrategie is gebouwd. Storageleveranciers leveren storageproducten inclusief hun proprietary replicatie- en snapshotapplicaties.

Types backup

Figuur 1: Backup-architectuur (bron: Oracle)

Backup bestaat hoofdzakelijk uit drie types: full, differential en incremental. Een full backup is de meest fundamentele. Deze vorm maakt een kopie van alle data. Het is ook de meest tijdrovende en, qua benodigde storage, duurste backup-methode. Voordeel is dat data eenvoudiger valt te herstellen, in vergelijking met sommige andere types waarbij eerst sets van veranderde data moeten worden gecreëerd. Backup kan een vereiste zijn in enkele scenario’s, bijvoorbeeld logische datacorruptie als gevolg van software bugs of een server crash, bij gebruikersfouten zoals onbedoeld verwijderde bestanden of directories en hardware failure als uitval van harddisks, flash drive of een complete hardware-omgeving.

Backup versus replicatie

Sommige leveranciers willen ons doen geloven dat traditionele backup met de komst van virtualisatie kan worden vervangen door nieuwe dataprotectiemethoden zoals replicatie, snapshots en live migraties. Dat is bepaald niet het geval. Deze zijn aanvullingen op de traditionele backup. Bij replicatie wordt een tweede datakopie identiek aan de primaire gemaakt. Replicatie kan synchroon of asynchroon gebeuren, waarbij synchroon in realtime plaatsvindt. Dat betekent dat elke datacorruptie of door eindgebruikers verwijderde bestanden onmiddellijk, of zeer snel, naar de secundaire kopie wordt gerepliceerd. Het is daarom ongeschikt als een effectieve backupmethode. Een ander belangrijk punt om bij stil te staan, is dat slechts één datakopie op de secundaire locatie wordt bewaard. Daardoor ontbreken de vorige dataversies van de afgelopen dagen, weken en maanden.

Snapshots

Figuur 2: Backup versus snapshot (Bron: Tintri)

Een snapshots is point-in-time datakopie. De kopie bestaat uit een aantal pointers die naar de veranderde data wijzen sinds de laatst genomen snapshot. Er bestaan verschillende snapshot- varianten die een aanvulling kunnen zijn op een backup-oplossing. De belangrijkste snapshot- varianten zijn copy-on-write; clone/split-mirror en continuous data protection (cdp). De meeste snapshotimplementaties maken gebruik van copy-on-write. Daarbij wordt initieel een snapshot gemaakt en daarna updates van veranderde data. Herstel tot een specifiek tijdstip is mogelijk, zolang alle iteraties van de data beschikbaar zijn. Snapshots beschermen tegen datacorruptie in tegenstelling tot replicatie. Een ander veel toegepaste variant is clone/split mirror waar tijdens een snapshot de pointers van de complete inhoud van een set gespiegelde drives, file system of lun worden gemaakt. Dit proces duurt langer dan een copyon-write, omdat alle data fysiek moet worden gekopieerd bij het creëren van de kloon. Het kopieerproces kan van invloed zijn op de prestaties van het primaire storagesysteem. Ten slotte is cdp een snapshot-methode die alle data-updates opslaat. Cdp-oplossingen kunnen daardoor op elk moment een roll back uitvoeren. Nadeel is de benodigde hoeveelheid storage omdat van elke veranderde data block een kopie moet worden bijgehouden. Net zoals clone/split mirror-variant kan het invloed hebben op de storage-prestaties. Sommige leveranciers implementeren daarom een near-cdp die slechts snapshots op bepaalde tijden nemen en veranderingen over een langere tijd consolideren. In het algemeen is het voordeel van snapshots dat ze snel toegang bieden tot vorige opgeslagen data, de zogenaamde roll back. Een nadeel is dat voor snapshots altijd de primaire data aanwezig moet zijn. Zonder de primaire data is er geen roll back mogelijk.

 Backup in de cloud

Door de dalende storage-prijzen wordt backup in de cloud steeds populairder. Een voordeel hiervan is flexibiliteit, want er hoeft geen extra hardware te worden aangeschaft. Een belangrijk nadeel is de hersteltijd. Deze is afhankelijk van de beschikbare internetbandbreedte. Daarnaast spelen ook netwerkkosten een belangrijke rol. Dit geldt minder voor kleine omgevingen, maar voor enterprises kan dit een probleem opleveren. Enterprises vallen daarom soms terug op de ouderwetse manier om hun storage devices fysiek op te sturen. Daarmee kan de hersteltijd van soms weken worden teruggebracht tot enkele dagen. Met een juiste retention policy kunnen cloud backups de behoefte aan een off-site tape storage reduceren of zelfs vervangen. Ondernemingen stappen steeds vaker over van disk-todisk-to-tape -strategieën naar diskto-disk-to-cloud. De cloudgebaseerde backup worden steeds meer volwassen en wordt uiteindelijk een geschikte kandidaat voor het maken van premise backups. Voorlopig blijft een van de beste backup-strategieën de creatie van een lokale backup, voor veiligheid aangevuld met replicatie naar de cloud.

Best Practices

Figuur 3: Cloudgebaseerde backup via storage device (Bron: Veeam)

Een goede dataprotectiestrategie combineert een aantal aspecten op basis van een of meerdere van de beschreven methoden. Zo zijn snapshots meer geschikt om gebruikersfouten te corrigeren en voor sommige datacorruptiescenario’s. Ze werken snel, zijn meestal erg ruimtebesparend en in veel gevallen kunnen eindgebruikers zelf een restore uitvoeren. Cdp gaat een stap verder. Het kent meer flexibele scenario’s. Het is een afweging tussen backup-capaciteit en prestaties tegen fijnmazige restores. Tenslotte biedt de traditionele backup een solide bescherming, mocht er een grote storing optreden. Het biedt een betere oplossing op de lange termijn voor data retention, vooral in situaties die multiple backup policies in geografische verspreide locaties vereisen. Backup vormt de sleutel tot een goede dataprotectiestrategie. Op de vraag of de komst van virtualisatie heeft betekend dat nu de traditionele backup door de nieuwe protectiemethoden als replicatie, snapshot en live migration kan worden vervangen, is het antwoord nee. Backup vormt nog steeds de kern van elke dataprotectiestrategie waarbij replicatie en snapshots een aanvulling kunnen zijn. Het is aan de IT-professionals zelf om, afhankelijk van de applicaties en gewenste graad van dataprotectie, de juiste keuze te maken uit de verschillende backupoplossingen.

[Dit artikel is eerder gepubliceerd in het Datacenter & Cloud Dossier 2017]

Lees het artikel hier in PDF