I metodi di backup tradizionali prevedono l’esistenza di un server di backup, collegato a dispositivi a nastro o array di dischi, ed un numero di agent software installati su ogni sistema operativo. Nelle architetture tradizionali, il rapporto tra sistemi operativi e server è di 1:1. Applicando questi metodi al mondo virtuale, ed estendendo questo impegno a tutte le VM presenti su un host, il carico potrebbe essere eccessivo, poichè gli agent impegnerebbero le risorse di ogni VM in maniera consistente durante le operazioni di backup. Non dimentichiamo poi che all’interno di un host virtualizzato più VM condividono le stesse interfacce di rete fisiche e lo stesso storage, elementi che potrebbero rivelarsi dei colli di bottiglia durante le procedure di backup con metodo tradizionale.

 

Le architetture virtuali offrono diversi vantaggi per le procedure di backup, con meccanismi che si differenziano dalla procedure tradizionali per una maggiore flessibilità e velocità. In particolare, indichiamo di seguito alcuni elementi chiave nelle procedure di backup in ambiente virtuale:

  • possibilità di accesso diretto ai datastore che contengono le VM, con nessun carico sulle loro risorse durante il prelievo dei file dal datastore;
    nessuna necessità di agent software sulle VM;
  • necessità di un solo livello di backup sia per il ripristino di un’intera VM che dei file in essa contenuti;
  • il fatto che le VM vedano sempre lo stesso hardware rende agevole il ripristino su qualsiasi host.

Quando si avvia un’operazione di backup da una sorgente ad una destinazione, vi è un notevole impegno di risorse, non limitato alla rete su cui transitano i dati. La CPU infatti viene impegnata per le operazioni necessarie a individuare, decuplicare e comprimere i file oggetto del backup.

In ottica di flessibilità, VMware ha inoltre introdotto l’interfaccia vSphere APIs for Data Protection per permettere a software di terze parti l’interfacciamento con il sistema di backup di vSphere. L’interfaccia è integrata nativamente all’interno degli host ESXi.

vSphere Data Protection

vSphere Data Protection (VDP) è una soluzione di backup su disco dedicata agli ambienti vSphere medio-piccoli. È rappresentata da un’appliance virtuale integrata con il vCenter Server e con la tecnologia vSphere APIs for Data Protection.

I punti che caratterizzano la soluzione VDP sono indicati di seguito.

  • Backup disk-based per consentire un ripristino rapido delle macchine virtuali. I backup possono essere di tipo completo o incrementale.
  • Backup di tipo image-level, con cui fornire backup completi delle VM, indipendentemente dal sistema operativo guest.
  • Facile da distribuire, in quanto costituita da una macchina virtuale che gira su vSphere ESXi.
  • Possibilità di ripristinare singoli file o intere immagini, in base alle necessità.
  • Deduplica dei dati eseguita automaticamente per ogni operazione di backup.
  • Impiego della funzionalità CBT (Changed Block Tracking) per tener traccia dei cambiamenti sui blocchi dei dischi virtuali. 
  • Inclusa a partire dalle edizioni vSphere Standard e vSphere Essentials Plus.

vsphere vdp

Ogni istanza di vCenter Server è in grado di supportare sino a 10 appliance VDP. Una virtual appliance VPD è costituita da 4 processori (vCPU) e 4GB di RAM. Ogni appliance può proteggere sino a 100 VM ed eseguire sino ad 8 operazioni di backup contemporanee; tuttavia le diverse appliance non condividono le informazioni sui loro backup. Per quanto riguarda la capacità di memorizzazione dei backup, sono disponibili tre diverse configurazioni:

  • 0.5Tb (850Gb occupati su disco);
  • 1Tb (1300Gb occupati su disco);
  • 2Tb (3100Gb occupati su disco);

Lo spazio dedicato ai backup prende il nome di deduplication store. Lo spazio addizionale richiesto, che va oltre le dimensioni dedicate al backup, è necessario per la creazione e la gestione dei “checkpoints”. Una volta implementata l’appliance, le sue dimensioni non possono essere più modificate.

VDP fornisce un'interfaccia di gestione centralizzata, integrata nel vCenter Server, fruibile tramite vSphere Web Client. La creazione e la modifica delle attività di backup sono permesse a partire dal tab Backup presente nell’interfaccia di gestione, come mostrato nell’immagine sotto.

vsphere backup

Per procedere con le operazioni di backup, è possibile selezionare le singole VM, oppure si può agire su contenitori quali datacenter, cluster e resource pool. Se si seleziona uno di questi contenitori, il backup sarà eseguito per tutte le VM al suo interno. Ovviamente le attività possono essere programmate giornalmente, settimanalmente e mensilmente.

Per quanto riguarda le operazioni di recupero, è possibile ripristinare una VM in una posizione differente rispetto a quella originale. È possibile inoltre ripristinare singoli file o directory. Il recupero a livello file è possibile grazie a un tool chiamato vSphere Data Protection Restore Client.

vsphere backup restore

Deduplicazione dei dati

Nei punti sopra è stato indicato il supporto alla deduplicazione. Questa tecnologia prevede un meccanismo di backup a blocchi, differente dai meccanismi di backup tradizionali che invece agiscono per singoli file. In concreto, la deduplicazione è un processo in cui ogni blocco di dati viene confrontato con i blocchi precedentemente archiviati, per identificare una possibile ripetizione o ridondanza. Un blocco duplicato, ovvero ogni blocco contenente le stesse informazioni presenti nel backup precedente, non viene salvato una seconda volta. VDP utilizza la tecnologia EMC Avamar per la deduplicazione dei dati.

Changed Block Tracking

CBT, acronimo di Changed Block Tracking, è una funzionalità che si occupa, a livello di VMkernel, di tener traccia dei cambiamenti ai blocchi di un disco virtuale. È molto utile quando si devono gestire backup incrementali successivi ad un full backup. In quanto parte di vSphere APIs for Data Protection, la funzionalità può essere sfruttata da software di terze parti.

Le informazioni sui blocchi che hanno subito modifiche vengono fornite dal VMkernel alle applicazioni che ne fanno richiesta, senza che le applicazioni stesse debbano ricavare tali informazioni in maniera proprietaria, con conseguenti rallentamenti. Si consiglia tuttavia di non attivare CBT se non devono essere utilizzate applicazioni di backup che possano sfruttare le sue funzionalità.

Per l’utilizzo di CBT, l’hardware delle macchine virtuali deve essere almeno nella versione 7. La funzione di CBT è disabilitata per impostazione predefinita. Va attivata (tramite client vSphere o utilizzando l’SDK) su ogni macchina virtuale che vuole sfruttare questa funzione. Se si utilizza il client vSphere, è necessario aggiungere i parametri ctkEnabled=true e scsi#:#.CtkEnabled=true nella configurazione di ogni macchina virtuale. I simboli # fanno riferimento rispettivamente al controller e al disco della VM.

CBT memorizza le informazioni sui blocchi modificati in un file con suffisso “-ctk.vmdk”, creato nella directory di ogni VM. Sarà presente un file “-ctk.vmdk” per ogni disco virtuale con CBT attivato. All’interno di questo file, lo stato di ciascun blocco viene monitorato e memorizzato con numeri di sequenza che permettono alle applicazioni di backup di sapere se un blocco ha subito modifiche.

vsphere cbt

L'autore

Alessio Carta

Responsabile sistemi presso un System Integrator con sede in Sardegna, si occupa di informatica e telecomunicazioni da oltre 10 anni. La sua formazione comprende una laurea in ingegneria, una specializazione IFTS in progettazione di reti telematiche, certificazioni Cisco CCNA, Cisco CCNA Security, MCP sui sistemi Windows Server e VCP su VMware vSphere (5.1, 5.5, 6.0). È istruttore presso una VMware IT Academy con sede a Cagliari.

banner5

fb icon evo twitter icon evo

Parola del giorno

L'acronimo SoC  (System on a Chip) nasce per descrivere quei circuiti integrati che, all'interno di un singolo chip fisico, contengono un...

>

YAML è un formato utilizzato per serializzare (ovvero salvare oggetti su supporti di memoria ad accesso seriale) dati, in modo...

>

Il termine Edge Computing descrive, all'interno di infrastrutture cloud-based, l'insieme di dispositivi e di tecnologie che permettono l'elaborazione dei dati ai...

>

L'acronimo FPGA  (Field Programmable Gate Array), descrive quei dispositivi hardware formati da un circuito integrato e con funzionalità programmabili tramite...

>

Il termine Agentless (computing) descrive operazioni dove non è necessaria la presenza e l'esecuzione di un servizio software (demone o...

>
Leggi anche le altre...

Download del giorno

Fiddler

Fiddler è un server proxy che può girare in locale per consentire il debug delle applicazioni e il...

>

Adapter Watch

Adapter Watch è uno strumento che permette di visualizzare un riepilogo completo e dettagliato delle informazioni riguardanti una determinata...

>

DNS DataView

DNS Lookup  è un tool a interfaccia grafica per effettuare il lookup DNS dal proprio PC, sfruttando i...

>

SolarWinds Traceroute NG

SolarWinds Traceroute NG è un tool a linea di comando per effettuare traceroute avanzati in ambiente Windows...

>

Network Inventory Advisor

Network Inventory Advisor  è uno strumento che permette di scansionare la rete e acquisire informazioni riguardanti tutti i...

>
Tutti i Download del giorno...

Archivio numeri

  • GURU advisor: numero 21 - maggio 2019

    GURU advisor: numero 21 - maggio 2019

  • GURU advisor: numero 20 - dicembre 2018

    GURU advisor: numero 20 - dicembre 2018

  • GURU advisor: numero 19 - luglio 2018

    GURU advisor: numero 19 - luglio 2018

  • GURU advisor: numero 18 - aprile 2018

    GURU advisor: numero 18 - aprile 2018

  • GURU advisor: numero 17 - gennaio 2018

    GURU advisor: numero 17 - gennaio 2018

  • GURU advisor: numero 16 - ottobre 2017

    GURU advisor: numero 16 - ottobre 2017

  • GURU advisor: numero 15 - luglio 2017

    GURU advisor: numero 15 - luglio 2017

  • GURU advisor: numero 14 - maggio 2017

    GURU advisor: numero 14 - maggio 2017

  • 1
  • 2
  • 3
  • Teslacrypt: rilasciata la chiave

    Gli sviluppatori del temuto ransomware TeslaCrypt hanno deciso di terminare il progetto di diffusione e sviluppo e consegnare al pubblico la chiave universale per decifrare i file. Read More
  • Proxmox 4.1 sfida vSphere

    Proxmox VE (da qui in avanti semplicemente Proxmox) è basato sul sistema operativo Debian e porta con sé vantaggi e svantaggi di questa nota distribuzione Linux: un sistema operativo stabile, sicuro, diffuso e ben collaudato. Read More
  • Malware: risvolti legali

    tutti i virus e in particolare i più recenti Ransomware, che rubano i vostri dati e vi chiedono un riscatto, violano la legge. Vediamo insieme come comportarsi, per capire anche se e quando bisogna sporgere denuncia. Read More
  • 1