Re: [OT] Backup dati

Alessandro Baggi Fri, 10 Jul 2020 01:28:32 -0700


Il 09/07/20 21:48, Mauro ha scritto:

Il 09/07/2020 15:58, Alessandro Baggi ha scritto:

Un saluto esteso a tutta la lista.

ricambio con piacere.

Per un ambiente lavorativo stavo pensado a qualcosa di più
professionale che supporti la compressione, deduplicazione (non che
sia necessaria al momento), cifratura dei backup e controllo di
integrità dei backup.

Facendo un ricerca in rete ho trovato:

1) rsnapshot: non più mantenuto in quanto lo sviluppatore principale è
passato a borgbackup.
2) dirvish: non più mantenuto dal 2014.
3) bacula: letteralmente un mostro (che ho usato in passato)
4) bareos: è il fork di bacula quindi come sopra
5) amanda: non so
6) borgbackup: tool veramente interessante ma supporta solo il push
nativamente quindi dovrei usarlo con rsync + borg in locale. Anche in
questo caso uno script bash è necessario per mantenere più client.
7) restic: simile a borgbackup

e altri.

Avete dei consigli al riguardo?

Ciao Mauro e grazie per la risposta

La mia situazione che e' un mix di robe di lavoro e personali alla fine
mi hanno portato a usare due tools (tralascio quelli per gli ambienti
misti winz):

il primo, uno script che ogni giorno cresce un po' che si basa su rsync,
simile al tuo, con checksum, quota, notifiche e comunicazioni.

Come hai implementato il checksum nel tuo script? Io sto provando atrovare una soluzione utilizzando l'md5 di rsync che si può ottenereusando l'opzione --output-format="%C e altri format per altre info".Questo è ottimo perche cmq l'hash lo calcola direttamente rsync e sirisparmia un po di tempo, quindi per ogni file scaricato inserisco ilrispettivo md5 in un manifest unico per il client contenente tutti ichecksum dei file scaricati precedentemente. Il problema è che usandogli hardlink e utilizzando il prune, mi ritrovo a dover aggiornare unalista molto lunga ogni volta che effettuo un prune e questo richiedemolto tempo. Al momento mi sono affidato a ZFS ma se non ho capito maleil controllo di zfs consiste nel controllare se la copia live è cambiatarispetto a quella della parità senza che il file sia stato modificatonella copia live (anche perche se il file viene modificato nella copialive viene comunque aggiornato anche nel parity) (se sbaglio correggetemi).

il secondo un bacula che sta diventando in questi giorni un bareos.
Quest'ultima soluzioni l'avevo scelta qualche anno fa perche' dovevo
lavorare in ambienti misti (linux,bsd e windows) e mi sembrava una
valida alternativa da mettere in mano con apposita interfaccia a utenti
meno smaliziati a cui, al massimo, dovevo far premere un tasto soltanto.

Effettivamente Bareos/Bacula sono di una complessita' che rasenta la
follia. Per carita' stabili, ma laddove ho thera e thera di file piccoli
(documenti office) andare a cercare qualcosa sta diventando una tortura.

Concordo. Bacula è una cosa allucinante, l'ho usato in passato consuccesso ma è troppo complesso e macchinoso (magari in altre realtà è lasalvezza ed è necessario che sia cosi). Prima cosa è un pò confusionarioil modo in cui i client vengono configurati, cioè si parte da un file diconfigurazione che contiene le direttive ma poi una parte delle infoviene memorizzata sul database (la parte riguardante ai pool, volumi,job, file e host). Non c'è niente di male in questo ma se provi cambiarele config dei pool, volumi ecc devi cmq aggiornarle sul DB con labconsole, se elimini un client dalla configurazione poi devi andare adeliminare il client dal DB, idem se fai modifiche ai pool/volumi, idemse cancelli un volume o un job (esiste un tool per fare questo, o meglioun tool che si occupa di eliminare i record orfani ma non ha maifunzionato per me..sarò io). Poi ci sta il mantenimento del DB chepotrebbe diventare gigante e quindi le query per vedere quale file èmemorizzato in quale volume richiedo un tempo maggiore e poi ti ritrovia fare un backup del db (di bacula) molto grande (ci sono diversedirettive per questo ma si può sempre omettere qualcosa o sbagliare ilretention period). Oltre a questo non mi piace come gestisce i volumisui backup con storage su disco e non su TAPE (su TAPE penso che siaformidabile questo approccio) ma su disco è più un problema che unasoluzione. Per esempio, mi capitava che un job fallisse per un motivo mail volume era già stato allocato e marcato come usato. Avendo il maximumvolume jobs = 1, Maximum Volumes = N e le retention policy praticamentedistruggeva il ciclo di backup del client perche ti trovavi con unvolume in meno (praticamente non usato) ma che cmq ti sballava ilciclo. E vai a manina a cambiare il numero di pool per fargli fare ilbackup e poi eliminare quello vecchio. Forse lo usavo male io, ma perbackup su disco non è il massimo. Poi per carità ha delle funzionispettacolari come il migration su un secondo storage come replica,backup virtuali ecc...forniscono supporto a chi ne ha bisogno ma ilgioco non vale la candela (nel mio caso). Per non parlare del caso incui il server crepa, o il DB crepa, o i volumi corrotti. Prova aricostruire il db dai volumi senza il bootstrap (con bscan) e vediquanto ci mette.....Ah e ci sta anche un altro problema. Se ioimplemento un sistema con bacula per qualcuno, e poi non sono più ilresponsabile per varie ragioni, quello che dovrà far funzionare i backupdovrà impazzire per imparare bacula in un tempo ragionevole orimpiazzare la soluzione di backup. Non che sia un mio problema malasciare un cliente in una situazione del genere non mi piace.


Lo script, invece, mi da' parecchie soddisfazioni: stabile, costante,
facile da manutenere e permette, vista propria la modalita' di
salvataggio dei file di ritrovare le cose in tempi decisamente brevi.

Anche io sto avendo grandi soddisfazione dal mio script, proprio l'altrogiorno ho fatto una cavolata e ho sovrascritto per sbaglio i file shadowe group in /etc (stavo facendo un test ma il risultato doveva esserediverso e i due file non erano interessati) e con il mio script sonoriuscito a fare il restore in pochissimo tempo dal server di backup.Penso anche che una delle peculiarità di un buon backup sia il tempo direcupero e restore dei dati e in questo caso non avendo deduplicazione ablocchi (quindi non deve ricalcolare l'indice dei chunk per fornirti ifile), senza compressione, senza cifratura nel software di backup riducei tempi di restore. Che poi tutte queste cose sono gestite da ZFS inmodalità trasparente è un altro discorso.


Che dire: come te sono un po' a un bivio: uso una applicazione mostro
che pero' attraverso interfaccia decente consenta a utenti non
smaliziati di sentirsi super uomini o continuo imperterrito a usare il
mio script che decisamente mi fa dormire sonni molto piu' tranquilli.

È da un pò di tempo che mi trovo anche io al bivio, e sempre di più sonoconvinto che lo script sia migliore in termini disemplicità,flessibilità, velocità, stabilità e accesso ai dati senzafronzoli rispetto alle altre situazioni. Se il job fallisce, ripartisemplicemente con un nuovo job. Se il server crepa basta collegare idevice su un altro server e hai la possibilità di recupero immediato incaso di urgenza senza dover dipendere da un software specifico cherecupera i dati da un archivo con chissà quale formato che cmq nonpotresti recuperare senza quel software.

Inizio a pensare di concentrarmi di piu' sullo script.

Aneddoto 1: mi è capitato tempo fa di dover recuperare dei backup di unnas crepato che girava su XP e i backup su disco esterno sulla stessamacchina ereditato da un altro tecnico. Non ricordo quale tool era,aveva un primo backup full fatto nel 15/18 e poi una miriade diincrementali tutti memorizzati in cartelle nominate per data con i filesingoli senza archivi. Tralasciando stare le modalità e il resto, sonoriuscito a recuperare i dati grazie al fatto che i file salvati eranosemplici file e non memorizzati in chissa quale archivio con chissàquale formato. Semplicemente attaccato il disco sulla mia workstationmontato il disco, un piccolo script che iterava la dir e via.

Aneddoto 2: sempre qualche tempo fa (durante la quarantena) ho avuto lapossibilità di entrare in contatto con il responsabile che si occupavadel Cluster Pleiadi della NASA e avendo fatto un post su Reddit suPleaidi era contento che si parlasse di loro in particolare di Pleaidi(va a vedere se vero ma dalla precisione con cui parlava dei sistemi chegestiva e dei dettagli sembrava affidabile) e mi ha fornito diversi linke risorse con tutte le specifiche dei sistemi che usano e di altripiccoli cluster (sono cmq tutte informazioni di dominio pubblico e mi hadetto che si possono andare a visitare i datacenter con visite guidateorganizzate da loro ma che con il COVID-19 era tutto bloccato). Almomento usano SLES e avrebbero usato debian se non fosse stato perLustre (usano anche altre distro in altri settori per altri scopi). Fuuna bella discussione (in privato) e oltre a diverse cose gli ho chiestocome approcciavano al backup dei dati in una struttura come quella e quisono rimasto sorpreso. Mi ha spiegato che per i dati in cluster nonfanno i backup perche sono abbastanza ridondati e che per quelladimensione era folle effettuare dei backup, per il resto backuppabileusano dump con una politica Grandfather-father-son (Molto simile a3-2-1). Quindi nessun tool proprietario, nessun software assurdo per ibackup.

Mauro

Un saluto.

Re: [OT] Backup dati

Rispondere a