Come salvare lo spazio su disco utilizzando la deduplicazione BTRFS

Come salvare lo spazio su disco utilizzando la deduplicazione BTRFS
La deduplicazione è una funzione software utilizzata per rimuovere i blocchi di dati duplicati (blocchi di dati ridondanti) da un filesystem per salvare gli spazi del disco. Il filesystem BTRFS è un filesystem moderno di copia-on-write (Cow) che supporta la deduplicazione.

Se hai bisogno di conservare molti dati ridondanti (i.e., Backup di file, database) sul tuo computer, quindi la funzione Copy-on-Write (mucca) e la deduplicazione del filesystem BTRFS possono salvare un'enorme quantità di spazi su disco.

In questo articolo, ti mostrerò come salvare gli spazi del disco utilizzando la funzione di deduplicazione BTRFS. Quindi iniziamo.

Prerequisiti:

Per provare gli esempi di questo articolo,

  • È necessario installare il filesystem BTRFS sul tuo computer.
  • Devi avere un disco rigido o un SSD con almeno 1 partizione gratuita (di qualsiasi dimensione).

Ho un disco rigido da 20 GB sdb Sulla mia macchina Ubuntu. Ho creato 2 partizioni SDB1 E SDB2, Su questo disco rigido. Userò la partizione SDB1 in questo articolo.

$ sudo lsblk -e7

Il tuo disco rigido o SSD può avere un nome diverso dal mio, così anche le partizioni. Quindi, assicurati di sostituirli con il tuo da ora in poi.

Se hai bisogno di assistenza sull'installazione del filesystem BTRFS su Ubuntu, controlla il mio articolo Installa e usa BTRFS su Ubuntu 20.04 LTS.

Se hai bisogno di assistenza sull'installazione del filesystem BTRFS su Fedora, controlla il mio articolo Installare e utilizzare BTRFS su Fedora 33.

Creazione di un filesystem BTRFS:

Per sperimentare la compressione dei dati a livello di filesystem BTRFS, è necessario creare un filesystem BTRFS.

Per creare un filesystem BTRFS con l'etichetta dati sul SDB1 partizione, eseguire il seguente comando:

$ sudo mkfs.BTRFS -L Data /Dev /SDB1

Montare un filesystem BTRFS:

Crea una directory /dati con il seguente comando:

$ sudo mkdir -v /dati

Per montare il filesystem BTRFS creato su SDB1 partizione sul /dati Directory, eseguire il seguente comando:

$ sudo Mount /Dev /SDB1 /Data

Il filesystem BTRFS dovrebbe essere montato, come puoi vedere nello screenshot seguente.

$ df -h /dati

Installazione di strumenti di deduplicazione su Ubuntu 20.04 LTS:

Per deduplicare un filesystem BTRFS, è necessario installare il DuperEmove Programma sul tuo computer.

Se stai usando Ubuntu 20.04 LTS, quindi puoi installare DuperEmove Dal repository del pacchetto ufficiale di Ubuntu.

Innanzitutto, aggiorna la cache del repository del pacchetto APT con il seguente comando:

$ sudo apt update

Installa il DuperEmove pacchetto con il seguente comando:

$ sudo apt install DuperEmove -y

IL DuperEmove Il pacchetto dovrebbe essere installato.

Installazione di strumenti di deduplicazione su Fedora 33:

Per deduplicare un filesystem BTRFS, è necessario installare il DuperEmove Programma sul tuo computer.

Se stai usando Fedora 33, puoi installare DuperEmove Dal repository di pacchetti ufficiali di Fedora.

Innanzitutto, aggiorna la cache del repository del pacchetto DNF con il seguente comando:

$ sudo dnf makecache

Installa il DuperEmove pacchetto con il seguente comando:

$ sudo dnf install duperemove

Per confermare l'installazione, premere Y e poi premere .

IL DuperEmove Il pacchetto dovrebbe essere installato.

Test di deduplicazione su un filesystem BTRFS:

In questa sezione, farò un semplice test per mostrarti come la funzione di deduplicazione del filesystem BTRFS rimuove i dati ridondanti dal filesystem e risparmia spazio su disco.

Come potete vedere,

  1. Ho copiato un file QGIS-OsGeo4W-3.14.0-1-Setup-X86_64.exe al /dati directory. Il file è 407 Mb in misura.
  2. Il file memorizzato sul file /dati La directory è di dimensioni 407 MB.
  3. Solo il file consumato 412 Mb dello spazio su disco dal filesstem BTRFS montato sul /dati directory.

Come potete vedere,

  1. Ho copiato lo stesso file al /dati directory e rinominato QGIS-OsGeo4W-3.14.0-1-Setup-X86_64.2.exe.
  2. Il file memorizzato sul file /dati La directory è ora 814 MB in misura.
  3. I file consumati 820 MB dello spazio su disco dal filesstem BTRFS montato sul /dati directory.

Per eseguire l'operazione di deduplicazione sul filesstem BTRFS montato sul /dati Directory, eseguire il seguente comando:

$ sudo DuperEmove -Dr /Data

I blocchi di dati ridondanti dal filesstem BTRFS montati sul /dati La directory dovrebbe essere rimossa.

Come potete vedere,

  1. Ho i file QGIS-OsGeo4W-3.14.0-1-Setup-X86_64.exe E QGIS-OsGeo4W-3.14.0-1-Setup-X86_64.2.exe In /dati directory.
  2. Il file memorizzato sul file /dati La directory è ora 814 MB in misura.
  3. I file consumati 412 Mb dello spazio su disco dal filesstem BTRFS montato sul /dati directory.

IL DuperEmove Programma rimosso i blocchi di dati ridondanti (duplicati) dal filesstem BTRFS montati sul /dati directory e salvato molti spazi per discorsi.

Montaggio automatico di un filesystem BTRFS su avvio:

Per montare il filesystem BTRFS che hai creato, è necessario conoscere l'UUID del filesystem BTRFS.

Puoi trovare l'UUID del filesystem BTRFS montato sul /dati Directory con il seguente comando:

$ sudo btrfs show /dati

Come puoi vedere, l'UUID del filesystem BTRFS che voglio montare al momento dell'avvio è E39AC376-90DD-4C39-84D2-E77ABB5E3059. Sarà diverso per te. Quindi, assicurati di sostituirlo con il tuo da ora in poi.

Apri il /etc/fstab file con il nano Editor di testo come segue:

$ sudo nano /etc /fstab

Digitare nella riga seguente alla fine del /etc/fstab file:

UUID = E39AC376-90DD-4C39-84D2-E777ABB5E3059 /DATA BTRFS Imposta

NOTA: Sostituisci l'UUID del filesystem BTRFS con il tuo. Inoltre, cambia l'opzione di montaggio e l'algoritmo di compressione come preferisci.

Una volta che hai finito, premere + X seguito da Y E per salvare il /etc/fstab file.

Per avere effetto le modifiche, riavviare il computer con il seguente comando:

$ sudo riavvia

Una volta che il tuo computer si avvia, il filesystem BTRFS dovrebbe essere montato nel /Directory dei dati, Come puoi vedere nello screenshot qui sotto.

$ df -h /dati

Eseguire automaticamente la deduplicazione utilizzando Cron Job:

Per rimuovere i dati ridondanti dal filesystem BTRFS, è necessario eseguire il DuperEmove comanda ogni tanto.

Puoi eseguire automaticamente il file DuperEmove comandare ogni ora, giornaliero, settimanale, mensile, annuale o al momento dell'avvio utilizzando un lavoro cron.

Innanzitutto, trova il percorso completo del DuperEmove comando con il seguente comando:

$ che DuperEmove

Come puoi vedere, il percorso completo del DuperEmove il comando è /USR/Bin/DuperEmove. Ricorda il percorso come ne avrai bisogno in seguito.

Per modificare il file Crrontab, eseguire il comando seguente:

$ sudo crontab -e

Seleziona un editor di testo che ti piace e premi .

Userò il nano editor di testo. Quindi, scriverò 1 e premere .

Il file crontab dovrebbe essere aperto.

Per eseguire il DuperEmove comando sul /dati Directory ogni ora, aggiungi la seguente riga alla fine del file Crrontab.

@hourly/usr/bin/duperemove -dr/dati >>/var/log/duperemove.tronco d'albero

Per eseguire il DuperEmove comando sul /dati Directory ogni giorno, aggiungi la seguente riga alla fine del file Crrontab.

@daily/usr/bin/duperemove -dr/dati >>/var/log/duperemove.tronco d'albero

Per eseguire il DuperEmove comando sul /dati Directory ogni settimana, aggiungi la seguente riga alla fine del file Crrontab.

@weekly/usr/bin/duperemove -dr/dati >>/var/log/duperemove.tronco d'albero

Per eseguire il DuperEmove comando sul /dati Directory ogni mese, aggiungi la seguente riga alla fine del file Crrontab.

@monthly/usr/bin/duperemove -dr/dati >>/var/log/duperemove.tronco d'albero

Per eseguire il DuperEmove comando sul /dati Directory ogni anno, aggiungi la seguente riga alla fine del file Crrontab.

@yearly/usr/bin/duperemove -dr/dati >>/var/log/duperemove.tronco d'albero

Per eseguire il DuperEmove comando sul /dati Directory al momento dell'avvio, aggiungi la seguente riga alla fine del file Crrontab.

@reboot/usr/bin/duperemove -dr/dati >>/var/log/duperemove.tronco d'albero

NOTA: Eseguirò il DuperEmove comando al momento dell'avvio in questo articolo.

Una volta che hai finito, premere + X seguito da Y E Per salvare il file crontab.

Dovrebbe essere installato un nuovo lavoro cron.

Per avere effetto le modifiche, riavviare il computer con il seguente comando:

$ sudo riavvia

Come il DuperEmove Il comando funziona in background, l'output del comando verrà archiviato in /var/log/duperemove.tronco d'albero file.

$ sudo ls -lh/var/log/duperemove*

Come puoi vedere, il /var/log/duperemove.tronco d'albero Il file contiene il DuperEmove Dati di registro. Significa che il lavoro cron sta funzionando bene.

Conclusione:

In questo articolo, ti ho mostrato come installare il DuperEmove Strumento di deduplicazione BRTFS su Ubuntu 20.04 LTS e FEDORA 33. Ti ho anche mostrato come eseguire la deduplicazione BTRFS utilizzando lo strumento DuperEmove ed eseguire automaticamente lo strumento DuperEmove utilizzando un lavoro Cron.