Come creare la configurazione di inventario nel bucket S3

Come creare la configurazione di inventario nel bucket S3
L'inventario Amazon S3 è una funzionalità fornita da AWS S3 per aiutarti a gestire la tua memoria di secchi S3. L'inventario Amazon S3 può generare diversi tipi di file di output come CSV, ORC e ​​Apache Parquet che includono oggetti S3 e i loro metadati. Può essere configurato per generare report su base giornaliera o settimanale. Se l'inventario Amazon S3 è configurato per generare i rapporti settimanali, genererà il rapporto ogni domenica dopo il rapporto iniziale.

L'inventario Amazon S3 può essere configurato per generare report per oggetti S3 specifici specificando il prefisso. L'inventario può quindi essere inviato al bucket di destinazione all'interno dello stesso account o un account diverso. Più inventari S3 possono anche essere configurati per lo stesso bucket S3 con diversi prefissi di oggetti S3, secchi di destinazione e tipi di file di output. Inoltre, è possibile specificare se il file di inventario sarà crittografato o meno.

Questo blog vedrà come l'inventario può essere configurato nel bucket S3 usando la console di gestione AWS.

Creazione della configurazione dell'inventario

Innanzitutto, accedi alla console di gestione AWS e vai al servizio S3.

Dalla console S3, vai al secchio per il quale si desidera configurare l'inventario.

All'interno del secchio, vai al gestione scheda.

Scorri verso il basso e vai al Configurazione dell'inventario sezione. Clicca sul Crea la configurazione dell'inventario Pulsante per creare la configurazione dell'inventario.

Aprirà una pagina di configurazione per configurare l'inventario. Innanzitutto, aggiungi il nome di configurazione dell'inventario che deve essere univoco all'interno del bucket S3. Quindi fornire il prefisso dell'oggetto S3 se si desidera limitare l'inventario a oggetti S3 specifici. Per coprire tutti gli oggetti nel secchio S3, lasciare il prefisso campo vuoto.

Per questa demo, limiteremo la portata dell'inventario all'oggetto con prefisso log server.

Inoltre, la configurazione dell'inventario può essere limitata alla versione corrente o il precedente può anche essere coperto sotto l'inventario. Per questa demo, limiteremo la portata dell'inventario solo alla versione corrente.

Dopo aver specificato l'ambito dell'inventario, ora chiederà i dettagli del rapporto. Il rapporto può essere salvato nel bucket di destinazione S3 all'interno o attraverso il conto. Innanzitutto, seleziona se si desidera salvare i rapporti di inventario nel secchio S3 nello stesso o un account diverso. Quindi immettere il nome del secchio di destinazione o sfoglia i secchi S3 dalla console.

Una politica del bucket viene aggiunta automaticamente al secchio di destinazione, che consente al bucket di origine di scrivere i dati nel bucket di destinazione. La seguente politica del bucket verrà aggiunta al secchio di destinazione S3 per questa demo.

Dopo aver specificato il secchio di destinazione S3 per il rapporto di inventario, ora fornisci il periodo di tempo in cui verrà generato il rapporto di inventario. Il bucket AWS S3 può essere configurato per generare report di inventario giornaliero o settimanale. Per questa demo, selezioneremo l'opzione Daily Report Generation.

L'opzione di formazione di output specifica in quale formatta verrà generato il file di inventario. AWS S3 supporta i seguenti tre formati di output per l'inventario.

  • CSV
  • Apache Orc
  • Parquet Apache

Per questa demo, selezioneremo il formato di output CSV. IL Stato Le opzioni impostano lo stato della configurazione dell'inventario. Se si desidera abilitare la configurazione dell'inventario S3 subito dopo la crearla, imposta questa opzione su Abilitare.

I report di inventario generati possono essere crittografati sul lato server abilitando il Crittografia lato server opzione. È necessario selezionare la chiave KMS o la chiave gestita dal cliente se abilitata. Per questa demo, non abiliteremo la crittografia sul lato server.

È inoltre possibile personalizzare il rapporto di inventario generato aggiungendo campi aggiuntivi al rapporto. L'inventario AWS S3 fornisce la configurazione per aggiungere ulteriori metadati ai report di inventario. Sotto il Campi aggiuntivi Sezione, selezionare i campi che si desidera aggiungere al rapporto di inventario. Per questa demo, non selezioneremo alcun campo aggiuntivo.

Ora fai clic su creare Pulsante nella parte inferiore della pagina di configurazione per creare la configurazione dell'inventario per il bucket S3. Creerà la configurazione dell'inventario e aggiungerà una politica del secchio al bucket di destinazione. Vai al secchio di destinazione facendo clic sull'URL del secchio di destinazione.

Nel secchio di destinazione S3, vai al autorizzazioni scheda.

Scorri verso il basso fino a Politica del secchio sezione e ci sarà una politica del secchio S3 che consente al bucket di origine S3 di passare i report di inventario al bucket di destinazione S3.

Ora vai al secchio della sorgente S3 e crea un log server directory. Carica un file nella directory utilizzando la console AWS S3.

Dopo aver caricato il file nel secchio di origine S3, potrebbero essere necessarie fino a 48 ore per generare il primo rapporto di inventario. Dopo il rapporto iniziale, il rapporto successivo verrà generato entro il periodo di tempo specificato nella configurazione dell'inventario.

Lettura dell'inventario dal secchio di destinazione S3

Dopo 48 ore di configurazione dell'inventario per il secchio S3, vai al secchio di destinazione S3 e il rapporto di inventario verrà generato per il secchio S3.

I report per l'inventario sono generati in una struttura di directory specifica nel secchio di destinazione S3. Per vedere la struttura della directory, scarica la directory report ed esegui il albero comando all'interno della directory del report.

ubuntu@ubuntu: ~ $ cd linuxhint-demo-bucket
ubuntu@ubuntu: ~ $ albero .

IL demo-inventory-config directory (dal nome del nome di configurazione dell'inventario) all'interno del Linuxhint-demo-bucket (Premante il nome del secchio S3 della sorgente) contiene tutti i dati relativi al rapporto di inventario.

IL dati La directory include i file CSV compressi in formato GZIP. Decomprimere un file e gatto nel terminale.

ubuntu@ubuntu: ~ $ gunzip
ubuntu@ubuntu: ~ $ cat

Le directory all'interno della directory demo-inventory-config, che prende il nome dalla data in cui vengono creati, includono i metadati dei rapporti di inventario. Usa il gatto comanda di leggere il manifest.file json.

ubuntu@ubuntu: ~ $ cat 2022-02-17t00-00z/manifest.JSON

Allo stesso modo, il alveare La directory include file che indicano il rapporto di inventario di una data specifica. Usa il gatto comanda di leggere uno qualsiasi dei sintesi.file txt.

ubuntu@ubuntu: ~ $ cat hive/dt \ = 2022-02-17-00-00/symlink.TXT

Conclusione

AWS S3 fornisce la configurazione dell'inventario per gestire l'archiviazione e generare report di audit. L'inventario S3 può essere configurato per oggetti S3 specifici specificati dal prefisso dell'oggetto S3. Inoltre, è possibile creare più configurazioni di inventario per un singolo secchio S3. Questo blog descrive la procedura dettagliata per la creazione di configurazioni di inventario S3 e la lettura dei report di inventario dal secchio di destinazione S3.