Come creare un lavoro ETL in colla AWS

Come creare un lavoro ETL in colla AWS

AWS Glue è un potente servizio di calcolo senza server di AWS, molte aziende hanno iniziato a utilizzarlo per la business intelligence e l'integrazione dei dati. La colla AWS viene anche utilizzata per la creazione, la gestione e l'esecuzione del lavoro ETL Job, ETL (estratto, trasformazione e caricamento) è un processo per spostare i dati dal database di origine nel database di destinazione.

Questo post fornirà una guida procedurale per la creazione di un lavoro ETL in colla AWS.

Crea un lavoro ETL in colla AWS

Nella console di gestione di Amazon, ricerca Colla aws E fai clic su di esso:

Clicca su Jobs:

Il prossimo passo è scegliere il metodo di creazione del lavoro, in questo post Let's Seleziona una visualizzazione con una sorgente e target e seleziona sorgente e target:

Clicca sul lavoro ETL:

Seleziona l'origine e fornisci il tipo di origine S3, l'URL S3 e il formato dei dati:

Selezionare il secchio di destinazione S3 e fornire il formato, il tipo di compressione e la posizione target S3:

Seleziona la scheda Dettagli del lavoro e scegli il ruolo IAM:

Lascia l'altra opzione come predefinita e fai clic su Salva:

Apparirà un messaggio di successo:

Gestisci lavoro ETL in colla AWS

Clicca il Correre pulsante:

Un messaggio di successo apparirà sullo schermo una volta che il lavoro inizierà:

Vai alla scheda Runs, per vedere se lo stato di corsa del lavoro ETL:

Ferma il lavoro ETL in colla AWS

Per fermare il lavoro ETL nella scheda Runs, fare clic sul lavoro di arresto correre pulsante:

Lo stato del lavoro cambierà come fermato:

Elimina il lavoro ETL in colla AWS

Fare clic sull'elenco a discesa Action e selezionare l'opzione Elimina:

Clicca sul Eliminare pulsante:

Un messaggio di successo apparirà una volta che il lavoro eliminerà:

Un lavoro viene eliminato con successo.

Conclusione

Per creare un lavoro ETL in AWS, vai a AWS Glue e seleziona Jobs, scegli il metodo per creare un lavoro, fornisci i dettagli richiesti del database di origine e del database di destinazione e fare clic sul pulsante Salva per creare un lavoro ETL. Dopo aver creato il lavoro ETL, puoi eseguire, fermare ed eliminare facilmente il lavoro.