Come creare un cluster a spostamento verso il rosso su AWS

Come creare un cluster a spostamento verso il rosso su AWS
Possiamo utilizzare i database per archiviare e gestire set di dati strutturati, ma ciò non è sufficiente per l'analisi e il processo decisionale. A tal fine, dobbiamo estrarre i risultati richiesti da questi dati utilizzando Data Warehousing. Un data warehouse è simile a un normale database SQL. Ma, invece di archiviare scopi, sono progettati per eseguire analisi e domande sui dati. Usando questo, possiamo leggere una quantità molto elevata di dati in un breve periodo e studiare le tendenze e le relazioni tra di essa. In questo articolo, discuteremo di Redshift e come può essere creato su AWS.

Cos'è Amazon Redshift

AWS Redshift è un data warehouse specificamente utilizzato per l'analisi dei dati su set di dati più grandi o più grandi. È un servizio gestito da AWS, quindi puoi impostare facilmente in breve tempo con pochi clic. Per impostare Redshift, è necessario creare i nodi che si combinano per formare un cluster di spostamento verso il rosso. Un cluster può avere un massimo di 128 nodi. Di cui, un nodo è configurato come nodo principale che può gestire tutti gli altri nodi e archiviare i risultati interrogati. Ogni nodo può richiedere fino a 128 TB di dati da elaborare. Utilizzando Redshift, è possibile interrogare i dati circa dieci volte più veloce dei database normali.

Di solito, i dati che devono essere analizzati vengono inseriti nel secchio S3 o altri database. Ma puoi anche interrogare direttamente i dati in S3 utilizzando lo spettro Redshift. Inoltre, puoi anche utilizzare le istanze di Firehose di Kinesis Data o EC2 per scrivere i dati sul cluster RedShift.

Questo servizio è limitato all'operazione solo in un'unica zona di disponibilità, ma puoi prendere le istantanee del cluster di spostamento verso il rosso e copiarli in altre zone. Questo processo può anche essere automatizzato per aiutare nel ripristino di emergenza.

Nella sezione successiva, discuteremo di come creare e configurare il cluster RedShift su AWS utilizzando la console di gestione AWS e l'interfaccia della riga di comando.

Creazione di cluster RedShift utilizzando la console

Innanzitutto, accedi al tuo account AWS utilizzando le credenziali AWS e cerca Redshift utilizzando la barra di ricerca superiore. Questo ti porterà alla console Redshift.

Clicca sul Crea cluster Per iniziare a creare un nuovo cluster di spostamento verso il rosso.

Nella sezione di configurazione, è necessario fornire l'identificatore o il nome per il cluster Redshift. Il nome del cluster di spostamento verso il rosso deve essere unico all'interno della regione e può contenere da 1 a 63 caratteri.

Dopo aver fornito l'identificatore univoco del cluster, chiederà se è necessario scegliere tra produzione o livello gratuito. Per evitare costi aggiuntivi, utilizzeremo il tipo di livello gratuito per questo scopo dimostrativo.

Con il tipo di livello gratuito, ottieni un DC2.grande nodo a spostamento verso il rosso con tipi di archiviazione SSD e potenza di calcolo di 2 VCPU.

Con l'opzione di livello gratuito, AWS carica automaticamente alcuni dati di esempio nel cluster RedShift per aiutarti a conoscere AWS Redshift.

I dati di esempio caricati da AWS sono chiamati ticket e utilizza un database di esempio chiamato ticket. Ticket contiene singoli file di dati di esempio: due tabelle di fatti e cinque dimensioni.

Dopo aver caricato i dati di esempio, chiederà il nome utente e la password dell'amministratore di autenticarsi con AWS Redshift in modo sicuro. È possibile impostare la password dell'amministratore da solo, oppure può essere generata automaticamente facendo clic su Auto Genera Pulsante password.

Dopo aver fornito il nome utente e la password dell'amministratore, possiamo creare il nostro cluster facendo clic sul Crea cluster nell'angolo in basso a destra.

Questo creerà il nostro nuovo cluster RedShift e caricherà i dati di esempio in esso. Puoi vedere i tuoi cluster disponibili nella console Redshift.

RedShift è una sorta di database SQL che può eseguire analisi sui set di dati e supporta le query di tipo SQL. Per eseguire l'analisi utilizzando Redshift, selezionare il cluster desiderato e fare clic su Dati di query Per creare una nuova domanda.

Per eseguire la query, è necessario connettersi con un cluster di spostamento verso il rosso. Per raggiungere questo obiettivo, selezionare l'opzione disponibile nella parte superiore nel Dati di query sezione.

Innanzitutto, è necessario selezionare la connessione che sarà una nuova connessione se si utilizza per la prima volta il cluster di spostamento. Non abbiamo creato alcun parametro per l'autenticazione utilizzando Secrets Manager, quindi sceglieremo le credenziali temporanee.

Successivamente, dobbiamo selezionare l'identificatore del cluster, il nome del database e l'utente del database. Successivamente, fai clic su Connettiti nell'angolo in basso a destra.

Se la connessione viene stabilita correttamente, è possibile visualizzare lo stato "connesso" nella parte superiore nella sezione dati di query.

Dopo la connessione riuscita, puoi semplicemente scrivere la tua query SQL utilizzando l'editor fornito. Creeremo una nuova tabella con il titolo persone e avere cinque attributi. Una volta completata la domanda, puoi eseguirla usando il correre Opzione in basso.

Crea persone da tavolo (
Personid int,
LastName Varchar (255),
FirstName Varchar (255),
Indirizzo Varchar (255),
City Varchar (255)
);

Quando fai clic su Correre pulsante, creerà una tabella denominata Persone con gli attributi specificati nella query.

L'intero schema del database può essere visto sul lato sinistro nella stessa sezione. Puoi visualizzare la tabella appena creata e i suoi attributi qui:

Quindi qui, abbiamo visto come creare un cluster di spostamento verso il rosso ed eseguire query usandolo in modo semplice.

Creazione del cluster di spostamento verso il redshift utilizzando AWS CLI

Ora vedremo come utilizzare l'interfaccia della riga di comando AWS per configurare un cluster di spostamento verso il rosso. Una volta abituati alla riga di comando e acquisisci un po 'di esperienza, lo troverai più soddisfacente e conveniente della console di gestione AWS.

Innanzitutto, devi configurare AWS CLI sul tuo sistema. Affinché le istruzioni per impostare le credenziali della CLI, visita il seguente articolo:

https: // linuxhint.com/configure-aws-cli-credentials/

Per creare un nuovo cluster di spostamento verso il rosso, è necessario eseguire il comando seguente usando la CLI:

$: AWS RedShift Crea-Cluster \
--tipo nodo \
--Tipo di cluster \
--Numero di nodi \
--Master-Username \
--Master-User-Password < username password> \
--Identificatore cluster

Se il cluster viene creato correttamente nel tuo account AWS, otterrai un output dettagliato, come mostrato nella seguente screenshot:

Quindi, il tuo cluster è creato e configurato. Se si desidera visualizzare tutti i cluster di redshift in una particolare regione, avrai bisogno del seguente comando. Questo ti fornirà i dettagli su tutti i cluster creati sul tuo account AWS.

$: AWS Redshift Descrivi-Clusters

Infine, abbiamo visto come creare facilmente un cluster di spostamento verso il rosso usando la CLI AWS.

Conclusione

Amazon Redshift è un servizio di data warehousing completamente gestito che può essere utilizzato con altri servizi AWS come secchi S3, database RDS, istanze EC2, dati di Kinesis Firehose, Quicksight e molti altri per produrre risultati desiderati dai dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati dati date. Può fornire backup in caso di fallimento per il ripristino di emergenza e ha un'alta sicurezza usando la crittografia, le politiche IAM e VPC. Quindi, è un servizio molto sicuro e affidabile che può analizzare grandi serie di dati a un ritmo veloce.