Cominciamo con il servizio Amazon EMR.
Iniziare con AWS EMR
Amazon EMR è un servizio di gestione dei dati che utilizza vari framework per l'analisi dei big data creando cluster utilizzando le istanze di Amazon EC2 e il suo flusso di lavoro è stato spiegato di seguito:
Pianifica e configura: Per creare un cluster EMR, l'utente deve pianificare l'archiviazione necessaria per gestire i big data e quindi scegliere i framework per analizzare i big data.
Maneggio: La gestione del cluster può essere eseguita collegando ad esso e quindi inviando i dati sul cluster per verificare i risultati prima di terminare il cluster:
Ripulire: Questo passaggio è per terminare il cluster e le sue risorse ed è importante poiché i cluster inattivi possono costare molto all'utente:
Nodo in emr
Un cluster EMR è una combinazione di istanze EC2 e ogni istanza è chiamata nodo e i suoi tipi sono spiegati di seguito:
Nodo principale: È il nodo principale o il nodo leader che è responsabile della gestione di tutte le risorse del cluster.
Nodo centrale: Host Host Hadoop Distributed File System (HDFS) Dati ed esegue le attività del nodo primario e il nodo primario gestisce le attività per il nodo core.
Nodo di attività: Questi nodi non ospitano dati ma eseguono attività per i nodi precedenti ed è un nodo helper, il che significa che non è obbligatorio creare durante l'avvio del cluster EMR:
Crea cluster EMR
Per creare un cluster sul servizio EMR di AWS, vai nella dashboard EMR cercando il servizio dalla console Amazon:
In questa pagina, selezionare "Gruppi"Dal pannello sinistro e fai clic su"Crea cluster"Pulsante:
Nella pagina di creazione del cluster, fai clic su "Vai alle opzioni anticipate" collegamento:
Configurazione del software: Nella pagina Impostazioni anticipate, l'utente può scegliere vari quadri di elaborazione dei dati open source e il servizio offre anche la creazione di più nodi sull'istanza EC2:
Configurazione hardware: In questa pagina, l'utente può configurare le risorse richieste per il cluster EMR disponibile sul cloud:
Nodi e istanze del cluster: Questa sezione offre all'utente di configurare i tipi di nodi che creeranno le istanze EC2 con risorse configurate:
Sicurezza: Nell'ultima pagina, selezionare il file della coppia di tasti privati EC2 che può essere creato nella pagina della coppia di tasti dalla dashboard EC2 per connettersi ai nodi:
Il cluster EMR verrà visualizzato sulla sua pagina:
Hai creato con successo un cluster EMR su AWS.
Conclusione
Il servizio AWS EMR viene utilizzato per creare cluster per pianificare l'archiviazione per i big data da utilizzare con l'aiuto del file system distribuito. Ogni cluster viene creato con più nodi (istanze EC2) collegate ad esso che può creare e connettersi alla macchina virtuale vuota sul cloud. Questi cluster possono essere utilizzati per gestire i big data sul cloud senza che le risorse vengano utilizzate dal sistema.