Databricks non è solo una soluzione open source, ma è una combinazione di più fonti sono Spark, Deltalake e ML Flow. I flussi di lavoro DataBricks contengono la sezione Giobbe per avviare attività diverse creando un lavoro nella piattaforma Databricks. I lavori si trovano nel dominio dei flussi di lavoro all'interno della piattaforma Databricks per eseguire diverse attività attraverso di essi.
Cominciamo con come creare un lavoro nella piattaforma Databricks utilizzando l'account AWS.
Crea un lavoro in AWS Databricks
Per creare un lavoro in AWS Databricks, accedi all'account Databricks fornendo l'e -mail e la password:
Sulla piattaforma Databricks, fai clic su "Crea spazio di lavoro"Pulsante per aprire un menu a discesa. Successivamente, fai clic su "Inizia QuickStart"Pulsante dal menu a discesa:
Fornire le credenziali dell'area di lavoro e quindi fare clic su "Inizia QuickStart"Pulsante:
Facendo clic sul pulsante QuickStart porterà l'utente sull'account AWS. Sulla piattaforma AWS, crea uno stack selezionando la casella di controllo del riconoscimento e quindi facendo clic su "Crea stackIl pulsante creerà lo stack per l'area di lavoro Databricks:
Aspetta qualche istante per il processo di creazione dello stack. Una volta creato lo stack, torna alla finestra Databricks:
Sulla piattaforma Databricks, è stato creato un'area di lavoro ed è in "Corsa" stato. Clicca sul "Aprire"Collegamento per aprire l'area di lavoro nella nuova scheda sul browser Web:
La nuova scheda richiederà all'utente di accedere all'account Databricks:
Prima di creare un lavoro, l'utente ha bisogno di un notebook per eseguire l'attività. Clicca sul "Taccuino"Dal pannello sinistro sull'account Databricks:
Immettere le credenziali del notebook e quindi fare clic su "Creare"Pulsante:
Dopodiché, crea un "Grappolo"Facendo clic su di esso dal pannello sinistro sulla piattaforma Databricks:
Fornire le impostazioni del cluster e fare clic su "Crea cluster"Pulsante:
Una volta creato il cluster, espandi "Nuovo"Pulsante dal pannello sinistro sulla piattaforma per fare clic su"Lavori"Pulsante:
Fornire il nome dell'attività e quindi il percorso del quaderno, in cui l'attività verrà salvata. Successivamente, selezionare il cluster e fare clic su "Creare"Pulsante per creare un lavoro in Databricks:
Un'attività all'interno di un lavoro è stata creata con il percorso del notebook come ambiente di runtime per l'attività:
Hai creato correttamente un lavoro nella piattaforma Databricks utilizzando l'account AWS.
Conclusione
Per creare un lavoro in DataBricks utilizzando l'account AWS, accedi a Databricks e crea uno spazio di lavoro utilizzando l'account AWS. Una volta creato l'area di lavoro, vai semplicemente al suo interno facendo clic su "Aprire"Collegamento e accedere di nuovo all'account Databrick. Crea un notebook sull'area di lavoro e quindi crea un lavoro assegnando un'attività utilizzando il notebook. Questo post ti ha insegnato come creare un lavoro nella piattaforma Databricks utilizzando l'account AWS.