Installa i notebook Anaconda Python e Jupyter per la scienza dei dati

Installa i notebook Anaconda Python e Jupyter per la scienza dei dati

Iniziare con Anaconda

Per spiegare cosa è Anaconda, citeremo la sua definizione dal sito ufficiale:

Anaconda è un gestore di pacchetti di facile installazione gratuito, ambientale e distribuzione di Python con una raccolta di oltre 1.000 pacchetti open source con supporto comunitario gratuito. Anaconda è agnostica della piattaforma, quindi puoi usarlo sia su Windows, MacOS o Linux.

È facile proteggere e ridimensionare qualsiasi progetto di scienze dati con Anaconda in quanto consente nativamente di prendere un progetto dal tuo laptop direttamente al cluster di distribuzione. Un set completo di funzionalità può essere mostrato anche qui con l'immagine ufficiale:

Anaconda Enterprise

Per mostrare in breve cos'è Anaconda, ecco alcuni punti rapidi:

  • Contiene Python e centinaia di pacchetti che sono particolarmente utili se si inizia o sperimentano con la scienza dei dati e l'apprendimento automatico
  • Viene fornito con Conda Package Manager e ambienti virtuali che lo sviluppo molto facilmente
  • Ti consente di iniziare con lo sviluppo molto velocemente senza perdere tempo per impostare strumenti per la scienza dei dati e l'apprendimento automatico

Puoi installare Anaconda da qui. Installerà automaticamente Python sulla tua macchina in modo da non doverlo installarlo separatamente.

Notebook Anaconda vs Jupyter

Ogni volta che provo a discutere di Anaconda con persone che sono principianti con Python e Data Science, si confondono tra i quaderni Anaconda e Jupyter. Citereremo la differenza in una riga:

Anaconda È Gestore dei pacchetti. Jupyter è un livello di presentazione.

Anaconda cerca di risolvere il Dipendenza Inferno In Python-dove diversi progetti hanno versioni di dipendenza diverse, così da non rendere diverse dipendenze del progetto richiedono versioni diverse, che possono interferire tra loro.

Jupyter cerca di risolvere il problema di riproducibilità Nell'analisi consentendo un approccio iterativo e pratico per spiegare e visualizzare il codice; Utilizzando la documentazione di testo ricco combinato con rappresentazioni visive, in un'unica soluzione.

Anaconda è simile a Pyenv, Venv e Minconda; Ha lo scopo di ottenere un ambiente Python riproducibile al 100% su un altro ambiente, indipendentemente da qualsiasi altra versioni delle dipendenze di un progetto sono disponibili. È un po 'simile a Docker, ma limitato all'ecosistema di Python.

Jupyter è un Strumento di presentazione straordinario per il lavoro analitico; Laddove puoi presentare il codice in "blocchi", si combinano con ricche descrizioni di testo tra blocchi e l'inclusione dell'output formattato dai blocchi e i grafici generati in una questione ben progettata mediante il codice di un altro blocco.

Jupyter è incredibilmente bravo nel lavoro analitico per garantire riproducibilità Nella ricerca di qualcuno, così chiunque può tornare molti mesi dopo e capire visivamente cosa qualcuno ha cercato di spiegare e vedere esattamente quale codice ha guidato quale visualizzazione e conclusione.

Spesso nel lavoro analitico, finirai con tonnellate di quaderni a semile che spiegano idee di prova di concetto, di cui la maggior parte non porterà da nessuna parte inizialmente. Alcune di queste presentazioni potrebbero mesi dopo o addirittura anni dopo presente una base da cui costruire per un nuovo problema.

Usando il taccuino Anaconda e Jupyter di Anaconda

Infine, daremo un'occhiata ad alcuni comandi con cui saremo in grado di usare Anaconda, Python e Jupyter sulla nostra macchina Ubuntu. Innanzitutto, scaricheremo lo script di installazione dal sito Web Anaconda con questo comando:

Curl -o -k https: // Repo.anaconda.com/archivio/anaconda3-5.2.0-Linux-X86_64.sh

Dobbiamo anche garantire l'integrità dei dati di questo script:

sha256sum anaconda3-5.2.0-Linux-X86_64.sh

Otterremo il seguente output:

Controlla l'integrità di Anaconda

Ora possiamo eseguire lo script Anaconda:

Bash Anaconda3-5.2.0-Linux-X86_64.sh

Una volta accettati i termini, fornire una posizione per l'installazione di pacchetti o semplicemente premi Invio per prendere la posizione predefinita. Una volta completata l'installazione, possiamo attivare l'installazione con questo comando:

Fonte ~/.Bashrc

Infine, testare l'installazione:

Elenco Conda

Fare un ambiente anaconda

Una volta che abbiamo in atto un'installazione completa, possiamo utilizzare il seguente comando per creare un nuovo ambiente:

Conda Create --Name my_env python = 3

Ora possiamo attivare l'ambiente che abbiamo realizzato:

sorgente attivare my_env

Con questo, il nostro prompt dei comandi cambierà, riflettendo un ambiente anaconda attivo. Per continuare con la creazione di un ambiente jupyter, continua con questa lezione che è un'eccellente lezione su come installare i quaderni di Jupyter su Ubuntu e iniziare a usarli.

Conclusione: installa i notebook Anaconda Python e Jupyter per la scienza dei dati

In questa lezione, abbiamo studiato come possiamo installare e iniziare a utilizzare l'ambiente Anaconda su Ubuntu 18.04 che è un eccellente gestore dell'ambiente da avere, in particolare per i principianti per la scienza dei dati e l'apprendimento automatico. Questa è solo un'introduzione molto semplice di molte lezioni per Anaconda, Python, Data Science e Machine Learning. Condividi il tuo feedback per la lezione con me o per Handle Twitter Linuxhint.