Tutorial di Python Seaborn

Tutorial di Python Seaborn
In questa lezione sulla biblioteca di Python Seaborn, esamineremo vari aspetti di questa biblioteca di visualizzazione dei dati che possiamo usare con Python per generare grafici belli e intuitivi che possono visualizzare i dati in una forma che il business desidera da una piattaforma. Per completare questa lezione, copriremo le seguenti sezioni:
  • Cos'è Python Seaborn?
  • Tipi di trame che possiamo costruire con Seaborn
  • Lavorare con più trame
  • Alcune alternative per Python Seaborn

Sembra molto da coprire. Iniziamo ora.

Cos'è la biblioteca di Python Seaborn?

La biblioteca Seaborn è un pacchetto Python che ci consente di fare infografiche basate su dati statistici. Come è fatto sopra Matplotlib, quindi è intrinsecamente compatibile con esso. Inoltre, supporta la struttura dei dati Numpy e Panda in modo che la pianificazione possa essere eseguita direttamente da quelle raccolte.

Visualizzazione di dati complessi è una delle cose più importanti che Seaborn si prende cura. Se dovessimo confrontare Matplotlib con Seaborn, Seaborn è in grado di rendere queste cose facili da ottenere con Matplotlib. Tuttavia, è importante notare che Seaborn non è un'alternativa a Matplotlib ma un complemento. Durante questa lezione, utilizzeremo anche le funzioni di matplotlib nei frammenti di codice. Selererai di lavorare con Seaborn nei seguenti casi d'uso:

  • Hai dati statistici delle serie temporali da tracciare con la rappresentazione dell'incertezza sulle stime
  • Stabilire visivamente la differenza tra due sottoinsiemi di dati
  • Per visualizzare le distribuzioni univariate e bivariate
  • Aggiungendo molto più affetto visivo ai grafici Matplotlib con molti temi incorporati
  • Per adattarsi e visualizzare i modelli di apprendimento automatico attraverso la regressione lineare con variabili indipendenti e dipendenti

Solo una nota prima di iniziare è che utilizziamo un ambiente virtuale per questa lezione che abbiamo fatto con il seguente comando:

Python -m Virtualenv Seaborn
Fonte Seaborn/Cestino/Attiva

Una volta che l'ambiente virtuale è attivo, possiamo installare la biblioteca Seaborn all'interno dell'EVT virtuale in modo che gli esempi che creiamo dopo possano essere eseguiti:

PIP Installa Seaborn

Puoi usare anche Anaconda per eseguire questi esempi, il che è più facile. Se vuoi installarlo sulla tua macchina, guarda la lezione che descrive “Come installare Anaconda Python su Ubuntu 18.04 LTS ”e condividi il tuo feedback. Ora, andiamo avanti verso vari tipi di trame che possono essere costruiti con Python Seaborn.

Utilizzo del set di dati Pokemon

Per mantenere questa lezione pratica, useremo il set di dati Pokemon che può essere scaricato da Kaggle. Per importare questo set di dati nel nostro programma, utilizzeremo la libreria Pandas. Ecco tutte le importazioni che eseguiamo nel nostro programma:

Importa panda come PD
da matplotlib import pyplot come plt
Importa Seaborn come SNS

Ora, possiamo importare il set di dati nel nostro programma e mostrare alcuni dei dati di esempio con panda come:

df = pd.read_csv ('pokemon.CSV ', index_col = 0)
df.Testa()

Si noti che per eseguire lo snippet di codice sopra, il set di dati CSV dovrebbe essere presente nella stessa directory del programma stesso. Una volta eseguito lo snippet di codice sopra, vedremo il seguente output (nel taccuino di Anaconda Jupyter):

Tramatura della curva di regressione lineare

Una delle cose migliori di Seaborn sono le funzioni di tracciamento intelligenti che fornisce che non solo visualizza il set di dati che forniamo, ma costruiscono anche modelli di regressione intorno ad esso. Ad esempio, è possibile costruire un diagramma di regressione lineare con una singola riga di codice. Ecco come farlo:

SNS.LMPlot (x = 'Attack', y = 'Defence', Data = DF)

Una volta eseguito lo snippet di codice sopra, vedremo il seguente output:

Abbiamo notato alcune cose importanti nello snippet di codice sopra:

  • C'è una funzione di trama dedicata disponibile in Seaborn
  • Abbiamo usato la funzione di adattamento e tracciamento di Seaborn che ci ha fornito una linea di regressione lineare che si è modellata

Non aver paura se pensavi che non possiamo avere una trama senza quella linea di regressione. Noi possiamo ! Proviamo ora un nuovo frammento di codice, simile a quello dell'ultimo:

SNS.LMPlot (x = 'Attack', y = 'Defence', Data = DF, Fit_reg = False)

Questa volta, non vedremo la linea di regressione nella nostra trama:

Ora questo è molto più chiaro (se non abbiamo bisogno della linea di regressione lineare). Ma questo non è ancora finito. Seaborn ci consente di rendere diverso questo trama ed è quello che faremo.

Costruire trame di scatole

Una delle più grandi caratteristiche di Seaborn è il modo in cui accetta prontamente la struttura dei dati dei dati Pandas per tracciare i dati. Possiamo semplicemente passare un frame dati alla Biblioteca Seaborn in modo che possa costruire un diagramma da parte di esso:

SNS.boxplot (data = df)

Una volta eseguito lo snippet di codice sopra, vedremo il seguente output:

Possiamo rimuovere la prima lettura del totale in quanto sembra un po 'imbarazzante quando stiamo effettivamente pianificando singole colonne qui:

stats_df = df.caduta (['totale'], axis = 1)
# Nuovo boxplot usando stats_df
SNS.boxplot (data = stats_df)

Una volta eseguito lo snippet di codice sopra, vedremo il seguente output:

Sciame trama con Seaborn

Possiamo costruire un diagramma di sciame intuitivo con Seaborn. Useremo di nuovo il frame dati dei panda che abbiamo caricato in precedenza, ma questa volta chiameremo la funzione di spettacolo di Matplotlib per mostrare la trama che abbiamo realizzato. Ecco lo snippet di codice:

SNS.set_context ("carta")
SNS.SwarmPlot (x = "Attack", y = "Defense", Data = DF)
Plt.spettacolo()

Una volta eseguito lo snippet di codice sopra, vedremo il seguente output:

Usando un contesto di Seaborn, permettiamo a Seaborn di aggiungere un tocco personale e un design fluido per la trama. È possibile personalizzare ulteriormente questa trama con le dimensioni del carattere personalizzato utilizzate per le etichette nella trama per semplificare la lettura. Per fare questo, passeremo più parametri alla funzione set_context che si comporta come ciò che suonano. Ad esempio, per modificare la dimensione del carattere delle etichette, faremo uso del carattere.parametro dimensione. Ecco lo snippet di codice per eseguire la modifica:

SNS.set_context ("carta", font_scale = 3, rc = "font.dimensione ": 8".Etichetta ": 5)
SNS.SwarmPlot (x = "Attack", y = "Defense", Data = DF)
Plt.spettacolo()

Una volta eseguito lo snippet di codice sopra, vedremo il seguente output:

La dimensione del carattere per l'etichetta è stata modificata in base ai parametri che abbiamo fornito e del valore associati al carattere.parametro dimensione. Una cosa a cui Seaborn è esperta è rendere la trama molto intuitiva per l'uso pratico e questo significa che Seaborn non è solo un pacchetto Python di pratica, ma in realtà qualcosa che possiamo usare nelle nostre distribuzioni di produzione.

Aggiunta di un titolo alle trame

È facile aggiungere titoli ai nostri trame. Dobbiamo solo seguire una semplice procedura di utilizzo delle funzioni a livello di assi in cui chiameremo il set_title () Funziona come mostriamo nello snippet di codice qui:

SNS.set_context ("carta", font_scale = 3, rc = "font.dimensione ": 8".Etichetta ": 5)
my_plot = sns.SwarmPlot (x = "Attack", y = "Defense", Data = DF)
my_plot.set_title ("lh swarm trap")
Plt.spettacolo()

Una volta eseguito lo snippet di codice sopra, vedremo il seguente output:

In questo modo, possiamo aggiungere molte più informazioni ai nostri appezzamenti.

Seaborn vs Matplotlib

Mentre abbiamo esaminato gli esempi in questa lezione, possiamo identificare che Matplotlib e Seaborn non possono essere confrontati direttamente ma possono essere visti come complementari a vicenda. Una delle caratteristiche che porta il 1 ° passo avanti di Seaborn è il modo in cui Seaborn può visualizzare statisticamente i dati.

Per sfruttare al meglio i parametri di Seaborn, consigliamo vivamente di guardare la documentazione di Seaborn e scoprire quali parametri utilizzare per rendere la trama il più vicino possibile alle esigenze aziendali.

Conclusione

In questa lezione, abbiamo esaminato vari aspetti di questa libreria di visualizzazione dei dati che possiamo usare con Python per generare grafici belli e intuitivi che possono visualizzare i dati in una forma che desidera da una piattaforma. Il Seaborm è una delle più importanti librerie di visualizzazione quando si tratta di ingegneria dei dati e presentazioni nella maggior parte delle forme visive, sicuramente un'abilità che dobbiamo avere sotto la nostra cintura in quanto ci consente di creare modelli di regressione lineare.

Condividi il tuo feedback sulla lezione su Twitter con @sbmaggarwal e @linuxhint.