Seaborn Boxplot

Seaborn Boxplot
Seaborn è un modulo Python per la creazione di visualizzazioni numeriche. Si basa sulla libreria Matplotlib e interagisce ampiamente con i file di intestazione Pandas. Seaborn aiuta gli utenti ad analizzare e comprendere i dati. Le sue funzioni di visualizzazione funzionano con struttura e array di dati, inclusi interi record, fornendo la mappatura semantica richiesta e l'insieme di associazioni internamente per generare grafici utili. La sua fonte di dati, API esplicita, consente agli utenti di concentrarsi sull'interpretazione dei grafici anziché sui tecnicismi di presentarli.

L'interoperabilità della trama di Seaborn consente all'utente di accedervi in ​​vari scenari, come analisi esplorativa, interattività effettiva nelle app grafiche e risultati archiviati in una varietà di rappresentazioni grafiche e vettoriali.

Un diagramma di scatola tende a mantenere organizzati i dati statistici in modo che le analisi all'interno dei parametri o anche attraverso un insieme di attributi siano più chiari. Se fornito, i percentili e i valori critici per la mediana sono mostrati nel frame di base del diagramma della scatola. I punti dati sono linee orizzontali che attraversano il centro di ogni casella, mentre i baffi rappresentano linee parallele che si espandono ai suoi set di dati più eccessivi e i capsuli rappresentano le linee tracciate che attraversano i bordi dei baffi. Boxplot può anche essere utilizzato per trovare i valori anomali in un determinato frame di dati.

Impareremo i metodi per disegnare grafici a box dal modulo Seaborn in questo tutorial di Linux.

Utilizzo del metodo BoxPlot ()

La funzione boxplot () viene utilizzata per disegnare un diagramma boxplot. L'insieme di dati di infiorescenza dell'iride viene importato nell'istanza seguente. Il boxplot alla fine visualizza i valori più bassi, più alti, 1 ° percentile e 3 ° percentile.

Importa Seaborn come SNS
Importa matplotlib.Pyplot come Plt
df = sns.load_dataset ('iris')
Stampa (df.Testa())
SNS.boxplot (y = df ["sepal_length"])
Plt.spettacolo()

All'inizio del programma, dobbiamo importare le biblioteche. La biblioteca "Seaborn" viene importata come SNS e la biblioteca "Matplotlib.Pyplot ”è stato importato come PLT. Quindi dichiariamo una variabile denominata "DF."Vogliamo caricare i dati, quindi abbiamo utilizzato la funzione Load DataSet (). Il set di dati è memorizzato nella variabile "DF". Viene utilizzata la funzione head (). Per ottenere le prime N voci, useremo questa funzione. Dipendente dalla posizione dell'oggetto, questo metodo contiene solo i primi n record. È in grado di determinare efficacemente se l'oggetto contiene il tipo di dati appropriato. La serie di voci da cui selezionare.

Ora utilizziamo la funzione BoxPlot () e abbiamo fornito il parametro Y a questa funzione. Un diagramma box è una tecnica standard per rappresentare dati multidimensionali costituiti da cinque analisi: "minimo", "primo percentile", "media", "terzo percentile" e "più alto."Per mostrare il grafico finale, il PLT.viene applicato il metodo show ().

Orizzontale boxplot

Un diagramma orizzontale potrebbe essere usato come diagramma box. Disegneremo il diagramma del box sul piano orizzontale come presentato nella figura. Utilizzeremo ancora una volta il frame dati Iris. Le tonalità visualizzate sono le tinte standard; Tuttavia, possono essere cambiati.

Importa Seaborn come SNS
Importa matplotlib.Pyplot come Plt
df = sns.load_dataset ('iris')
SNS.boxplot (y = df ["specie"], x = df ["sepal_length"])
Plt.spettacolo()

Prima di tutto, abbiamo integrato due file di intestazione. Il file di intestazione Seaborn e Matplotlib.Pyplot. Il set di dati di Load () viene utilizzato per caricare il set di dati nella trama. Nel passaggio successivo, abbiamo aggiunto il metodo head (). Questa funzione restituisce i primi cinque frame del set di dati per configurazione. C'è solo un parametro di input: la serie di righe. Questo argomento ci consente di indicare il numero di valori di cui abbiamo bisogno.

Usiamo la funzione BoxPlot () in quanto può indicare ulteriormente le anomalie e i valori associati. Qui abbiamo dato il parametro X e il parametro Y a questa funzione. L'etichetta dell'asse y della trama è presa come il nome della specie e l'etichetta dell'asse x del grafico è presa da sepal_length. Abbiamo applicato la funzione show () per rappresentare il diagramma risultante.

Personalizza i colori del diagramma box

Le tonalità per il diagramma boxplot possono essere personalizzate. Specificando l'attributo "palette", possiamo raggiungere questo obiettivo. Ci sono state una varietà di palette e la tavolozza "Magma" include una vasta gamma di magma.

Importa Seaborn come SNS
Importa matplotlib.Pyplot come Plt
df = sns.load_dataset ('iris')
SNS.BoxPlot (y = df ["specie"], x = df ["sepal_length"], palette = "magma")
Plt.spettacolo()

Specifichiamo una variante chiamata "DF" dopo aver introdotto le biblioteche Seaborn e Matplotlib nel programma. Quindi abbiamo utilizzato il metodo Load DataSet () per recuperare i dati. Nella variabile "DF", il set di dati viene salvato. Verrà applicata la testa del metodo (). Questa funzione verrebbe utilizzata per acquisire i primi N per oggetti.

Ora impiegheremo il metodo BoxPlot (), a cui abbiamo assegnato i parametri X e Y. Insieme a questi parametri, abbiamo specificato il colore dei grafici della scatola. Abbiamo impostato il colore "magma" sul parametro "tavolozza" in questo codice. Il PLT.Il metodo show () viene utilizzato per illustrare il grafico modellato.

Regola la dimensione del diagramma box

L'opzione di larghezza verrà utilizzata per modificare le dimensioni dei diversi grafici a box. La larghezza standard è 1; Pertanto, un po 'meno di quello rende le scatole più brevi.

Importa Seaborn come SNS
Importa matplotlib.Pyplot come Plt
df = sns.load_dataset ('iris')
SNS.BoxPlot (x = df ["specie"], y = df ["sepal_length"], larghezza = 0.2)
Plt.spettacolo()

Le librerie richieste devono essere caricate all'inizio del codice. Il set di dati nel grafico viene caricato utilizzando il metodo Load Dataset (). Il metodo head () è stato utilizzato nel passaggio successivo. Per impostazione predefinita, questo metodo fornirà i primi cinque segmenti del set. Utilizzeremo il metodo BoxPlot () per disegnare i grafici della scatola. A questa funzione è stato assegnato il parametro X e il parametro Y già citato. Viene anche specificata la larghezza dei grafici della scatola.

Quindi, abbiamo fornito a questa funzione l'argomento "larghezza". L'asse y della trama è etichettato con il nome della specie, mentre l'asse X del grafico è etichettato con lunghezza del sepal. Abbiamo utilizzato il metodo show () per rappresentare il diagramma di output.

Conclusione

In questo artefatto, abbiamo esaminato come disegnare grafici a scatola usando la biblioteca di Seaborn. Abbiamo visto come cambiare la larghezza e i colori delle trame della scatola. La rappresentazione visiva della presentazione di serie di informazioni statistiche per il loro percentile è definita trama a scatola. Incapsula efficacemente i dati raccolti utilizzando una scatola e barre e consente a tutti di valutare direttamente i set.