Come usare il diagramma box in Python

Come usare il diagramma box in Python
Un diagramma della scatola viene utilizzato per riassumere set di dati utilizzando il metodo del diagramma Box e Whisker. Questa funzione aiuta gli utenti a comprendere correttamente il riepilogo dei dati. I grafici della scatola possono essere molto utili quando vogliamo sapere come vengono distribuiti i dati. Tre tipi di quartili vengono utilizzati nel diagramma della scatola per tracciare i dati. Questi valori includono valori statistici mediani, massimi, minimi, superiori e inferiore. Un diagramma della scatola riassume questi dati nel 25th, 50th, e 75th percentili. Questo tutorial ti mostrerà come creare grafici box in base a un determinato set di dati utilizzando il panda E Seaborn Biblioteche di Python.

Prerequisito

Se sei un nuovo utente Python, dovrai prima impostare l'ambiente per mostrare l'output del diagramma della scatola. È possibile utilizzare qualsiasi interprete di Python per l'esecuzione del codice. In questo tutorial, userò spyder3 Per eseguire il codice. Se non hai installato il panda E Seaborn Librarie prima, quindi è necessario eseguire il seguente comando dal terminale per installare queste librerie:

$ PIP3 Installa Pandas Seaborn

Trame di scatole con panda

IL BoxPlot () metodo di panda viene utilizzato per generare figure del diagramma in base alla cornice dei dati. Questo metodo contiene molti argomenti; Alcuni di questi argomenti sono usati negli esempi seguenti. Questa parte del tutorial includerà due esempi che ti mostreranno come creare grafici a scatole panda. È possibile utilizzare dati generati in modo casuale nella libreria numpy o i dati da un file CSV per generare un grafico a scatola in panda.

Esempio 1: grafici della scatola basati su valori casuali

I grafici della scatola nell'esempio seguente sono stati generati utilizzando Numpy E panda. La libreria Numpy viene utilizzata nello script per creare un oggetto Frame di dati generando un array bidimensionale di valori casuali che contengono 5 righe e 5 colonne. Il contenuto del frame di dati verrà stampato utilizzando la testa() metodo. Successivamente, il BoxPlot () Il metodo viene utilizzato per generare grafici della scatola con colore blu, 10 caratteri e un angolo di rotazione a 30 gradi per visualizzare i valori della colonna.

#!/usr/bin/env python3
# Importa Libreria Pandas
Importa panda come PD
# Importa libreria numpy per creare i numeri casuali per l'array
Importa Numpy come NP
"
Genera set di dati basato su un array numpy creato casualmente
e cinque valori di colonne
"
dataframe = pd.DataFrame (NP.casuale.Randn (5,5), colonne = ['2016', '2017', '2018',
'2019', '2020'])
# Stampa i valori di DataFrame
Stampa (DataFrame.Testa())
# Visualizza il diagramma della casella in base ai valori di dati
DataFrame.BoxPlot (Grid = 'False', Color = 'Blue', FontSize = 10, Rot = 30)

Produzione

Verrà visualizzato il seguente output dopo aver eseguito il codice.

Esempio 2: grafici a box basati sui dati CSV

I grafici della scatola nell'esempio seguente sono stati generati dai dati CSV. Crea un file CSV chiamato banca.CSV Utilizzando i seguenti dati.

banca.CSV

SL, client_name, account_type, genere, saldo
1, Maria Hernandez, salvataggio, femmina, 120000
2, Mary Smith, corrente, femmina, 40000
3, David Smith, corrente, maschio, 379000
4, Maria Rodriguez, salvataggio, femmina, 56000
5, Mark Lee, salvataggio, maschio, 93500
6, Jonathan Bing, corrente, maschio, 5900
7, Daniel Williams, salvataggio, maschio, 2300
8, Mike Brown, corrente, maschio, 124888
9, Paul Smith, corrente, maschio, 59450
10, Maria Lopez, salvataggio, femmina, 487600

Nella sceneggiatura seguente, il matplotlib La libreria è stata utilizzata per impostare la dimensione della figura del diagramma della scatola e per visualizzare l'uscita in linea. Tutti i record di la Banca.CSV Il file è stato caricato utilizzando il file read_csv () metodo di panda. I primi 8 record del frame di dati sono stati quindi stampati utilizzando il Testa() metodo. IL BoxPlot () Il metodo è stato utilizzato nella seguente istruzione per disegnare la figura del diagramma della casella usando il colore rosso basato suTipo di account' con la colonna chiamata 'Bilancia.'

#!/usr/bin/env python3
# Importa panda per la generazione di una trama della scatola
Importa panda come PD
# Importa matplotlib per configurare la dimensione della figura del diagramma della scatola
Importa matplotlib.Pyplot come Plt
# Importa get_ipython per formattare l'uscita in linea
da ipython import get_ipython
get_ipython ().run_line_magic ('matplotlib', 'inline')
# Imposta la dimensione della figura
Plt.rcparams ['figura.figsize '] = (8,4)
# Carica il set di dati da un file CSV
df = pd.read_csv ("banca.CSV ")
# Stampa le prime 8 righe dei dati caricati
Stampa (df.testa (8))
# Visualizza i grafici della casella in base al parametro utilizzato
df.BoxPlot (by = 'account_type', grid = 'true', column = ['bilancia'], color = 'rosso')

Produzione

Verrà visualizzato il seguente output dopo aver eseguito il codice.

Trame di scatole con Seaborn

Un'altra biblioteca di Python comunemente usata per disegnare grafici della scatola è la libreria Seaborn. Una delle caratteristiche importanti di questa libreria è che ha molti set di dati di esempio integrati per testare diverse attività. I prossimi due esempi copriranno l'uso di due diversi set di dati di esempio per disegnare grafici della casella usando il Seaborn biblioteca.

Esempio 3: grafici della scatola basati sul parametro X

Il seguente esempio utilizza un set di dati di esempio, chiamato 'diamanti, ' da il Seaborn libreria per generare la trama della scatola. Qui, lo stile della griglia è definito usando il set_style () metodo. IL load_dataset () Il metodo viene utilizzato per caricare i dati del 'diamanti ' set di dati. I primi cinque record sono stampati dal set di dati e dal BoxPlot () il metodo viene quindi utilizzato per disegnare il diagramma della casella in base alla colonna, denominata 'profondità,'Con il colore blu.

# Importa la biblioteca Seaborn per generare trama della scatola
Importa Seaborn come SNS
# Importa matplotlib per configurare la dimensione della figura del diagramma della scatola
Importa matplotlib.Pyplot come Plt
# Importa get_ipython per formattare l'uscita in linea
da ipython import get_ipython
get_ipython ().run_line_magic ('matplotlib', 'inline')
# Imposta lo stile della griglia
SNS.set_style ("whitegrid")
# Imposta la dimensione della figura
Plt.rcparams ['figura.figsize '] = (8,4)
# Carica il set di dati di esempio
diamond_dataset = sns.load_dataset ('diamanti')
# Visualizza i primi 5 record del set di dati
Stampa (diamond_dataset.Testa())
# Disegna la figura dei diagrammi della scatola
SNS.boxplot (x = diamond_dataset ['profondità'], color = 'blu')

Produzione

Verrà visualizzato il seguente output dopo aver eseguito il codice.

Esempio 4: grafici a box basati sui parametri X e Y

Il seguente esempio utilizza il set di dati di esempio denominato 'voli'Per disegnare la trama della scatola. Qui, sia i parametri X che quelli Y di il boxplot () il metodo vengono utilizzati per disegnare la figura. Le altre dichiarazioni sono simili all'esempio precedente.

# Importa la biblioteca Seaborn per generare trama della scatola
Importa Seaborn come SNS
# Importa matplotlib per configurare la dimensione della figura del diagramma della scatola
Importa matplotlib.Pyplot come Plt
# Importa get_ipython per formattare l'uscita in linea
da ipython import get_ipython
get_ipython ().run_line_magic ('matplotlib', 'inline')
# Imposta lo stile della griglia
SNS.set_style ("darkgrid")
# Imposta la dimensione della figura
Plt.rcparams ['figura.figsize '] = (12,4)
# Carica il set di dati di esempio
Flight_DataSet = SNS.load_dataset ('voli')
# Visualizza i primi 5 record del set di dati
Stampa (Flight_DataSet.Testa())
# Disegna la figura dei diagrammi della scatola
SNS.BoxPlot (x = 'Month', y = 'Passenger', Data = Flight_DataSet, Color = 'Blue')

Produzione

Verrà visualizzato il seguente output dopo aver eseguito il codice.

Conclusione

Quando si lavora con una grande quantità di dati, potresti voler riassumere i dati utilizzando un diagramma, come un diagramma della scatola. Questo tutorial ha utilizzato diversi esempi per mostrarti come generare grafici a scatole con due biblioteche Python.