Seaborn Plot DataFrame

Seaborn Plot DataFrame
“Seaborn aiuti nell'esplorazione e nella comprensione dei dati. Le sue funzioni di grafici funzionano con frame e array di dati contenenti interi set di dati, eseguendo internamente l'aggregazione statistica e la mappatura semantica per creare grafici utili. Le associazioni statistiche possono essere viste con l'aiuto di Seaborn. L'analisi statistica viene utilizzata per capire come i parametri in un set di dati si relazionano tra loro e come tale connessione è influenzata da altre variabili. Questa analisi statistica aiuta nella visualizzazione delle tendenze e nell'identificazione di varie funzionalità nel set di dati.

Per impostazione predefinita, Pandas DataFrame viene utilizzato per caricare il set di dati. Questo frame dati viene utilizzato da qualsiasi funzione Panda DataFrame. I frame dati sono griglie rettangolari che contengono i dati e consentono una facile visualizzazione dei dati. Ogni colonna del modello di griglia è un vettore che mantiene i dati per una singola variabile e ogni riga della griglia ha valori di un'istanza. Ciò significa che i valori nelle righe di un frame dati non devono essere dello stesso tipo di dati; Possono essere aritmetici, testo, logici o qualsiasi altra cosa. I dati dei dati sono contenitori di dati annotati bidimensionali con diversi tipi di colonne che vengono confezionate con il modulo Panda per Python.

La biblioteca di Seaborn include alcuni set di dati chiave. I set di dati caricano automaticamente dopo l'installazione di Seabor. Il set di dati necessario può essere caricato con l'assistenza della funzione successiva.

load_dataset ()

Questa funzione fornisce un rapido accesso a un numero limitato di set di dati di esempio che è possibile utilizzare per documentare Seaborn o creare esempi ripetibili per il reporting di bug. L'uso normale non lo richiede."

Esempio 1

Nel nostro primo esempio, stiamo usando la trama della scatola per immaginare i record. Abbiamo moduli Seaborn e Matplotlib per la trama della trama della linea. Quindi, una variabile viene dichiarata come dati e all'interno di quella variabile, il seaborn load_dataset viene chiamato. Load_dataset prende il frame dati TIPS, che è per impostazione predefinita in Python. Ora, possiamo chiamare una qualsiasi delle colonne dal set di dati Titanic per il rendering della trama. Il diagramma della casella prende x come argomento a cui abbiamo impostato la colonna Total_Bill dal set di dati di esempio Titanic.

Importa Seaborn come SNS
Importa matplotlib.Pyplot come Plt
Data = SNS.load_dataset ("suggerimenti")
SNS.boxplot (data ['total_bill'])
Plt.spettacolo()

Il diagramma del frame dati Titanic è visualizzato nella figura seguente.

Esempio 2

Possiamo tracciare la cornice dei dati con uno qualsiasi dei trame di Seaborn. In questo esempio, abbiamo un diagramma di violino per realizzare il diagramma della cornice dei dati di Seaborn. Una trama della scatola e una trama di violino sono comparabili. Confronta le distribuzioni di numerosi punti di dati quantitativi tra uno o più fattori di categoria.

Dato che stiamo usando la funzione seaborn load_dataset, quindi dobbiamo importare il modulo Python Seaborn e, per la trama, abbiamo un modulo Matplotlib. Lì modeliamo lo sfondo della trama su una griglia scura. Quindi, viene chiamata la funzione load_dataset, dove di nuovo, abbiamo usato i suggerimenti di set di dati di esempio.

Dai suggerimenti per il set di dati di esempio, stiamo prendendo due colonne, Total_Bill e Time, per gli assi X e Y del grafico. Per usare queste colonne per la trama, abbiamo un diagramma di violino di Seaborn che prende la X come Total_Bill per l'asse e Y come tempo per l'asse Y. Queste colonne specificate vengono confrontate tra loro nella trama.

Importa Seaborn come SNS
Importa matplotlib.Pyplot come Plt
SNS.set (style = 'darkGrid')
df = sns.load_dataset ("suggerimenti")
SNS.violinPlot (x = "total_bill", y = "time", data = df)
Plt.spettacolo()

Il frame di dati viene visualizzato nella figura seguente.

Esempio 3

Qui, abbiamo mostrato il diagramma di dati con il grafico dei punti. Un grafico a punti può indicare la stima con gli intervalli di confidenza usando la grafica del diagramma a dispersione. Il punto determina un significato statistico stimato per un punto dati basato sulla posizione del punto del diagramma a dispersione e include barre di errore per indicare il livello di incertezza.

Nella sceneggiatura seguente, abbiamo impostato la griglia scura di stile per lo sfondo della trama. Quindi, abbiamo una funzione load_dataset, questa volta abbiamo un set di dati Iris per generare la trama. Abbiamo superato le colonne sepal_length e sepal_width al parametro X e Y per il grafico del punto.

Gimport Seaborn
Importa matplotlib.Pyplot come Plt
Seaborn.set (style = 'whitegrid')
Data = Seaborn.load_dataset ("iris")
Seaborn.PointPlot (x = "sepal_length", y = "sepal_width", data = data)
Plt.spettacolo()

Il diagramma dei punti del set di dati Iris è mostrato come segue:

Esempio 4

Il frame dati Panda bidimensionale è appropriato per la struttura statistica con assi etichettati che possono essere vari ed è mutabile per dimensioni (righe e colonne). Per creare il frame di dati del panda, le lunghezze di tutti gli array devono essere uguali. Se viene definito un indice, dovrebbe avere la stessa lunghezza degli array. Se non è impostato alcun indice nell'intervallo (n), per impostazione predefinita, viene utilizzata N, che è la lunghezza dell'array.

Nel frammento di codice indicato, abbiamo importato il modulo Panda e quindi abbiamo chiamato il costruttore di dati di Panda Data -Frame, in cui i due array sono specificati come List1 ed List2. Abbiamo una raccolta di numeri casuali in una matrice di uguale lunghezza. Per creare il grafico dei dati sopra, abbiamo un diagramma KDE. Mostra la densità di probabilità di una variabile continua a vari livelli. Possiamo anche creare un grafico separato per diversi campioni, rendendo più semplice la visualizzazione dei dati. La proprietà dei dati viene chiamata con i campi che ha all'interno del gesto dati.

Importa matplotlib.Pyplot come Plt
Importa Seaborn come SNS
Panda di importazione
data = panda.DataFrame ("List1": [23, 30, 14, 15, 20],
"List2": [19, 20, 16, 26, 11])
SNS.kdeplot (data ['list1'], data ['list2'])
Plt.spettacolo()

Il diagramma KDE mostra il confronto del Frame dati Panda all'interno della figura.

Conclusione

Ora, hai un breve articolo della cornice dei diagrammi di Seaborn qui. Possiamo creare il frame di dati da soli con il frame di dati del panda. I dati dei dati nei panda sono set di dati forti che dovresti utilizzare per ottenere una comprensione più profonda delle tue informazioni. Possiamo anche utilizzare i frame di dati di campioni di Seaborn integrati utilizzando la funzione load_dataset. Questa cornice di dati può essere tracciata con ogni diagramma di mare, poiché abbiamo mostrato i numerosi esempi che tracciano i frame di dati.