Deviazione standard di Pandas

Deviazione standard di Pandas

"I" panda "sono un grande linguaggio per eseguire l'analisi dei dati a causa del suo grande ecosistema di pacchetti pithon incentrati sui dati. Ciò semplifica l'analisi e l'importazione di entrambi i fattori. La deviazione standard è una deviazione "tipica" derivata dalla media. Viene utilizzato molto, in quanto restituisce le unità originali di misura del telaio dati. I panda hanno utilizzato std () per il calcolo della deviazione standard. La deviazione standard può essere calcolata dai valori dati che possono essere nel frame dati sotto forma di riga o colonna. Implementeremo tutti i possibili modi in cui viene utilizzata la deviazione standard di Pandas. Per l'implementazione del codice, utilizzeremo lo strumento "Spyder" in quanto è scritto in un ambiente adatto a Python."

Sintassi

“Df.std () "


La seguente sintassi viene utilizzata per il calcolo della deviazione standard nel frame dati. Il "DF" nel frame dati è l'abbreviazione del "dati". Cosa fa la deviazione standard? Misura quanto siano estesi i dati richiesti. Più valori alti ampliati, maggiore è la deviazione standard.

Ritorno

La deviazione standard Pandas restituisce il frame dati se il livello è specificato in base al requisito.

Si noti che la funzione "std ()" ignorerà automaticamente i valori "nan" nel "df" mentre si calcola la deviazione standard di Pandas. "Nan" può essere spiegato come "non un numero", il che significa che non vi è alcun valore assegnato a un particolare.

Di seguito sono riportati i metodi che verranno eseguiti con esempi della deviazione standard di Pandas:

    • Calcolo della deviazione standard di Pandas in una singola colonna.
    • Calcolo della deviazione standard di Pandas in più colonne.
    • Calcolo della deviazione standard di Pandas di tutte le colonne numeriche.
    • Deviazione standard di Pandas usando l'asse = 1.
    • Deviazione standard di Panda usando l'asse = 0.

Creazione del frame dati per il calcolo della deviazione standard nei panda

Innanzitutto, apri il software "Spyder". Ora importa la libreria Pandas come PD. Creeremo un telaio di dati che consiste in un tabellone che ha termini come "x", "y" e "z" con i loro punti come "22", "10", "11", "16", "12", "45 "," 36 "e" 40 ". Abbiamo i loro assist valori come "8", "9", "13", "7", "22", "24", "4" e "6", avendo anche il valore dei rimbalzi come "17", " 14 "," 3 ", 5", "9", "8", "7" e "4".


I display mostrano il frame dati creato in base ai valori assegnati nel codice:

Esempio # 01: Calcolo della deviazione standard di Pandas in una singola colonna

In questo esempio, calcoleremo la deviazione standard di una singola colonna nel Frame dati Pandas. Il frame dati ha i valori del team come "u", "v" e "b" con i loro punti come "44", "33", "22", "44", "45", "88", "96 "E" 78 ". I valori degli assist sono come "7", "8", "9", "10", "11", "14", "18" e "17" hanno anche i valori dei rimbalzi come "11", " 9 "," 8 "," 7 "," 6 "," 5 "," 4 "e" 3 ". La colonna "punti" è selezionata dal frame dati per calcolare la deviazione standard a colonna singola.


L'output mostra la deviazione standard calcolata della colonna "punti":

Esempio # 02: Calcolo della deviazione standard di Pandas in più colonne

In questo esempio, eseguiremo i calcoli di deviazione standard Pandas in più colonne. In questo frame dati, i dati sono di nuovo del tabellone sportivo che ha i valori della squadra come "N", "W" e "T" con il punteggio come "33", "22", "66", "55", "44", "88", "99" e "77". Gli assist come "9", "7", "8", "11", "16", "14", "12" e "13" e rimbalzano come "5", "8", "1", " 2 "," 3 "," 4 "," 6 "e" 7 ". Qui calcoleremo la deviazione standard delle due colonne "punti" e "rimbalzi" utilizzando la funzione std () applicata al frame dati.


Come vediamo, l'output mostra la deviazione standard è arrivata 26.944387 nella colonna dei punti e 2.449490 nella colonna di rimbalzo, rispettivamente.

Esempio # 03: Calcolo della deviazione standard di Pandas di tutte le colonne numeriche

Ora abbiamo imparato a calcolare la deviazione standard di righe singole e multiple. Cosa succede se non vogliamo specificare tutti i nomi delle colonne nel frame dati e calcolare l'intero frame dati? Ciò è possibile con solo una semplice implementazione della funzione della deviazione standard Pandas per il calcolo del frame di dati completo nei risultati. Il frame dati qui è costituito da "L", "M" e "O" con i valori di punteggio "33", "36", "79", "78", "58", "55" e due squadre segnano lo stesso questo è "25". Gli assist sono come "1", "2", "3", "4", "6", "9", "5" e "7" e i loro rimbalzi come "14", "10", "2" , "5", "8", "3", "6" e "9". Possiamo calcolare tutte le deviazioni della colonna standard da parte dei panda nel frame dati utilizzando la funzione Pandas "std ()".


Il display ha la deviazione standard calcolata dell'intero "DF" mostrato di seguito; Possiamo anche notare che i panda non hanno calcolato la deviazione standard della prima colonna, che è "squadra", perché non è una colonna numerica.

Esempio # 04: Deviazione standard Pandas usando l'asse = 0

In questo esempio, i dati dei dati hanno le squadre degli sport come "G", "H" e "K" con ulteriori dati. Qui calcoleremo la deviazione standard utilizzando l'asse come "0", un parametro utilizzato nella deviazione standard di Pandas. Questo argomento calcola la colonna di deviazione standard in termini di dati di dati.


Il seguente output visualizza i risultati in colonne della deviazione standard calcolata. La colonna punti ha la deviazione standard calcolata come “24.0313062 ", la colonna Assist ha la deviazione standard calcolata come" 2.669270 "e la deviazione standard calcolata della colonna di rimbalzo è mostrata come" 3.943802 ".

Esempio # 05: Deviazione standard Pandas usando l'asse = 1

Qui useremo il parametro dell'asse assegnato come "1" per calcolare la deviazione standard in Panda. Quale differenza può fare l'asse "1"? L'argomento dell'asse "1" calcola la deviazione standard di riga dei valori numerici nel frame dati. Il frame dati ha le tre squadre come "S", "D" ed "E", con l'aggiunta di colonne di dati create come punti della squadra, assist della squadra e rimbalzi della squadra. Tutte le direzioni sono assegnate con valori diversi nel frame dati. Questo parametro dell'asse è un punto di svolta come, al momento, dobbiamo lavorare sui dati in cui vogliamo che sia in una colonna più punto calcolato sulla deviazione standard eseguita.


Il seguente output visualizza la deviazione standard calcolata in una riga del frame dati:

Conclusione

La deviazione standard di Pandas è una funzione molto tecnica, che è una funzione molto benefica in quanto trova la deviazione standard del patto di entusiasmo dei telai di dati Panda. In questo editoriale, abbiamo studiato i metodi per calcolare la deviazione standard in Panda. Abbiamo eseguito calcoli a colonna singola di deviazione standard e più colonne e calcolato anche la deviazione standard dell'intero telaio di dati insieme. Tutte le strategie funzionano bene finché vengono utilizzate in modo coerente e con i risultati desiderati.