Varianza di panda

Varianza di panda
"Il" Pandas "è una libreria di software scritta in lingua Python per eseguire l'analisi e la manipolazione dei dati. E se vogliamo conoscere il grado di diffusione nel tuo telaio di dati? La varianza viene utilizzata per svolgere questo compito. Viene utilizzato per rappresentare una misurazione tra i numeri nei dati dello spread. I panda hanno escogitato la funzione della varianza, che indicherà il grado dell'insieme dei dati. La funzione per la varianza del panda è "var ()". Più dati sono diffusi, più è la varianza in relazione alla media. Più tardi, eseguiremo tutta la varianza di Panda può essere utilizzata. Per l'implementazione del codice nell'esempio, utilizzeremo il software "Spyder", un software per la lingua Python."

Sintassi

# “Df.var () "

La sintassi di cui sopra viene utilizzata per calcolare la varianza nel frame dati. Il "DF" nella sintassi rappresenta il "Frame dati".

Eseguiremo il seguente metodo per l'esempio spiegazione della funzione della varianza di Panda:

  • Calcolo della varianza di Pandas per una singola colonna nel frame dati.
  • Calcolo della varianza di Pandas di una singola colonna nel frame dati modificando l'argomento.
  • Calcolo della varianza Pandas per più colonne nel frame dati.
  • Varianza di Pandas per il calcolo delle colonne interi di dati.

Creazione del frame dati per l'implementazione di esempio della varianza Pandas

Apri lo strumento "Spyder" sul tuo desktop/laptop. Ora, in primo luogo, importa la biblioteca Pandas come "PD" mentre stiamo correndo nell'ambiente di Panda. Creiamo un frame dati; Il "DF" è costituito dai nomi "Tom", "Eddie", "Sam", "Leo" e "Nick" con le loro età come "25", "44", "66", "55" e "78 ". Abbiamo anche i dati mancanti delle età come "20", "30", "40", "50" e "Valore mancante" abbiamo anche i loro redditi nel telaio di dati come "78000", "70000", "66000" , "33000" e "68000". E poi, stamperemo la condizione "DF" che verrà utilizzata per creare Datafarame.

Il frame dati viene creato come vediamo il display che mostra le colonne e il valore che abbiamo assegnato nel codice. Possiamo vedere che c'è un "nan" scritto nella colonna di dati mancanti nell'ultimo, il che significa che non è "un numero" e non c'è alcun valore assegnato lì.

Esempio # 01: Calcolo della varianza Pandas per una singola colonna nel frame dati

In questo caso, determineremo la varianza di una singola colonna dal frame dati. Il "DF" è costituito dalle quattro colonne "nome", "età", "dati mancanti" e "reddito". I nomi sono "Will", "Tina", "Lily", "Sea" e "Swany" le loro età sono "33", "45", "35", "85" e "78". I dati mancanti di età hanno i valori come "30", "40", "60", "80" e il termine mancante come "nessuno" i loro redditi sono come "99000", "88000", "77000", "55000" e "68000". Dato che calcoleremo una varianza di una singola colonna, dobbiamo specificare un nome di colonna con la varianza, ad esempio "reddito_varience"; Qui, la colonna "reddito" è selezionata per il calcolo della varianza. La funzione var () con "df" e la colonna di reddito specificata.

L'output visualizza la varianza calcolata della colonna "reddito" utilizzando la funzione Pandas var ().

Esempio # 02: Calcolo della varianza Pandas della singola colonna nel frame dati utilizzando DDOF

Qui useremo l'argomento DDOF per il calcolo della varianza in una singola colonna. Nel frame dati, il telaio di dati è costituito dai nomi "Shein", "Rose", "Allen", "Wilson" e "Dom" i secoli come "44", "23", "55", "36" e "41". Il reddito come "39000", "8400", "57000", "54000" e "55000" e con la colonna di dati delle età mancanti come "20", "22", "23", "25" e "Nessuno ". La domanda inizia con l'uso dell'argomento che cambia in "0". La risposta è che il default di Panda è impostato come N-1 come il "denominatore" e se vogliamo usare la "N" come denominatore, quindi dobbiamo usare l'argomento "dDof" e cambiare il suo valore in " 0 "invece di" 1 ".

Il "OF" è l'abbreviazione del "grado di libertà delta" funziona come il divisore usato nel calcolo come "n", dove rappresenta il numero di elementi. Anche qui, la colonna può essere scelta per scelta come dal lavoro necessario, possiamo calcolare la varianza di una qualsiasi delle colonne costituite da valori numerici. La colonna "reddito" è selezionata anche qui per il calcolo della varianza.

Il display mostra la varianza calcolata del reddito da colonna come "212560000" utilizzando l'argomento DDOF impostato su "0":

Esempio # 03: varianza di Pandas per il calcolo delle colonne più nel frame dati

Nel primo esempio, abbiamo fatto l'esempio di come calcolare la varianza nei panda della singola colonna nel frame dati. Ora calcoleremo la varianza in più colonne usando la funzione Pandas var (). Il frame dati è costituito da nomi come "Nina", "Ruby", "Ali", "Peter" e "Lisa", con i secoli "55", "85", "45", "31" e "51". I dati del valore mancante delle età hanno i valori come "21", "32", "20", "36" e il termine mancante. Abbiamo il reddito di quegli individui come "70000", "47000", "62000", "45000" e "56000".

Abbiamo scelto le colonne "età" e la colonna "reddito" per il calcolo della varianza nei panda. Possiamo decidere le colonne e inserirle per calcolare la varianza in base a ulteriori prestazioni di analisi.

L'output è costituito dalla varianza calcolata della colonna "Età" e "Reddito", rispettivamente, come scelto. Possiamo vedere che la varianza di diverse colonne è mostrata separatamente con i nomi delle loro colonne.

Esempio # 04: varianza di Pandas per il calcolo delle colonne intera dati di dati

In questo esempio, implementeremo la funzione Pandas var () per il calcolo della varianza nell'intero frame dati. I dati qui contengono i nomi "Fiona", "Zayn", "Steeve", "Henry" e "Olive" le loro età sono "18", "25", "35", "36" e "56". L'età mancante la colonna ha i valori "14", "12", "30", "16" e "nessuno". Il loro reddito è "80000", "38000", "33000", "95000" e "78000".

La sintassi di base viene utilizzata per ogni colonna del calcolo della varianza dei dati dei dati; Il frame dati ha selezionato l'intera colonna con la funzione "var ()". L'istruzione di varianza di stampa stamperà tutte le varianze calcolate.

L'output visualizza i calcoli di varianza delle colonne del frame dati, che erano in valori numerici. Come "età", "età mancante" e colonna "reddito". La colonna Nome ha i caratteri, quindi la loro varianza non può essere calcolata.

Conclusione

La varianza di Pandas è una funzione molto utile ma molto tecnica. Aiuta a calcolare la varianza molto facilmente usando la funzione var () di panda. In questo articolo, abbiamo imparato tutti i metodi con l'esecuzione di ciascuno per una migliore comprensione. Abbiamo eseguito il calcolo della varianza a colonna singola nei panda, i calcoli della varianza della colonna multipla nei panda, quello con la modifica dell'argomento dall'impostazione predefinita e anche l'applicazione di calcolo della varianza sul frame dati completo. Ognuno di essi è molto utile da solo, a seconda dell'uso e della condizione per necessità di tempo.