Sintassi
# “Df.var () "
La sintassi di cui sopra viene utilizzata per calcolare la varianza nel frame dati. Il "DF" nella sintassi rappresenta il "Frame dati".
Eseguiremo il seguente metodo per l'esempio spiegazione della funzione della varianza di Panda:
Creazione del frame dati per l'implementazione di esempio della varianza Pandas
Apri lo strumento "Spyder" sul tuo desktop/laptop. Ora, in primo luogo, importa la biblioteca Pandas come "PD" mentre stiamo correndo nell'ambiente di Panda. Creiamo un frame dati; Il "DF" è costituito dai nomi "Tom", "Eddie", "Sam", "Leo" e "Nick" con le loro età come "25", "44", "66", "55" e "78 ". Abbiamo anche i dati mancanti delle età come "20", "30", "40", "50" e "Valore mancante" abbiamo anche i loro redditi nel telaio di dati come "78000", "70000", "66000" , "33000" e "68000". E poi, stamperemo la condizione "DF" che verrà utilizzata per creare Datafarame.
Il frame dati viene creato come vediamo il display che mostra le colonne e il valore che abbiamo assegnato nel codice. Possiamo vedere che c'è un "nan" scritto nella colonna di dati mancanti nell'ultimo, il che significa che non è "un numero" e non c'è alcun valore assegnato lì.
Esempio # 01: Calcolo della varianza Pandas per una singola colonna nel frame dati
In questo caso, determineremo la varianza di una singola colonna dal frame dati. Il "DF" è costituito dalle quattro colonne "nome", "età", "dati mancanti" e "reddito". I nomi sono "Will", "Tina", "Lily", "Sea" e "Swany" le loro età sono "33", "45", "35", "85" e "78". I dati mancanti di età hanno i valori come "30", "40", "60", "80" e il termine mancante come "nessuno" i loro redditi sono come "99000", "88000", "77000", "55000" e "68000". Dato che calcoleremo una varianza di una singola colonna, dobbiamo specificare un nome di colonna con la varianza, ad esempio "reddito_varience"; Qui, la colonna "reddito" è selezionata per il calcolo della varianza. La funzione var () con "df" e la colonna di reddito specificata.
L'output visualizza la varianza calcolata della colonna "reddito" utilizzando la funzione Pandas var ().
Esempio # 02: Calcolo della varianza Pandas della singola colonna nel frame dati utilizzando DDOF
Qui useremo l'argomento DDOF per il calcolo della varianza in una singola colonna. Nel frame dati, il telaio di dati è costituito dai nomi "Shein", "Rose", "Allen", "Wilson" e "Dom" i secoli come "44", "23", "55", "36" e "41". Il reddito come "39000", "8400", "57000", "54000" e "55000" e con la colonna di dati delle età mancanti come "20", "22", "23", "25" e "Nessuno ". La domanda inizia con l'uso dell'argomento che cambia in "0". La risposta è che il default di Panda è impostato come N-1 come il "denominatore" e se vogliamo usare la "N" come denominatore, quindi dobbiamo usare l'argomento "dDof" e cambiare il suo valore in " 0 "invece di" 1 ".
Il "OF" è l'abbreviazione del "grado di libertà delta" funziona come il divisore usato nel calcolo come "n", dove rappresenta il numero di elementi. Anche qui, la colonna può essere scelta per scelta come dal lavoro necessario, possiamo calcolare la varianza di una qualsiasi delle colonne costituite da valori numerici. La colonna "reddito" è selezionata anche qui per il calcolo della varianza.
Il display mostra la varianza calcolata del reddito da colonna come "212560000" utilizzando l'argomento DDOF impostato su "0":
Esempio # 03: varianza di Pandas per il calcolo delle colonne più nel frame dati
Nel primo esempio, abbiamo fatto l'esempio di come calcolare la varianza nei panda della singola colonna nel frame dati. Ora calcoleremo la varianza in più colonne usando la funzione Pandas var (). Il frame dati è costituito da nomi come "Nina", "Ruby", "Ali", "Peter" e "Lisa", con i secoli "55", "85", "45", "31" e "51". I dati del valore mancante delle età hanno i valori come "21", "32", "20", "36" e il termine mancante. Abbiamo il reddito di quegli individui come "70000", "47000", "62000", "45000" e "56000".
Abbiamo scelto le colonne "età" e la colonna "reddito" per il calcolo della varianza nei panda. Possiamo decidere le colonne e inserirle per calcolare la varianza in base a ulteriori prestazioni di analisi.
L'output è costituito dalla varianza calcolata della colonna "Età" e "Reddito", rispettivamente, come scelto. Possiamo vedere che la varianza di diverse colonne è mostrata separatamente con i nomi delle loro colonne.
Esempio # 04: varianza di Pandas per il calcolo delle colonne intera dati di dati
In questo esempio, implementeremo la funzione Pandas var () per il calcolo della varianza nell'intero frame dati. I dati qui contengono i nomi "Fiona", "Zayn", "Steeve", "Henry" e "Olive" le loro età sono "18", "25", "35", "36" e "56". L'età mancante la colonna ha i valori "14", "12", "30", "16" e "nessuno". Il loro reddito è "80000", "38000", "33000", "95000" e "78000".
La sintassi di base viene utilizzata per ogni colonna del calcolo della varianza dei dati dei dati; Il frame dati ha selezionato l'intera colonna con la funzione "var ()". L'istruzione di varianza di stampa stamperà tutte le varianze calcolate.
L'output visualizza i calcoli di varianza delle colonne del frame dati, che erano in valori numerici. Come "età", "età mancante" e colonna "reddito". La colonna Nome ha i caratteri, quindi la loro varianza non può essere calcolata.
Conclusione
La varianza di Pandas è una funzione molto utile ma molto tecnica. Aiuta a calcolare la varianza molto facilmente usando la funzione var () di panda. In questo articolo, abbiamo imparato tutti i metodi con l'esecuzione di ciascuno per una migliore comprensione. Abbiamo eseguito il calcolo della varianza a colonna singola nei panda, i calcoli della varianza della colonna multipla nei panda, quello con la modifica dell'argomento dall'impostazione predefinita e anche l'applicazione di calcolo della varianza sul frame dati completo. Ognuno di essi è molto utile da solo, a seconda dell'uso e della condizione per necessità di tempo.