Panda media

Panda media
“In questo tutorial, dimostreremo come applicare la tecnica media dei panda per calcolare la media. La media dei valori numerici in una serie Pandas o Pandas DataFrame viene determinata utilizzando la funzione media (). Uno degli strumenti che semplificano notevolmente il processo di importazione e valutazione dei dati di dati è uno di questi. Il valore medio per l'asse scelto viene restituito dal frame dati di Pandas.funzione media (). Se il metodo viene utilizzato su un oggetto Serie Pandas, produce un numero scalare che rappresenta la media di tutti i dati o occorrenze nel frame dati. È comune utilizzare questo strumento su un frame dati a colonna singola, ma la funzione media () in Panda può funzionare su tutti i frame dati Panda, gli oggetti in serie e le singole colonne."

Come utilizzare la funzione media dei panda?

Dobbiamo prima comprendere la sintassi prima di guardare come utilizzare il metodo medio () per calcolare la media. A seconda del tipo di oggetto che stai usando, il metodo medio Panda determinerà la sua sintassi. Medio () può essere applicato a dati, serie e colonne individuali del frame dati.

Sintassi per utilizzare la funzione media () per i dati dei dati

Di seguito è riportata la sintassi per utilizzare la funzione media () su un frame dati.

Sintassi: df.Significare( )

È necessario digitare il nome del tuo telaio.medio () per invocare il metodo quando si utilizza la media () su un intero telaio. La media (), per impostazione predefinita, cerca di operare su ogni colonna quando applicato a un intero telaio. Tuttavia, in realtà, l'output di solito consiste solo nei mezzi di variabili numeriche. Puoi anche utilizzare alcuni parametri opzionali aggiuntivi per alterare leggermente il risultato che otteniamo utilizzando la funzione media ().

Sintassi per utilizzare la funzione media () per la serie Pandas

Quando si applica la tecnica media () a una serie, la sintassi è abbastanza simile a quella di un telaio di dati.

Sintassi: serie.Significare( )

Ci sono alcuni argomenti che puoi usare per modificare i risultati quando si utilizza Mean () su una serie, proprio come con i dati dei dati.

Sintassi per utilizzare la funzione media () per le singole colonne nel frame dati

Poiché le colonne di dati di dati sono oggetti della serie Pandas, l'applicazione della media dei panda su una colonna richiede due passaggi: Utilizzo della sintassi DOT per recuperare la colonna specificata e quindi chiamare la funzione media ().

Sintassi: df.colonna.Significare( )

Ad esempio, useresti il ​​codice "DF.colonna.Mean () "se il tuo telaio di dati viene chiamato DF e la colonna su cui si desidera operare si chiama" colonna ". Calcolerà quindi la media solo per quella colonna.

Parametri

asse: Questo è un riferimento all'asse per la funzione che verrà utilizzata.

skipna: Non include alcun valori null nel calcolo del risultato.

livello: Se l'asse è un multiindex, conta insieme a quel livello e collassa in una serie.

Numeric_only:

Sono presenti solo colonne int, galleggianti e booleane. Se nessuno, proverà a usare tutto prima di utilizzare semplicemente informazioni numeriche. Non utilizzato per la serie.

Ritorna: Se il livello è specificato, fornisce la media del frame di dati o della serie.

Ora, abbiamo capito la sintassi, quindi procediamo ulteriormente per implementarla negli esempi seguenti.

Esempio n. 1: Trova il valore medio della colonna DataFrame

Innanzitutto, i moduli Pandas e Numpy verranno importati, quindi creeremo il nostro Frame Data. Creiamo un campione di dati di esempio con i dati dei dipendenti di un'azienda.


Abbiamo prodotto un frame dati utilizzando il PD.Funzione DataFrame () e archiviato il record di 10 dipendenti nel DF DataFrame passando parametri all'interno del PD.Dataframe () i.e. EMP, colonne e indice. La funzione print () viene utilizzata per visualizzare il nostro frame dati.

Calcoliamo la media di una singola colonna in un frame di dati. Qui troveremo la media/media della variabile di età.


La variabile di età, in questo caso, viene recuperata utilizzando “Sintassi dot."Stiamo usando il codice DF.età per farlo. Ma subito dopo, calcoliamo la media usando .Significare(). Ciò estrae essenzialmente la colonna di età dal frame dati DF e calcola la media di quella colonna.

Esempio n. 2: trova la media dell'intero telaio

Quindi applichiamo il metodo Mean () a un intero DF DataFrame, che abbiamo creato nell'esempio n. 1 come segue:


Lo script sopra calcolerà la media di tutte le colonne numeriche nel nostro frame dati DF.


Il metodo medio () ha calcolato la media di ciascuna variabile numerica quando la media () è stata chiamata sull'intero telaio. Pertanto, ha calcolato l'età media, lo stipendio e il bonus del frame dati DF. Pertanto, usando il metodo medio () sull'intero telaio di dati, l'età media è 27.000000, lo stipendio medio è 17650.000000 e il bonus medio è 2055.555556.

Esempio n. 3: trova la media del frame dati, compresi i valori mancanti

Hai notato che ci sono gli stessi valori mancanti nel nostro frame dati DF? L'opzione skipna della media () è sempre configurata come skipna = true per impostazione predefinita. Panda media () ignora i valori mancanti se l'opzione skipna è impostata su true. Specificando skipna = false, possiamo disabilitarlo.


La media delle colonne con valori mancanti sarà nan.


I mezzi di età e bonus sono entrambi nan. Ciò è dovuto ai valori mancanti nell'età e nelle variabili bonus che ora sono state incluse nell'output. Potresti scegliere di saltare su questi valori quando una variabile li ha impostando skipna = true. In alternativa, si desidera utilizzare il metodo Pandas Fillna per riempire i valori mancanti.

Esempio n. 4: trova la media raggruppata da una variabile categorica

Qui, lo stipendio medio è calcolato per bonus. Ciò ha comportato alcuni passaggi:

    1. raggruppa i dati per bonus utilizzando GroupBy ()
    2. Recupera la variabile salariale
    3. Chiama la funzione media ()


Come puoi vedere, usando .GroupBy ([bonus]) ha convertito i valori del bonus come gruppo in cui il valore dei dati si verificava più di una volta (2000 si verifica 3 volte). Il codice DF.GroupBy (['Bonus']).Stipendio.Media () ha calcolato la media dei valori salariali rispetto ai valori raggruppati della variabile bonus.

Esempio # 5: calcola la media condizionale per la variabile categorica

Lo stesso frame dati DF verrà utilizzato anche in questo esempio. Il seguente codice dimostra come determinare la media per la colonna "stipendio" solo per le righe del telaio di dati quando la colonna "bonus" ha un valore maggiore di 1800.


È possibile accedere a un set di righe e colonne utilizzando il DF. Loc [] Proprietà per etichette. Nel codice sopra, puoi vedere che lo stipendio medio per le righe con bonus superiori a 1800 è mostrato nella colonna salariale. Significa lo stipendio medio di quegli individui/dipendenti il ​​cui bonus è maggiore di 1800 è 16500.0.

Conclusione

Per determinare il valore medio di una serie Pandas o un frame di dati, utilizziamo il metodo medio (). Ora dovresti avere una migliore comprensione del funzionamento del metodo medio Panda dopo aver attraversato questo articolo. Per determinare il valore medio di un frame di dati o una serie Pandas, viene utilizzato il metodo medio (). Con gli esempi, abbiamo cercato di insegnarti come trovare la media di una colonna in un telaio di dati, trovare la media raggruppata per una variabile categorica e come trovare la media condizionale usando la funzione media ().