La media ponderata è la media dei dati che identifica i numeri specifici che sono più importanti degli altri numeri nel frame dati. Implementeremo tutti i modi possibili in cui la media ponderata dei panda può essere calcolata con l'aiuto di diversi esempi.
Formula
(valori_column*pesi_column).Sum ()/pesis_column.somma()Qui, valori_column è la colonna numerica nel frame dati Pandas che memorizza i valori e pesi_column è la colonna numerica che memorizzerà il peso di ciascun valore.
Metodo 1: media ponderata
Usiamo la funzione personalizzata che calcola la media ponderata del telaio di dati Pandas. Useremo la funzione Sum () per calcolare la somma nel seguente calcolo:
SUM (dataframe_object [peso_data]*dataframe_object [value_data])/dataframe_object [peso_data].somma()Qui, peso_data è la colonna nel frame dati che contiene pesi per valori nella colonna Value_data.
Esempio
In questo esempio, abbiamo un frame di dati denominato "calcoli" con 2 colonne di tipo intero. Ora creeremo una funzione personalizzata, "ponderato_avg_calculazioni", per calcolare la media ponderata e chiamare la funzione con queste due colonne passandole come argomenti.
Panda di importazioneProduzione
Contare la quantitàSpiegazione
Quindi, la funzione personalizzata è:
Restituirà la media ponderata.
Quindi, la media ponderata del frame dati sopra è 2.92.
Metodo 2: media ponderata restituita in gruppi
Ora useremo la funzione GroupBy () per raggruppare le righe e restituire la media ponderata in ciascun gruppo. Il metodo Applica () viene utilizzato insieme a GroupBy () che prende la media ponderata e le colonne come parametri.
DataFrame_Object.GroupBy ('Grouping_column').Applica (ponded_avg_calculazioni, 'value_data', 'peso_data')Qui, le righe sono state raggruppate in base ai valori in "Grouping_column". Il ponderato_avg_calculazione è una funzione personalizzata che calcola la media ponderata. Il peso_data è la colonna nel frame dati che contiene pesi per valori nella colonna Value_data.
Esempio
In questo esempio, abbiamo un frame di dati denominato "calcoli" con 3 colonne. Ora creeremo una funzione personalizzata, "ponded_avg_calculazioni", per calcolare la media ponderata e chiamare la funzione con le due colonne passandole come argomenti. Raggrupperemo le righe in base alla colonna "elemento" e restituiremo la media ponderata in ciascun gruppo.
Panda di importazioneProduzione
Conta oggetto di quantitàSpiegazione
Quindi, la funzione personalizzata è:
Restituirà la media ponderata.
Ci sono tre gruppi nel calcolo dei dati.
Metodo 3: media ponderata restituita usando numpy
Il modulo numpy supporta la funzione media () in cui possiamo passare i valori e i pesi ad essa e ottenere la media ponderata del frame dati Panda.
numpy.Medio (dataframe_object ['value_data'], pesi = dataframe_object ['peso_data'])
Esempio
In questo esempio, abbiamo un telaio di dati denominato "calcoli" con 2 colonne. Useremo direttamente Numpy.media () per calcolare la media ponderata.
Panda di importazioneProduzione:
Contare la quantitàSpiegazione
Qui, la colonna quantità sarà il valore e il conteggio sarà i pesi.
La media ponderata è 273.77.
Conclusione
La media ponderata dei panda è una funzione preziosa e tecnica. Abbiamo svolto la funzione personalizzata della media ponderata dei panda e della media ponderata di Numpy Panda. La media è qualcosa che dobbiamo calcolare in quasi tutto, anche i budget di piccoli generi alimentari. Pertanto, quando si parla di milioni di dati, la funzione Panda media ponderata è un piacere per tutti gli utenti che lavorano sui calcoli medi specifici dei dati nei loro campi.