Pandas Agg

Pandas Agg
"Pandas" fornisce la funzione "agg ()". Usando la funzione "agg ()", possiamo utilizzare diverse funzioni. Viene eseguito sull'asse dell'indice di riga, che viene inserito automaticamente nel frame dati. Il comportamento predefinito delle funzioni numpy "agg ()" (media, mediana, prod, somma, std, var), che valutano l'agg () dell'array appiattito, è distinto da questo comportamento. Possiamo aggiungere dati con l'aiuto della funzione Agg (). Questa guida utilizzerà la funzione "Pandas agg ()" e mostrerà il funzionamento di questa funzione "agg ()" in "Panda".

Sintassi

La sintassi di questa funzione è:

#DataFrame.Agg (Func, Axis, Args, Kwargs)

Esempio # 01

Abbiamo l'app "Spyder" per l'esecuzione dei nostri codici "panda". Quando sviluppiamo il codice "panda", dobbiamo "importare" i metodi "Panda" come "PD". Questo "PD" ci consente di accedere ai metodi o alle funzioni dei "panda" aggiungendo "PD" anziché "Panda". Generiamo i dati e li archiviamo in "Data1". Scriviamo "x1" e in "x1". Aggiungiamo "60", "50" e "40". Abbiamo "Y1" e aggiungiamo "900", "1212" e "51". Posizioniamo anche "Z1". In questo, inseriamo "200", "300" e "800". Modifichiamo questo "data1" in "dati" e scriviamo "PD" con "DataFrame", quindi ci supporterà nell'accesso a questa funzione di "Panda".

Passiamo "Data1" come parametro del "PD.DataFrame () ". Genera "DataFrame" per noi e utilizza anche la variabile qui "DFA" che memorizza questo frame dati in esso. Quindi aggiungiamo "Print (DFA)" per renderlo. Di seguito, utilizziamo la funzione "agg ()" per l'esecuzione di alcune operazioni su questo frame dati. Stiamo applicando "somma" in questa funzione "agg ()". Il risultato che otteniamo dopo la somma è memorizzato nella variabile "ANS". Stampiamo anche questa somma inserendo "Print ()".

Incoriamo anche l'output qui. Questa uscita viene estratta sul terminale "Spyder" premendo "Shift+Enter". Visualizza prima i dati in quanto vengono inseriti nel codice e aggiunge i valori di "x1", quindi, viene visualizzato nel seguente "x1". Vengono anche aggiunti i valori di "Y1" e il risultato viene visualizzato nella colonna "Y1". Infine, l'operazione di somma viene anche eseguita sui valori di "Z1". Il risultato dopo la somma viene reso nella colonna "Z1".

Esempio # 02

Produciamo il telaio dati dopo aver importato i "panda" come "PD". Il frame dati è chiamato "dati". Inseriamo prima tre file e aggiungiamo "9, 8, 7" alla prima riga; “4, 5, 6” alla seconda riga; e anche "1, 2, 3" alla terza fila. Quindi, inseriamo il nome dell'intestazione su ciascuna colonna utilizzando la parola chiave "colonne". Assegniamo "A1" come intestazione della prima colonna. "A2" come intestazione della seconda colonna. E "A3" per la terza colonna. Stampiamo i "dati" sul terminale dell'app Spyder.

Mettiamo il nome del telaio di dati "dati" e utilizziamo il metodo "agg ()" con questo "dati". Abbiamo due funzioni che vogliamo applicare al frame dati: "somma" e "min". "Sum" aggiungerà i numeri di ciascuna colonna separatamente. "Min" troverà il valore minimo della colonna. Quindi, memorizzerà la somma e il valore min nel "risultato" che abbiamo creato. Infine, stamperà il "risultato" poiché abbiamo inserito anche la "stampa".

La somma della colonna "A1" è "14" e il valore minimo di questa colonna è "1". La somma della seconda colonna "A2" è "15". Il suo valore minimo è "2". La somma dell'ultima colonna "A3" è "16" e il valore minimo che abbiamo per questa colonna è "3" che viene visualizzato.

Esempio # 03

Ripetiamo la prima riga in questo esempio e costruiamo il frame dati "Informazioni". Quindi, metti i dati in righe poiché "3, 8, 7" viene inserito qui alla prima riga. "4, 1, 6" e "7, 2,3" sono inseriti rispettivamente alla seconda e alla terza file. Assegniamo anche alcuni nomi di indici a tutte le colonne come "Col1", "Col2" e "Col3" per la prima, la seconda e la terza colonna. Reniamo queste "informazioni" utilizzando "Stampa". Stiamo applicando diverse aggregazioni alle colonne.

Nel metodo "agg ()", citiamo il nome della colonna e quindi mettiamo l'operazione che vogliamo applicare a quella colonna menzionata. Per quanto riguarda "Col1", utilizziamo le operazioni "somma" e "min". Su "Col2", applichiamo operazioni "min" e "max". Ma non menzioniamo la "Col3", quindi nessuna funzione AGG viene applicata al "Col3". Usiamo anche la variabile "finale" per la memorizzazione di questo risultato e quindi lo renderiamo.

La "somma" e "min" sono applicati al "col1" ma in "max" stampa "nan" perché non abbiamo applicato il "max" a questo "col1". Quindi, i valori "min" e "max" di "col2" sono qui, ma il blocco della somma contiene "nan" poiché applichiamo solo "max" e "min" a questo "col2". Il "Col3" non è qui perché non abbiamo applicato alcun metodo "agg ()" a questo "col3".

Esempio # 04

Stiamo applicando diverse funzioni sulle colonne e aggiorniamo anche il nome dell'indice dopo il risultato. Per questo, abbiamo creato i "dati grezzi" di dati e abbiamo tre righe contenenti alcuni numeri che sono "22, 82, 27" nella prima riga; “14, 23, 36” qui nella seconda fila; e "77, 29, 34" è nella terza fila. I nomi delle colonne che abbiamo aggiunto sono "Data1", "Data2" e "Data2". Di seguito abbiamo il metodo "print ()".

Ora utilizziamo il metodo "agg ()" del "panda" e impostiamo "x" che viene utilizzato per rinominare il nome dell'indice di riga dopo aver applicato la funzione di aggregazione alla colonna "data1". Applichiamo la funzione "max" a "data1". Selezioniamo "Y" per sostituire il nome dell'indice di riga dopo l'esecuzione della funzione di aggregazione. A "data2", impieghiamo la funzione "min". Su "data3", abbiamo messo la funzione "media" e impostato il nome dell'indice di riga su "z" che viene sostituito dopo aver applicato la funzione di aggregazione. Quindi, abbiamo anche la "print ()", quindi il "calcolo" verrà visualizzato per noi.

Su "data1" viene applicata solo la funzione "max" e i restanti due valori sono "nan". Inoltre, il valore dell'indice viene modificato in "x". La colonna "Data2" visualizza semplicemente il risultato per la funzione "min" e i valori rimanenti sono "nan" e il nome della riga indice è "y" per questo. Ora, l'unica media viene applicata a "Data3" e il suo indice di riga viene modificato in "Z".

Conclusione

Questa guida è sulla funzione "agg" in "panda". Abbiamo spiegato che la funzione "agg" che viene utilizzata nei panda per applicare diverse funzioni. Abbiamo stabilito quattro istanze, a cui abbiamo applicato il metodo "AGG".

.