PANDAS GROUPBY MAX

PANDAS GROUPBY MAX
"Panda" è una biblioteca Python. Il "GroupBy" viene utilizzato per raggruppare i dati costituiti da una o più di una colonna in base alle categorie che forniscono etichette a ciascuna mappatura del gruppo. In Pandas Python DataFrame, se si desidera trovare il valore "max" di un particolare gruppo di cui hai bisogno, puoi farlo semplicemente usando la funzione "Group per () e max ()". Questo aiuta a trovare i valori massimi senza trambusto come nelle aziende; I dati sono su vasta scala che diventano difficili da gestire manualmente. Cosa succede se si desidera trovare un'area specifica da tutti i dati? Diventa difficile fare le statistiche da solo. Consumerà molto tempo e la pazienza di un particolare, quindi invece, userà le funzioni di GroupBy Max in Panda DataFrame. In Pandas Python DataFrame, se si desidera trovare il valore "max" del gruppo, puoi farlo semplicemente usando la funzione "Gruppo per () e max ()"."

Sintassi
# df.GroupBy ('column_name').max ()

Il "DF" rappresenta il frame dati qui, il gruppo ha seguito il nome della colonna in cui è necessario scrivere il nome della colonna su cui si desidera lavorare. "Max" scritto alla fine, è per il rilevamento dei valori massimi nella colonna selezionata da "DF."

Il gruppo GroupBy Max di colonne singole e multiple nei panda può essere eseguito in diverse maniere. Facciamoli uno per uno.

Discuteremo e tratteremo tutti i seguenti modi:

  • Groupby Max - Colonna singola
  • GroupBy Max - Più colonne
  • GroupBy Max - Utilizzo della funzione Pivot
  • Groupby Max - Utilizzo di una funzione aggregata
  • GroupBy Max - Utilizzo della funzione reset_index (colonne singole e più entrambe)

Creazione del frame dati per l'implementazione della funzione GroupBy Max

Innanzitutto, creiamo un frame dati per applicare le funzioni e comprendere chiaramente ogni metodo. Il frame dati "DF" qui è costituito da città, prodotti e le loro vendite. Abbiamo bisogno di uno strumento Python per eseguire i nostri codici. Qui, il software utilizzato è Spyder per l'implementazione. È necessario scaricarlo prima direttamente da Google, soddisfare i requisiti di installazione dopo il processo di installazione e avviare lo strumento. Apri il file e inizia a eseguire il codice, il che è facile. La descrizione di tutti i modi che utilizzano GroupBy Max Panda Python Code è definita brevemente negli esempi seguenti.

Per il dominio Python, i Panda come "PD" e Numpy come "NP" sono le librerie importate nel codice di esempio. Il numpy viene utilizzato per i dati numerici in Python, mentre i panda vengono utilizzati per l'interpretazione dei dati.

Utilizzando la seguente riga di codice, lavoreremo su ciascuno degli esempi che coprono:

# df1 = pd.DataFrame (dati, colonne = ["città", "prodotti", "vendite"])

Secondo il telaio di dati, le colonne sono città, prodotti e le loro vendite; Allo stesso modo, la sintassi è costituita da tutti e tre nella rappresentazione della colonna.

Il codice dovrebbe apparire così nella schermata della console.

L'output mostra l'elenco di colonne costituite da città, prodotti e NO delle vendite. Mostra anche il numero di serie in particolare.

Esempio # 01: Groupby Max Panda - Colonna singola

Avviando l'implementazione pratica della colonna singola GroupBy Max utilizzando il codice Python in Pandas DataFrame, abbiamo bisogno di uno strumento specifico e per questo, useremo Spyder, come menzionato in precedenza nella descrizione sopra. Ora, dopo aver aperto Spyder sul tuo laptop/desktop, è necessario l'estensione del file come ".Py ”È il riferimento Python perché il nostro codice è in lingua Python.

Ora, a partire dalla parte del codice, c'è una parola Panda che è anche la prima parola del nostro articolo, quindi questo significa che qualcosa con la biblioteca dei Pandas dovrebbe essere implementato per questo; Dobbiamo scrivere "Panda" come "PD", che importerà tutte le caratteristiche della libreria Panda nel nostro file di lavoro.

La colonna singola GroupBy Max funziona chiamando "GroupBy ()" e scrivendo il nome della colonna che desideri dal tuo telaio di dati, che è "Cities" in "DF" seguito dalla selezione del campo per la stima massima "Max () " funzione.

L'output è la singola colonna "Cities" come abbiamo selezionato, mostrando i valori massimi di ciascuno.

Esempio # 02: Groupby Max Panda - Più colonne

Ora, apri il nuovo file per l'implementazione di esempio di più colonne in GroupBy Max in quanto è possibile trovare il valore massimo di ciascun gruppo che si riferisce a colonne diverse dal tuo "DF" in Pandas Groupby Max. Seleziona le colonne; Qui, puoi selezionare più di una colonna mentre solleva le più colonne dal tuo "DF" secondo la tua necessità.

Il codice utilizzato per Multiple GroupBy Max è:

L'output, come puoi vedere, visualizza i valori massimi di entrambe le colonne.

Esempio # 03: GroupBy Max Pandas - Utilizzo della funzione Pivot

Ancora una volta, aprendo un nuovo file per l'esempio di funzionamento della funzione pivot in GroupBy Max Pandas. La funzione Pivot () è quella di organizzare il tuo "DF" in una bella forma rappresentabile. Puoi lavorarci su con colonne singole o più. Qui, l'implementazione è su più colonne GroupBy, ma se si desidera eseguire il GroupBy Panda MAX PANDA PIVOT a colonna singola, è necessario aggiungere una colonna nel gruppo () Aggiungi al posto di più colonne; Puoi anche ottenere la semplice rappresentazione della colonna.

Il Pivot () in Pandas GroupBy Max Code è:

Usando la funzione Pivot (), il display di output sembra individuali.

Esempio # 04: Groupby Max - Utilizzo di una funzione aggregata

È necessario aprire un altro file dal file e andare al nuovo file. Ora, cerchiamo l'esempio usando la funzione aggregata nel gruppo di Max Panda. La funzione aggregata nel codice, che scriviamo come agg (), funziona prendendo il "massimo" come input, che eseguirà il gruppo max nel tuo "df" e faranno una struttura definita del tuo "DF".

La funzione aggregata GroupBy Max Panda per il codice multiplo della colonna è:

La funzione Agg () consente tutta l'aggregazione della colonna possibile con valori massimi.

Esempio # 05: GroupBy Max - Utilizzo della funzione reset_index (per colonne singole e più)

L'indice di reset con il suo nome spiega che la sua funzione sta ripristinando l'indice e fornirà anche un nuovo indice al telaio dati rendendolo una struttura dall'aspetto più corretto.

Il codice per la funzione di funzione reset_index singola in panda è:

Qui il ripristino della "df" viene eseguito con la funzione reset () della colonna selezionata, che è città che mostrano i valori massimi.

Per le più colonne reset_function in panda, il codice è:

L'output visualizza entrambe le colonne che ripristinano il "df" nei panda usando la funzione reset () groupby max.

Conclusione

La funzione Panda Groupby Max è molto utile e semplicistica. In quanto può rilevare il valore massimo della colonna di selezione utilizzando ".funzione max () "e può calcolare il massimo dei valori nel frame dati. In questo articolo, abbiamo spiegato tutti i metodi con cui funziona la funzione max () groupby ().e., GroupBy Max su colonne singole e multiple e possiamo ripristinare l'indice di entrambi, in modo simile all'aggregato e alla funzione pivot che lavora alla sua migliore spiegazione con esempi per una migliore comprensione. Ogni parte di questo tutorial enfatizza la facile comprensione e compensazione dei concetti.