Pandas DataFrame GroupBy

Pandas DataFrame GroupBy
Per raggruppare i dati in categorie e applicare una funzione alle categorie, utilizziamo il metodo Pandas "GroupBy ()". È anche aiutata un'efficace aggregazione dei dati. La funzione GroupBy () viene utilizzata per dividere i dati in gruppi in base ad alcuni criteri specifici. Gli oggetti di "panda" possono essere divisi lungo qualsiasi asse. Possiamo dire che in un metodo "GroupBy ()", l'oggetto è diviso, viene applicata una funzione e i loro risultati sono combinati. I dati di grandi dimensioni possono essere raggruppati utilizzando il metodo "GroupBy ()" e le operazioni possono anche essere calcolate su questi gruppi. Questa guida spiegherà in dettaglio il metodo "GroupBy ()" e ti fornirà le linee guida adeguate sul metodo "GroupBy ()".

Esempio # 01:

Implementiamo anche questa funzione "GroupBy ()" nel codice "Pandas" in questa guida, quindi imparerai più rapidamente sulla funzione "GroupBy ()". Importiamo prima il "panda come pd" nello strumento "spyder" e quindi generiamo un elenco chiamato "dati" e inseriamo alcune informazioni in esso. Mettiamo il nome "Team" come intestazione della colonna e le squadre che aggiungiamo sono "ciclisti, ciclisti, diavoli, diavoli, re, re, re, re, ciclisti, reali, royals, ciclisti". La prossima colonna che creiamo qui è la colonna "Year", in cui aggiungiamo i dati dell'anno come "2014, 2015, 2014, 2015, 2014, 2015, 2016, 2017, 2016, 2014, 2015, 2014".

Ora, questo è il nostro elenco e stiamo cambiando questo elenco di "dati" nel frame dati. Quindi, per questo, abbiamo utilizzato il "PD.Funzione DataFrame () ", che converte questo elenco in DataFrame" Panda ". Il frame dati creato qui è archiviato nella variabile "DF" e lo stampiamo posizionando il "DF" come parametro di "Print ()". Ora, l'obiettivo principale di scrivere questo codice è implementare il metodo "GroupBy ()" su questi dati. Utilizziamo il metodo "GroupBy ()" e lo applichiamo a "Anno". Ciò raggrupperà i dati in base agli anni in cui abbiamo inserito. Dopo il raggruppamento, applica il metodo "Count ()" a questo gruppo. Conterà gli stessi anni e poi li conserverà in "DF1". Dopo questo, abbiamo la "stampa" che lo renderà.


Per ottenere l'output, fai semplicemente clic sul pulsante "Esegui" sull'app "Spyder". Il team di dati contenenti dati e anni viene reso per primo, quindi raggruppa gli stessi anni, li conta e mostra il numero di conteggio di fronte a ogni gruppo. Mentre raggruppa l'anno "2014" e visualizza "5", il che significa che l'anno "2014" appare cinque volte in questo telaio di dati. Questo raggruppamento è fatto perché utilizziamo il metodo "GroupBy ()" su questo frame dati.

Esempio # 02:

Dopo aver importato il "panda come PD", generiamo direttamente il frame dati con il nome "animali" e contiene due colonne: "animale" e "velocità massima". La colonna "animale" ha "Sparrow, Falcon, Parrot, Parrot, Sparrow e Falcon". La colonna "Max Speed" contiene "210, 30, 37, 24, 260 e 390". Crea un frame di data contenente queste colonne poiché abbiamo utilizzato il "PD. Metodo DataFrame () "qui.

Quindi visualizziamo questo frame dati "animale". Successivamente, applichiamo il metodo "GroupBy ()" al telaio di dati "Animali" e inseriamo la colonna "animale" come parametro. Ciò renderà i gruppi dipendenti dagli stessi nomi di animali. Quindi utilizziamo anche la funzione "media ()" qui, che troverà la media di quei gruppi che vengono creati qui e inizializziamo la variabile "gruppo" con questo metodo "GroupBy ()", quindi il risultato che otteniamo dopo il raggruppamento ci sarà memorizzato. Vogliamo anche mostrare il risultato che è archiviato in "Gruppo", quindi per questo, utilizziamo di nuovo la funzione "Print ()".


Gli animali e le loro velocità massime vengono visualizzate nel primo frame di dati senza raggruppamento. Dopo questo, la funzione "GroupBy ()" viene applicata qui e raggruppa tutti gli animali con lo stesso nome e quindi trova la loro media e li mostra di seguito.

Esempio # 03:

Stiamo creando un nuovo elenco in questo codice, che è l'elenco "Summer_Courses" e aggiungendo quattro colonne univoci ad esso. I nomi di intestazione delle colonne sono "soggetto, sub_fee, giorni e dis_amount". Aggiungiamo anche i nomi degli argomenti, le spese in materia, la durata del corso in giorni e l'importo dello sconto sulla tassa in quelle colonne. Nel "soggetto" aggiungiamo qui "Sviluppo web, Winginginging, CSS, HTML, CSS, Web Development, CSS, HTML e anche NA". Il "sub_fee" contiene la commissione che è "22000, 25000, 23000, 24000, 25000, 26000, 25000, 25000, 22000 e 15000". I giorni in cui entriamo qui sono "30, 50, 55, 40, 60, 35, 30, 50 e 40", e anche la colonna "Dis_amount" contiene "1000, 2300, 1000, 1200, 2500, nessuno, 1400, 1600 e 0 ".

Ora, dobbiamo cambiare questo elenco in dati. Quindi, per convertire l'elenco in dati di dati, utilizziamo il "PD.Funzione DataFrame () "e nomina la frame data" Summer_Course_DF ". Reniamo anche "Summer_Course_DF" qui. La variabile "Summer_Course1" è inizializzata usando la tecnica "GroupBy ()" in modo che i risultati del raggruppamento vengano salvati in essa. Il metodo "GroupBy ()" viene quindi applicato alla colonna "Soggetto".

Di conseguenza, verranno creati gruppi basati su nomi di argomenti simili. La funzione "Sum ()" viene quindi utilizzata per calcolare la somma dei gruppi di soggetti appena formati. Questa "somma ()" calcola la somma di commissioni, giorni e importi di sconto per gli stessi soggetti. Vogliamo anche visualizzare il risultato che è stato salvato in "Summer_Course1", quindi ancora una volta utilizziamo la funzione "Print ()".


Qui, puoi notare che rende tutti i soggetti separatamente nel primo frame di dati. Quindi combina gli stessi soggetti o crea gruppi degli stessi nomi di argomenti e mostra anche lo stesso nome argomento una volta. Applica la funzione di somma alle colonne sub_fee, giorni e dis_amount degli stessi nomi di argomenti e rende le loro somme qui.

Esempio # 04:

In questo codice, utilizziamo il telaio di dati dell'esempio precedente, ma qui stiamo eseguendo la funzione "GroupBy ()" su più colonne. Passiamo due nomi di colonne alla funzione "GroupBy ()", che sono "soggetti" e "giorni". Quindi posizionare il "Sum ()" che eseguirà la somma sui gruppi che vengono creati qui e li salverà nella variabile "Summer_Courses2". Dopo questo, renderiamo "Summer_Courses2" alla fine.


Questo risultato mostra che svolge la funzione "GroupBy ()" in entrambe le colonne "soggetto" e "giorni" e rende il risultato qui dopo il raggruppamento.

Conclusione:

Puoi utilizzare questa guida per studiare come utilizzare la funzione "GroupBy ()" in "Panda" e anche conoscere la sintassi di questo metodo "GroupBy ()" qui. Il nostro obiettivo principale è darti una spiegazione concisa e comprensibile dell'idea del metodo "GroupBy ()" in "Panda". Abbiamo spiegato che questo metodo ci aiuta a creare gruppi a seconda di alcuni criteri specifici. Abbiamo fatto quattro esempi in questa guida in cui realizziamo gruppi utilizzando il metodo "GroupBy ()" in "Panda". Dopo aver letto questo tutorial, avrai un modesto grado di conoscenza, da cui puoi avanzare a una fase superiore.