Pandas Groupby Sum

Pandas Groupby Sum
Pandas offre una varietà di funzionalità utili per aiutarci a convertire i dati nel formato desiderato. Uno di questi è la funzione GroupBy che divide le righe di un frame di dati in gruppi in base ai valori di colonne particolari. I panda sono lo strumento migliore per questo caso poiché possono gestire la natura imprevedibile dei dati effettivi. Il metodo "GroupBy ()" di Python per Pandas è uno strumento sofisticato e utile. Ti consente di dividere i tuoi dati in più gruppi ed eseguire i calcoli per un'analisi più accurata.

Metodo Pandas Sum ()

La somma dei valori per l'asse richiesto dall'utente viene restituita dalla funzione Sum (). Se il valore di input è un asse di indicizzazione, vengono aggiunti tutti i valori in quella colonna. Questo vale per tutte le colonne. Ciò si traduce in una serie che contiene il totale dei valori di ciascuna colonna. È possibile utilizzare direttamente il metodo Pandas Sum () sulle colonne scelte dall'output del gruppo Panda per ottenere la somma o il totale di ciascun gruppo. Questo metodo figura la somma di righe e colonne dell'input.

Metodo Pandas GroupBy Sum ()

Ci sono alcuni seguenti passaggi per trovare la Sum GroupBy Panda ():

  • Crea un tipo di dati che è bidimensionale, mutabile per dimensioni e può contenere set di dati di grandi dimensioni.
  • Visualizza l'ingresso di dati dati, DF.
  • Usando il DF. GroupBy Sum (), trova GroupBy Sum (). Questa funzione ordina i valori in una data colonna. I valori delle altre colonne vengono quindi ordinati a seconda dei valori ordinati.
  • La somma per il gruppo.

Sintassi per il metodo GroupBy Sum ()

Questa sintassi di base viene utilizzata per calcolare la somma dei valori nella funzione GroupBy Sum ().

Esempio 1: crea un oggetto GroupBy utilizzando DataFrame

Abbiamo bisogno di un software o di strumenti per darci una piattaforma in cui possiamo eseguire questo programma per mettere in pratica l'esempio dei codici Python. Pertanto, viene utilizzato lo strumento "Spyder". Dobbiamo aprire un nuovo file quando viene visualizzata l'interfaccia. Sull'interfaccia dello strumento "Spyder", abbiamo scelto l'opzione "Nuovo file" per eseguire il codice. Ci offre anche opzioni aggiuntive per aprire i file. Pertanto, puoi anche aprirlo usando "Ctrl+N".

Dobbiamo importare questi "panda come PD" per eseguire il codice Pandas. La sezione "PD" del codice indica a Python di assegnare a Panda l'alias di "PD.DataFrame.GroupBy () "come nome di funzione come data frame" groupby () ". Utilizzando GroupBy, raggruppiamo i dati Pandas. La funzione di cernia sceglie la colonna richiesta. Utilizzando un mapper o un set di colonne, la funzione GroupBy () raggruppa un frame dati e restituisce un oggetto GroupBy. Grandi quantità di dati in questi gruppi possono essere combinate o trasformate applicando una varietà di metodi e funzioni personalizzate agli oggetti GroupBy.

Abbiamo creato un frame di dati la cui dimensione è "6, 2" e i nomi delle sue colonne sono "alfabeto" e "valore". In questo esempio, le variabili che abbiamo preso sono "K", "L" e "M" e i loro valori sono "36", "21", "42", "8", "9" e "3". Per applicare le funzioni aggregate, il metodo "GroupBy ()" di Pandas raggruppa i dati simili in un gruppo. Questo metodo restituisce un oggetto GroupBy GroupBy di dati che ha metodi aggregati come Sum e altri simili. Il "df.GroupBy (["Alphabet"] ", ad esempio, aggiunge tutte le colonne di valore in un frame di dati insieme e calcola le loro somme. L'uso del "gruppo.Il metodo Count () ”è quello di ottenere il conteggio per ciascun gruppo, ignorando i valori nessuno e NAN per raggruppare le righe per colonna. Inoltre, funziona con dati di tipo non fluttuante. Con i conteggi dei valori per ciascun gruppo in un gruppo, costruisci una nuova serie o frame dati.

In questo codice, abbiamo usato il "gruppo.somma()". Questa funzione ordina i valori in una data colonna. I valori delle altre colonne vengono quindi ordinati a seconda dei valori ordinati. Questo crea una tabella i cui nomi di colonne sono "alfabeto" e "valori" dell'alfabeto che è scritto sotto l'alfabeto e scrivere i loro valori davanti a loro. Usando il "gruppo.Sum () ", gli alfabeti simili combinano i loro valori e li fanno sommare. Usando il "gruppo.Sum () ", gli alfabeti simili combinano i loro valori e li fanno sommare.

Dopo aver eseguito il codice, ha mostrato il suo risultato in cui il "gruppo.La funzione Count () "ha creato una tabella contando gli" alfabeti "e" valori ". Nella riga successiva, raccoglie gli alfabeti simili e somma i loro gruppi usando il "gruppo.Sum () "funzione. Ora, il valore per "k" è "99", il valore per "l" è "17" e il valore per "m" è 3.

Esempio 2: trova e somma la velocità di alcuni animali usando la funzione GroupBy Sum ()

Questo scenario è anche paragonabile al primo. Per le funzioni che abbiamo usato nell'esempio precedente, usiamo anche lo stesso in questo codice. Per questo, abbiamo creato un frame dati che ha due colonne. Il nome per una colonna è "animale" e l'altra è "velocità".

In questo codice, abbiamo anche le stesse funzioni che abbiamo avuto nel programma precedente: il "gruppo.Count () "e" Gruppo.somma()". La somma di ciascun gruppo può essere ottenuta utilizzando il metodo Panda "Sum ()" direttamente sulle colonne selezionate dall'output del gruppo Pandas. Il frame dati rappresenta la funzione PANDAS DataFrame. Nell'elenco degli animali, abbiamo preso tre animali: "scimmia", "leone" e "tigre". Nella seconda colonna, abbiamo scritto la loro velocità. DataFrame è diviso in gruppi utilizzando il metodo "DataFrame GroupBy ()". Calcola il numero di conteggi di dati simili presenti in una colonna specifica di dati dati.

Usando il "DF.GroupBy () ”, l'oggetto è diviso, viene applicata una funzione e i prodotti sono combinati. Una grande quantità di dati può essere raggruppata utilizzando questo e le operazioni possono essere calcolate su questi gruppi. Puoi raggruppare i tuoi dati con il metodo "GroupBy ()" ed eseguire le operazioni su questi gruppi. Il gruppo.la funzione count () ”restituisce il numero totale di valori non NAN. Viene restituito un frame di dati se ci sono più colonne. Il conteggio è la tecnica aggregata fondamentale più semplice. L'applicazione della funzione Panda COUNT a tutto il telaio di dati sugli animali rivela rapidamente quante "scimmie", "leoni" e "tigri" sono presenti nel gruppo "animale".

Esamina i risultati del file di origine, esegui questo codice e dai un output reale. Questo output visualizza tre tabelle utilizzando tre diverse funzioni. Se contiamo la velocità per tre "scimmie", sarà "105". La velocità per due "leoni" è "160" e la velocità di una "tigre" è "65".

Conclusione

Considerando queste informazioni, questo articolo serve da esempio dell'idea e della necessità di semplificare le cose per te. Abbiamo definito due funzioni qui. Queste sono le applicazioni per il "gruppo.Sum () "e" Gruppo.Count "Funzioni nei panda. Probabilmente puoi capire quanto incredibile e disponibile il "gruppo.Sum () "e" Gruppo.le funzioni Count () "sono per esaminare i dati. In questo tutorial, abbiamo visto come combinare gli stessi dati usando il "DF.Gruppo "e sommandoli. Abbiamo fornito a questa guida una buona e semplice spiegazione di tutti i metodi in modo che sia più facile per te ottenere il nostro punto. Puoi scegliere una delle due tecniche disponibili in base alle tue esigenze, ma padroneggiare entrambe è essenziale e quindi migliora le tue abilità Python Panda.