Come eseguire il funzionamento di aggregazione con GroupBy Sum

Come eseguire il funzionamento di aggregazione con GroupBy Sum
In questo tutorial, vedremo come eseguire le operazioni di aggregazione raggruppando i dati e restituendo la somma totale per le righe raggruppate.

Questa operazione deve essere eseguita su un frame di dati. Creiamo il frame dati con sette righe e cinque colonne.

#Crea un mercato dati che ha 7 righe e 5 colonne.
mercato = dati.frame (market_id = c (1,2,1,4,3,4,5), market_name = c ('m1', 'm2', 'm3',
'M4', 'M3', 'M4', 'M3'), Market_Place = C ('India', 'USA', 'India', 'Australia', 'USA',
'India', 'Australia'), Market_Type = C ('Grocery', 'Bar', 'Grocery', 'Restaurant',
'Grocery', 'bar', 'drogheria'), market_squarefeet = c (120.342.220.110.342.220.110))
#display il telaio di dati di mercato
Stampa (mercato)

Risultato

Ora restituiremo la somma totale di una colonna raggruppando i valori simili in un'altra colonna.

Metodo 1: aggregato ()

Qui, utilizziamo la funzione aggregata () che richiede tre parametri.

Sintassi

Aggregate (dataframe_object $ raggruppato, elenco (dataframe_object $ raggruppamento), fun = sum)

Parametri

  1. Il primo parametro prende la colonna variabile (raggruppata) che restituisce la somma dei valori per gruppo.
  2. Il secondo parametro prende una colonna singola o multipla (raggruppamento) in un elenco in modo tale che i valori siano raggruppati in queste colonne.
  3. Il terzo parametro prende in giro, il che prende la funzione Sum per restituire la somma totale sui valori raggruppati.

Esempio 1
In questo esempio, raggruppiamo i valori nella colonna Market_Place e otteniamo la somma dei valori nella colonna Market_Squarefeet raggruppata dalla colonna Market_Place.

#Crea un mercato dati che ha 7 righe e 5 colonne.
mercato = dati.frame (market_id = c (1,2,1,4,3,4,5), market_name = c ('m1', 'm2', 'm3',
'M4', 'M3', 'M4', 'M3'), Market_Place = C ('India', 'USA', 'India', 'Australia', 'USA',
'India', 'Australia'), Market_Type = C ('Grocery', 'Bar', 'Grocery', 'Restaurant',
'Grocery', 'bar', 'drogheria'), market_squarefeet = c (120.342.220.110.342.220.110))
#get la somma dei piedi quadrati in gruppo raggruppando Market_Place
Print (aggregato (mercato $ market_squarefeet, elenco (mercato $ market_place), fun = sum))

Risultato

Possiamo vedere che i valori simili (Australia, India e USA) nella colonna Market_Place sono raggruppati e restituiti la somma dei valori raggruppati nella colonna Market_Square Feet.

Esempio 2
In questo esempio, raggruppiamo i valori nella colonna Market_Type e otteniamo la somma nella colonna Market_Squarefeet raggruppata dalla colonna Market_Type.

#Crea un mercato dati che ha 7 righe e 5 colonne.
mercato = dati.frame (market_id = c (1,2,1,4,3,4,5), market_name = c ('m1', 'm2', 'm3',
'M4', 'M3', 'M4', 'M3'), Market_Place = C ('India', 'USA', 'India', 'Australia', 'USA',
'India', 'Australia'), Market_Type = C ('Grocery', 'Bar', 'Grocery', 'Restaurant',
'Grocery', 'bar', 'drogheria'), market_squarefeet = c (120.342.220.110.342.220.110))
#get la somma dei piedi quadrati in gruppo raggruppando Market_Type
Stampa (aggregata (mercato $ market_squarefeet, elenco (mercato $ market_type), fun = sum))

Risultato

Possiamo vedere che i valori simili (barra, generi alimentari e ristoranti) nella colonna Market_Type sono raggruppati e restituiti la somma dei valori raggruppati nella colonna Market_Square Feet.

Esempio 3
In questo esempio, raggruppiamo i valori nelle colonne Market_Type e Market_Place e otteniamo la somma dei valori nella colonna Market_Squarefeet raggruppata dalle colonne Market_Type e Market_Place.

#Crea un mercato dati che ha 7 righe e 5 colonne.
mercato = dati.frame (market_id = c (1,2,1,4,3,4,5), market_name = c ('m1', 'm2', 'm3',
'M4', 'M3', 'M4', 'M3'), Market_Place = C ('India', 'USA', 'India', 'Australia', 'USA',
'India', 'Australia'), Market_Type = C ('Grocery', 'Bar', 'Grocery', 'Restaurant',
'Grocery', 'bar', 'drogheria'), market_squarefeet = c (120.342.220.110.342.220.110))
#get la somma dei piedi quadrati in gruppo raggruppando Market_Place e Market_Type
Print (aggregato (mercato $ market_squarefeet, elenco (mercato $ market_place, mercato $ market_type), fun = sum))

Risultato

Possiamo vedere che i valori simili dalle due colonne sono stati raggruppati e restituiti la somma dei valori raggruppati nella colonna Market_Square Feet.

Metodo 2: dplyr

Qui, utilizziamo la funzione Group_By () con la funzione Summarise_AT () che sono disponibili nella libreria DPLER per eseguire la funzione Group_By con l'operazione di somma.

Sintassi

DataFrame_Object%>% Group_by (raggruppamento)%>% Sumpiise_at (vars (raggruppato), elenco (name = sum))

Dove:

  1. group_by () prende un parametro, i.e. colonna di raggruppamento
  2. Summarise_at () prende due parametri:
  1. Il primo parametro prende la colonna variabile (raggruppata) che restituisce la somma dei valori per gruppo.
  2. Il secondo parametro prende la funzione di somma attraverso l'elenco.

Infine, riassumiamo prima la somma e la cariciamo nel gruppo. Quindi, cariciamo la colonna raggruppata nell'oggetto dati.

Restituisce un Tibble.

Esempio 1
In questo esempio, raggruppiamo i valori nella colonna Market_Place e otteniamo la somma dei valori nella colonna Market_Squarefeet raggruppata dalla colonna Market_Place.

libreria ("dplyr")
#get la somma dei piedi quadrati in gruppo raggruppando Market_Place
Stampa (Market %> %Group_by (Market_Place) %> %
Summarise_at (vars (market_squarefeet), list (name = sum)))

Risultato

Possiamo vedere che i valori simili (Australia, India e USA) nella colonna Market_Place sono raggruppati e restituiti la somma dei valori raggruppati nella colonna Market_Square Feet.

Esempio 2
In questo esempio, raggruppiamo i valori nella colonna Market_Type e otteniamo la somma dei valori nella colonna Market_Squarefeet raggruppata dalla colonna Market_Type.

libreria ("dplyr")
#get la somma dei piedi quadrati in gruppo raggruppando Market_Type
Stampa (Market %> %Group_by (Market_Type) %> %
Summarise_at (vars (market_squarefeet), list (name = sum)))

Risultato

Possiamo vedere che i valori simili (barra, drogheria e ristoranti) nella colonna Market_Type sono raggruppati e restituiti la somma dei valori raggruppati nella colonna Market_Square Feet.

Conclusione

È possibile raggruppare le colonne singole o più con le altre colonne numeriche per restituire la somma della colonna numerica usando la funzione aggregata (). Allo stesso modo, possiamo usare la Fucniton GroupBy () con la funzione Sumpirise_AT () per raggruppare i valori simili in una colonna e restituire la somma dei valori raggruppati rispetto a un'altra colonna.