Come eseguire operazioni di aggregazione con GroupBy Media

Come eseguire operazioni di aggregazione con GroupBy Media
In questo tutorial, vedremo come eseguire le operazioni di aggregazione raggruppando i dati e restituendo i valori medi per le righe raggruppate.

Questa operazione deve essere eseguita su un frame di dati. Creiamo il frame dati con sette righe e cinque colonne.

#Crea un mercato dati che ha 7 righe e 5 colonne.
mercato = dati.frame (market_id = c (1,2,1,4,3,4,5), market_name = c ('m1', 'm2', 'm3',
'M4', 'M3', 'M4', 'M3'), Market_Place = C ('India', 'USA', 'India', 'Australia', 'USA',
'India', 'Australia'), Market_Type = C ('Grocery', 'Bar', 'Grocery', 'Restaurant',
'Grocery', 'bar', 'drogheria'), market_squarefeet = c (120.342.220.110.342.220.110))
#display il telaio di dati di mercato
Stampa (mercato)

Risultato

Ora, restituiamo i valori medi di una colonna raggruppando i valori simili in un'altra colonna.

Metodo 1: aggregato ()

Qui, utilizziamo la funzione aggregata () che richiede tre parametri.

Sintassi

Aggregate (DataFrame_Object $ raggruppato, elenco (dataframe_object $ raggruppamento), fun = media)

Parametri

  1. Il primo parametro prende la colonna variabile (raggruppata) che restituisce i valori medi per gruppo.
  2. Il secondo parametro prende una colonna singola o multipla (raggruppamento) in un elenco in modo tale che i valori siano raggruppati in queste colonne.
  3. Il terzo parametro si diverte, il che prende la funzione media per restituire la media sui valori raggruppati.

Esempio 1
In questo esempio, raggruppiamo i valori nella colonna Market_Place e otteniamo i valori medi nella colonna Market_Squarefeet raggruppata dalla colonna Market_Place.

#Crea un mercato dati che ha 7 righe e 5 colonne.
mercato = dati.frame (market_id = c (1,2,1,4,3,4,5), market_name = c ('m1', 'm2', 'm3',
'M4', 'M3', 'M4', 'M3'), Market_Place = C ('India', 'USA', 'India', 'Australia', 'USA',
'India', 'Australia'), Market_Type = C ('Grocery', 'Bar', 'Grocery', 'Restaurant',
'Grocery', 'bar', 'drogheria'), market_squarefeet = c (120.342.220.110.342.220.110))
#get la media dei piedi quadrati in gruppo raggruppando Market_Place
Stampa (aggregata (mercato $ market_squarefeet, elenco (mercato $ market_place), fun = media))

Risultato

Possiamo vedere che i valori simili (Australia, India e USA) nella colonna Market_Place sono raggruppati e restituiti la media dei valori raggruppati nella colonna Market_Square Feet.

Esempio 2
In questo esempio, raggruppiamo i valori nella colonna Market_Type e otteniamo i valori medi nella colonna Market_Squarefeet raggruppata dalla colonna Market_Type.

#Crea un mercato dati che ha 7 righe e 5 colonne.
mercato = dati.frame (market_id = c (1,2,1,4,3,4,5), market_name = c ('m1', 'm2', 'm3',
'M4', 'M3', 'M4', 'M3'), Market_Place = C ('India', 'USA', 'India', 'Australia', 'USA',
'India', 'Australia'), Market_Type = C ('Grocery', 'Bar', 'Grocery', 'Restaurant',
'Grocery', 'bar', 'drogheria'), market_squarefeet = c (120.342.220.110.342.220.110))
#get la media dei piedi quadrati in gruppo raggruppando Market_Type
Print (aggregato (mercato $ market_squarefeet, elenco (mercato $ market_type), fun = media))

Risultato

Possiamo vedere che i valori simili (barra, drogheria e ristorante) nella colonna Market_Type sono raggruppati e restituiti la media dei valori raggruppati nella colonna Market_Square Feet.

Esempio 3
In questo esempio, raggruppiamo i valori nelle colonne Market_Type e Market_Place e otteniamo i valori medi nella colonna Market_Squarefeet raggruppata dalle colonne Market_Type e Market_Place.

#Crea un mercato dati che ha 7 righe e 5 colonne.
mercato = dati.frame (market_id = c (1,2,1,4,3,4,5), market_name = c ('m1', 'm2', 'm3',
'M4', 'M3', 'M4', 'M3'), Market_Place = C ('India', 'USA', 'India', 'Australia', 'USA',
'India', 'Australia'), Market_Type = C ('Grocery', 'Bar', 'Grocery', 'Restaurant',
'Grocery', 'bar', 'drogheria'), market_squarefeet = c (120.342.220.110.342.220.110))
#get la media dei piedi quadrati in gruppo raggruppando Market_Place e Market_Type
Print (aggregato (mercato $ market_squarefeet, elenco (mercato $ market_place, market $ market_type), fun = media))

Risultato

Possiamo vedere che i valori simili dalle due colonne sono stati raggruppati e restituiti la media dei valori raggruppati nella colonna Market_Square Feet.

Metodo 2: dplyr

Qui, utilizziamo Group_By con Summarise_AT () che sono disponibili nella libreria DPLER per eseguire Group_By con l'operazione media.

Sintassi

DataFrame_Object%>% Group_by (raggruppamento)%>% Sumpiise_AT (vars (raggruppato), elenco (name = media))

Dove:

group_by () prende un parametro, i.e. colonna di raggruppamento

Summarise_at () prende due parametri:

  1. Il primo parametro prende la colonna variabile (raggruppata) che restituisce i valori medi per gruppo.
  2. Il secondo parametro prende la funzione media attraverso l'elenco.

Infine, riassumiamo prima con la media e carichiamo nel gruppo. Quindi, cariciamo la colonna raggruppata nell'oggetto dati.

Restituisce un Tibble.

Esempio 1
In questo esempio, raggruppiamo i valori nella colonna Market_Place e otteniamo i valori medi nella colonna Market_Squarefeet raggruppata dalla colonna Market_Place.

libreria ("dplyr")
#get la media dei piedi quadrati in gruppo raggruppando Market_Place
Stampa (Market %> %Group_by (Market_Place) %> %
Summarise_at (vars (market_squarefeet), list (name = mean)))

Risultato

Possiamo vedere che i valori simili (Australia, India e USA) nella colonna Market_Place sono raggruppati e restituiti la media dei valori raggruppati nella colonna Market_Square Feet.

Esempio 2
In questo esempio, raggruppiamo i valori nella colonna Market_Type e otteniamo i valori medi nella colonna Market_Squarefeet raggruppata dalla colonna Market_Type.

libreria ("dplyr")
#get la media dei piedi quadrati in gruppo raggruppando Market_Type
Stampa (Market %> %Group_by (Market_Type) %> %
Summarise_at (vars (market_squarefeet), list (name = mean)))

Risultato

Possiamo vedere che i valori simili (barra, drogheria e ristorante) nella colonna Market_Type sono raggruppati e restituiti la media dei valori raggruppati nella colonna Market_Square Feet.

Conclusione

È possibile raggruppare le colonne singole o più con altre colonne numeriche per restituire la media della colonna numerica usando la funzione aggregata (). Allo stesso modo, possiamo usare la funzione GroupBy () con la funzione Summarise_AT () per raggruppare i valori simili in una colonna e restituire la media dei valori raggruppati rispetto a un'altra colonna.