In questo tutorial, vedremo come eseguire le operazioni di aggregazione raggruppando i dati e restituendo la mediana nelle righe raggruppate.
Questa operazione deve essere eseguita su un frame di dati. Creiamo il frame dati con sette righe e cinque colonne.
#Crea un mercato dati che ha 7 righe e 5 colonne.
mercato = dati.frame (market_id = c (1,2,1,4,3,4,5), market_name = c ('m1', 'm2', 'm3',
'M4', 'M3', 'M4', 'M3'), Market_Place = C ('India', 'USA', 'India', 'Australia', 'USA',
'India', 'Australia'), Market_Type = C ('Grocery', 'Bar', 'Grocery', 'Restaurant',
'Grocery', 'bar', 'drogheria'), market_squarefeet = c (120.342.220.110.342.220.110))
#display il telaio di dati di mercato
Stampa (mercato)
Risultato
Ora restituiremo la mediana in una colonna raggruppando i valori simili in un'altra colonna.
Metodo 1: aggregato ()
Qui, utilizziamo la funzione aggregata () che richiede tre parametri.
Sintassi
Aggregato (dataframe_object $ raggruppato, elenco (dataframe_object $ raggruppamento), fun = mediana)
Parametri
- Il primo parametro prende la colonna variabile (raggruppata) che restituisce la mediana per gruppo.
- Il secondo parametro prende una colonna singola o multipla (raggruppamento) in un elenco in modo tale che i valori siano raggruppati in queste colonne.
- Il terzo parametro si diverte, il che prende la funzione mediana per restituire la mediana nei valori raggruppati.
Esempio 1
In questo esempio, raggruppiamo i valori nella colonna Market_Place e otteniamo la mediana nella colonna Market_Squarefeet raggruppata dalla colonna Market_Place.
#Crea un mercato dati che ha 7 righe e 5 colonne.
mercato = dati.frame (market_id = c (1,2,1,4,3,4,5), market_name = c ('m1', 'm2', 'm3',
'M4', 'M3', 'M4', 'M3'), Market_Place = C ('India', 'USA', 'India', 'Australia', 'USA',
'India', 'Australia'), Market_Type = C ('Grocery', 'Bar', 'Grocery', 'Restaurant',
'Grocery', 'bar', 'drogheria'), market_squarefeet = c (120.342.220.110.342.220.110))
#get la mediana dei piedi quadrati in gruppo raggruppando Market_Place
Stampa (aggregata (mercato $ market_squarefeet, elenco (mercato $ market_place), fun = mediana))
Risultato
Possiamo vedere che i valori simili (Australia, India e USA) nella colonna Market_Place sono raggruppati e restituiti la mediana dei valori raggruppati nella colonna Market_Square Feet.
Esempio 2
In questo esempio, raggruppiamo i valori nella colonna Market_Type e otteniamo la mediana nella colonna Market_Squarefeet raggruppata dalla colonna Market_Type.
#Crea un mercato dati che ha 7 righe e 5 colonne.
mercato = dati.frame (market_id = c (1,2,1,4,3,4,5), market_name = c ('m1', 'm2', 'm3',
'M4', 'M3', 'M4', 'M3'), Market_Place = C ('India', 'USA', 'India', 'Australia', 'USA',
'India', 'Australia'), Market_Type = C ('Grocery', 'Bar', 'Grocery', 'Restaurant',
'Grocery', 'bar', 'drogheria'), market_squarefeet = c (120.342.220.110.342.220.110))
#get la mediana dei piedi quadrati in gruppo raggruppando Market_Type
Stampa (aggregata (mercato $ market_squarefeet, elenco (mercato $ market_type), fun = mediana))
Risultato
Possiamo vedere che i valori simili (bar, drogheria e ristorante) nella colonna Market_Type sono raggruppati e restituiti la mediana dei valori raggruppati nella colonna Market_Square Feet.
Esempio 3
In questo esempio, raggruppiamo i valori nelle colonne Market_Type e Market_Place e otteniamo la mediana nella colonna Market_Squarefeet raggruppata dalle colonne Market_Type e Market_Place.
#Crea un mercato dati che ha 7 righe e 5 colonne.
mercato = dati.frame (market_id = c (1,2,1,4,3,4,5), market_name = c ('m1', 'm2', 'm3', 'm4', 'm3',
'M4', 'M3'), Market_Place = C ('India', 'USA', 'India', 'Australia', 'USA', 'India', 'Australia'),
market_type = c ('drogheria', 'bar', 'drogheria', 'ristorante', 'drogheria', 'bar', 'drogheria'),
market_squarefeet = C (120.342.220.110.342.220.110))
#get la mediana dei piedi quadrati in gruppo raggruppando Market_Place e Market_Type
Print (aggregato (mercato $ market_squarefeet, elenco (mercato $ market_place, mercato $ market_type), fun = median))
Risultato
Possiamo vedere che i valori simili dalle due colonne sono stati raggruppati e restituiti la mediana in ciascun valore raggruppato nella colonna Market_Square Feet.
Metodo 2: dplyr
Qui, utilizziamo la funzione Group_By () con la funzione Summarise_AT () che sono disponibili nella libreria DPLER per eseguire il divertimento Group_by () con l'operazione mediana.
Sintassi
DataFrame_Object%>% Group_by (raggruppamento)%>% Sumpiise_at (vars (raggruppato), elenco (nome = mediana))
Dove:
- group_by () prende un parametro, i.e. colonna di raggruppamento
- Summarise_at () prende due parametri:
- Il primo parametro prende la colonna variabile (raggruppata) che restituisce la mediana per gruppo.
- Il secondo parametro prende la funzione mediana attraverso l'elenco.
Infine, riassumiamo per la prima volta la mediana e lo cariamo nel gruppo. Quindi, cariciamo la colonna raggruppata nell'oggetto dati.
Restituisce un Tibble.
Esempio 1
In questo esempio, raggruppiamo i valori nella colonna Market_Place e otteniamo la mediana nella colonna Market_Squarefeet raggruppata dalla colonna Market_Place.
libreria ("dplyr")
#get la mediana dei piedi quadrati in gruppo raggruppando Market_Place
Print (Market %> % Group_by (Market_Place) %> % SumpiMe_at (vars (market_squarefeet), elenco (name = median)))
Risultato
Possiamo vedere che i valori simili (Australia, India e USA) nella colonna Market_Place sono raggruppati e restituiti la mediana da ciascun valore raggruppato nella colonna Market_Square Feet.
Esempio 2
In questo esempio, raggruppiamo i valori nella colonna Market_Type e otteniamo la mediana nella colonna Market_Squarefeet raggruppata dalla colonna Market_Type.
libreria ("dplyr")
#get la mediana dei piedi quadrati in gruppo raggruppando Market_Type
Print (Market %> % Group_by (Market_Type) %> % Sumpiise_AT (vars (market_squarefeet), elenco (name = median)))
Risultato
Possiamo vedere che i valori simili (barra, drogheria e ristorante) nella colonna Market_Type sono raggruppati e restituiti la mediana in ciascun valore raggruppato nella colonna Market_Square Feet.
Conclusione
È possibile raggruppare le colonne singole o più con le altre colonne numeriche per restituire la mediana dalla colonna numerica usando la funzione aggregata (). Allo stesso modo, possiamo utilizzare la funzione GroupBy () con la funzione Summarise_AT () per raggruppare i valori simili in una colonna e restituire la mediana dai valori raggruppati rispetto a un'altra colonna.