Come eseguire il funzionamento di aggregazione con Groupby Min

Come eseguire il funzionamento di aggregazione con Groupby Min
In questo tutorial, vedremo come eseguire le operazioni di aggregazione raggruppando i dati e restituendo i valori minimi nelle righe raggruppate.

Questa operazione deve essere eseguita su un frame di dati. Creiamo il frame dati con sette righe e cinque colonne.

#Crea un mercato dati che ha 7 righe e 5 colonne.
mercato = dati.frame (market_id = c (1,2,1,4,3,4,5), market_name = c ('m1', 'm2', 'm3',
'M4', 'M3', 'M4', 'M3'), Market_Place = C ('India', 'USA', 'India', 'Australia',
'USA', 'India', 'Australia'), Market_Type = C ('Grocery', 'Bar', 'Grocery',
'ristorante', 'drogheria', 'bar', 'drogheria'), market_squarefeet = c (120.342.220.110.342.220.110)))
#display il telaio di dati di mercato
Stampa (mercato)

Risultato

Ora, restituiamo i valori minimi in una colonna raggruppando i valori simili in un'altra colonna.

Metodo 1: aggregato ()

Qui, utilizziamo la funzione aggregata () che richiede tre parametri.

Sintassi

Aggregate (dataframe_object $ raggruppato, elenco (dataframe_object $ raggruppamento), fun = min)

Parametri:

  1. Il primo parametro prende la colonna variabile (raggruppata) che restituisce i valori minimi per gruppo.
  2. Il secondo parametro prende una colonna singola o multipla (raggruppamento) in un elenco in modo tale che i valori siano raggruppati in queste colonne.
  3. Il terzo parametro prende in giro, il che prende la funzione MIN per restituire i valori minimi nei valori raggruppati.

Esempio 1
In questo esempio, raggruppiamo i valori nella colonna Market_Place e otteniamo i valori minimi nella colonna Market_Squarefeet raggruppata dalla colonna Market_Place.

#Crea un mercato dati che ha 7 righe e 5 colonne.
mercato = dati.frame (market_id = c (1,2,1,4,3,4,5), market_name = c ('m1', 'm2', 'm3',
'M4', 'M3', 'M4', 'M3'), Market_Place = C ('India', 'USA', 'India', 'Australia', 'USA',
'India', 'Australia'), Market_Type = C ('Grocery', 'Bar', 'Grocery', 'Restaurant',
'Grocery', 'bar', 'drogheria'), market_squarefeet = c (120.342.220.110.342.220.110))
#Tetti il ​​minimo dei piedi quadrati in gruppo raggruppando Market_Place
Stampa (aggregata (mercato $ market_squarefeet, elenco (mercato $ market_place), fun = min))

Risultato

Possiamo vedere che i valori simili (Australia, India e USA) nella colonna Market_Place sono raggruppati e restituiti il ​​minimo dei valori raggruppati nella colonna Market_Square Feet.

Esempio 2
In questo esempio, raggruppiamo i valori nella colonna Market_Type e otteniamo i valori minimi nella colonna Market_Squarefeet raggruppata dalla colonna Market_Type.

#Crea un mercato dati che ha 7 righe e 5 colonne.
mercato = dati.frame (market_id = c (1,2,1,4,3,4,5), market_name = c ('m1', 'm2', 'm3',
'M4', 'M3', 'M4', 'M3'), Market_Place = C ('India', 'USA', 'India', 'Australia', 'USA',
'India', 'Australia'), Market_Type = C ('Grocery', 'Bar', 'Grocery', 'Restaurant',
'Grocery', 'bar', 'drogheria'), market_squarefeet = c (120.342.220.110.342.220.110))
#get il min dei piedi quadrati in gruppo raggruppando Market_Type
Print (aggregato (mercato $ market_squarefeet, elenco (mercato $ market_type), fun = min))

Risultato

Possiamo vedere che i valori simili (barra, drogheria e ristorante) nella colonna Market_Type sono raggruppati e restituiti il ​​minimo dei valori raggruppati nella colonna Market_Square Feet.

Esempio 3
In questo esempio, raggruppiamo i valori nelle colonne Market_Type e Market_Place e otteniamo i valori minimi nella colonna Market_Squarefeet raggruppata dalle colonne Market_Type e Market_Place.

#Crea un mercato dati che ha 7 righe e 5 colonne.
mercato = dati.frame (market_id = c (1,2,1,4,3,4,5), market_name = c ('m1', 'm2', 'm3',
'M4', 'M3', 'M4', 'M3'), Market_Place = C ('India', 'USA', 'India', 'Australia', 'USA',
'India', 'Australia'), Market_Type = C ('Grocery', 'Bar', 'Grocery', 'Restaurant',
'Grocery', 'bar', 'drogheria'), market_squarefeet = c (120.342.220.110.342.220.110))
#get il minimo dei piedi quadrati in gruppo raggruppando Market_Place e Market_Type
Print (aggregato (mercato $ market_squarefeet, elenco (mercato $ market_place, mercato $ market_type), fun = min))

Risultato

Possiamo vedere che i valori simili dalle due colonne sono stati raggruppati e restituiti i valori minimi in ciascun valore raggruppato nella colonna Market_Square Feet.

Metodo 2: dplyr

Qui, utilizziamo la funzione Group_by () con la funzione Summarise_AT () che sono disponibili nella libreria DPLER per eseguire la funzione Group_by () con l'operazione MIN.

Sintassi

DataFrame_Object%>% Group_By (raggruppamento)%>% Sumpiise_at (vars (raggruppato), elenco (nome = min))

Dove:

  1. group_by () prende un parametro, i.e. colonna di raggruppamento
  2. Summarise_at () prende due parametri:
  1. Il primo parametro prende la colonna variabile (raggruppata) che restituisce i valori minimi per gruppo.
  2. Il secondo parametro prende la funzione MIN attraverso l'elenco.

Infine, riassumiamo per la prima volta con il min e lo cariciamo nel gruppo. Quindi, cariciamo la colonna raggruppata nell'oggetto dati.

Restituisce un Tibble.

Esempio 1
In questo esempio, raggruppiamo i valori nella colonna Market_Place e otteniamo i valori minimi nella colonna Market_Squarefeet raggruppata dalla colonna Market_Place.

libreria ("dplyr")
#Tetti il ​​minimo dei piedi quadrati in gruppo raggruppando Market_Place
Print (Market %> % Group_by (Market_Place) %> % Summirise_AT (vars (market_squarefeet), elenco (name = min)))

Risultato

Possiamo vedere che i valori simili (Australia, India e USA) nella colonna Market_Place sono raggruppati e restituiti il ​​minimo da ciascun valore raggruppato nella colonna Market_Square Feet.

Esempio 2
In questo esempio, raggruppiamo i valori nella colonna Market_Type e otteniamo i valori minimi nella colonna Market_Squarefeet raggruppata dalla colonna Market_Type.

libreria ("dplyr")
#get il minimo dei piedi quadrati in gruppo raggruppando Market_Type
Print (Market %> % Group_by (Market_Type) %> % Sumpiise_AT (vars (market_squarefeet), elenco (name = min)))

Risultato

Possiamo vedere che i valori simili (barra, drogheria e ristorante) nella colonna Market_Type sono raggruppati e restituiti i valori minimi in ciascun valore raggruppato nella colonna Market_Square Feet.

Conclusione

È possibile raggruppare le colonne singole o più con le altre colonne numeriche per restituire il valore minimo dalla colonna numerica usando la funzione aggregata (). Allo stesso modo, possiamo usare il funcone GroupBy () con la funzione SummiRise_AT () per raggruppare i valori simili in una colonna e restituire i valori minimi dai valori raggruppati rispetto a un'altra colonna.