Questa operazione deve essere eseguita su un frame di dati. Creiamo il frame dati con sette righe e cinque colonne.
#Crea un mercato dati che ha 7 righe e 5 colonne.Risultato
Ora, restituiamo i valori medi di una colonna raggruppando i valori simili in un'altra colonna.
Metodo 1: aggregato ()
Qui, utilizziamo la funzione aggregata () che richiede tre parametri.
Sintassi
Aggregate (DataFrame_Object $ raggruppato, elenco (dataframe_object $ raggruppamento), fun = media)Parametri
Esempio 1
In questo esempio, raggruppiamo i valori nella colonna Market_Place e otteniamo i valori medi nella colonna Market_Squarefeet raggruppata dalla colonna Market_Place.
Risultato
Possiamo vedere che i valori simili (Australia, India e USA) nella colonna Market_Place sono raggruppati e restituiti la media dei valori raggruppati nella colonna Market_Square Feet.
Esempio 2
In questo esempio, raggruppiamo i valori nella colonna Market_Type e otteniamo i valori medi nella colonna Market_Squarefeet raggruppata dalla colonna Market_Type.
Risultato
Possiamo vedere che i valori simili (barra, drogheria e ristorante) nella colonna Market_Type sono raggruppati e restituiti la media dei valori raggruppati nella colonna Market_Square Feet.
Esempio 3
In questo esempio, raggruppiamo i valori nelle colonne Market_Type e Market_Place e otteniamo i valori medi nella colonna Market_Squarefeet raggruppata dalle colonne Market_Type e Market_Place.
Risultato
Possiamo vedere che i valori simili dalle due colonne sono stati raggruppati e restituiti la media dei valori raggruppati nella colonna Market_Square Feet.
Metodo 2: dplyr
Qui, utilizziamo Group_By con Summarise_AT () che sono disponibili nella libreria DPLER per eseguire Group_By con l'operazione media.
Sintassi
DataFrame_Object%>% Group_by (raggruppamento)%>% Sumpiise_AT (vars (raggruppato), elenco (name = media))Dove:
group_by () prende un parametro, i.e. colonna di raggruppamento
Summarise_at () prende due parametri:
Infine, riassumiamo prima con la media e carichiamo nel gruppo. Quindi, cariciamo la colonna raggruppata nell'oggetto dati.
Restituisce un Tibble.
Esempio 1
In questo esempio, raggruppiamo i valori nella colonna Market_Place e otteniamo i valori medi nella colonna Market_Squarefeet raggruppata dalla colonna Market_Place.
Risultato
Possiamo vedere che i valori simili (Australia, India e USA) nella colonna Market_Place sono raggruppati e restituiti la media dei valori raggruppati nella colonna Market_Square Feet.
Esempio 2
In questo esempio, raggruppiamo i valori nella colonna Market_Type e otteniamo i valori medi nella colonna Market_Squarefeet raggruppata dalla colonna Market_Type.
Risultato
Possiamo vedere che i valori simili (barra, drogheria e ristorante) nella colonna Market_Type sono raggruppati e restituiti la media dei valori raggruppati nella colonna Market_Square Feet.
Conclusione
È possibile raggruppare le colonne singole o più con altre colonne numeriche per restituire la media della colonna numerica usando la funzione aggregata (). Allo stesso modo, possiamo usare la funzione GroupBy () con la funzione Summarise_AT () per raggruppare i valori simili in una colonna e restituire la media dei valori raggruppati rispetto a un'altra colonna.