Pandas Groupby Count District

Pandas Groupby Count District

Questo articolo ti insegnerà come contare i valori distinti per ciascun gruppo dopo aver raggruppato i dati utilizzando il metodo GroupBy (). Con l'aiuto dei panda.Metodo GroupBy (), possiamo facilmente dividere i dati in più gruppi in modo che le funzioni di aggregazione possano essere applicate a ciascun gruppo. In Panda, questa tecnica è una parte essenziale dell'analisi dei dati. Esistono diversi modi per determinare quanti valori univoci sono presenti in una colonna di dati di dati per un gruppo di dati. Utilizzo di dati.GroupBy (), Nunique (), DataFrame.agg () e serie.metodi value_counts () ecc., Possiamo ottenere il numero di valori distinti per i gruppi.

Come contare i valori univoci dopo aver raggruppato i dati in panda

Innanzitutto, divideremo i dati all'interno della colonna o serie in gruppi di categorie. Quindi useremo una funzione per calcolare il numero di dati/valori univoci per il gruppo di categorie. Nei seguenti esempi, useremo diverse funzioni per contare i dati distinti per i gruppi di categorie.

Esempio # 01: conta i valori distinti da una colonna di dati dati usando il metodo valori_count ()

La funzione valori_count () restituisce un oggetto con conteggi di valori distinti. L'oggetto risultante sarà disposto in ordine decrescente, con il primo elemento che appare il più frequentemente. Per impostazione predefinita, esclude i valori NA. Creiamo innanzitutto un frame dati. Il frame dati verrà creato dopo l'importazione del modulo dei Pandas.

Abbiamo creato il nostro telaio dati utilizzando un dizionario all'interno del PD.Funzione dataframe (). Il nostro telaio di dati è costituito da due colonne, "studente" e "età". Lo studente di colonna contenente i valori dei dati ("Dave", "Sybil", "Dave", "Jenny", "Dave", "Dave", "Sybil", "Jenny", "Jenny", "Sybil") e il La colonna "Age" contiene i valori (14, 15, 16, 16, 15, 14, 15, 14, 14, nessuno). Raggruppiamo ora i dati e determiniamo i valori univoci totali per i gruppi.

La funzione ha restituito i valori distinti totali per i gruppi creati nella colonna "studente". Ad esempio, per il gruppo "Dave", il valore di età "14" in colonna "età" si verifica due volte e i valori "15" e "16" si verificano solo una sola volta, e così via. Come notato, la funzione ha anche ignorato il valore mancante.

Esempio # 02: conta i valori distinti di più colonne usando il metodo valori_count ()

Nell'esempio precedente, abbiamo contato i valori distinti di una singola colonna per ciascun dati/valore raggruppati. Ora determineremo il numero di valori distinti di più colonne dopo aver raggruppato una colonna del frame dati. Abbiamo bisogno di un altro telaio di dati con almeno tre colonne.

Abbiamo creato il nostro frame dati con tre colonne, i.e., 'name', 'marks' e 'grade'. I segni di colonna stanno archiviando i dati ("Tyson", "Nancy", "Nancy", "Tyson", "Jimmy", "Jimmy", "Jimmy", "Nancy", "Tyson"). Mentre le colonne, i "segni" e i "gradi" contengono i valori (15, 15, 17, 17, 18, 18, 14, 14, 14) e ("b", "b", "a", " A ',' a ',' a ',' b ',' b ',' b ') rispettivamente. Ora, contiamo i valori univoci dei "segni" della colonna e dei "voti" dopo aver raggruppato i dati del "nome" della colonna.

La funzione value_counts () viene applicata a un elenco contenente le etichette delle colonne. La funzione ha restituito il conteggio dei valori distintivo per ciascun dati di gruppo in colonna "nome".

Esempio n. 3: conta i valori distinti usando Groupby.funzione nunique ()

Il numero di valori distinti per ogni colonna viene restituito con il metodo Nune (). La funzione Nune () cerca colonna per colonna e recupera il numero di valori di dati distinti per ciascuna riga del telaio di dati quando viene specificato l'asse della colonna (Axis = 'Colonne'). Quando si utilizza il metodo Nune () per determinare il numero di valori distinti, creeremo innanzitutto un telaio di dati con almeno una colonna contenente dati ripetitivi.

Abbiamo creato due colonne, io.e., "dipendente" e "stipendio", nel nostro telaio. Il dipendente della colonna sta archiviando i dati come stringa ("manager", "contabile", "manager", "manager", "impiegato", "contabile", "impiegato", "impiegato", "contabile", "impiegato") e Lo stipendio della colonna contiene i valori (15000, 14000, 15000, 14000, 12000, 13000, 12000, 14000, 15000, 13000). Troviamo i valori distinti nello stipendio della colonna per i gruppi nella colonna "dipendente".

Esistono tre valori univoci nella colonna "stipendio" per i gruppi, "contabile" e "impiegato", nella colonna "dipendente". Il numero di valori distinti per il gruppo 'manager' è 2.

Esempio # 4: conta i valori distinti di più colonne usando la funzione Nune ()

Ora calcoleremo il conteggio di valori univoci per più colonne di dati di dati. Aggiungiamo un'altra colonna nel frame dati, che abbiamo creato nell'esempio n. 3.

Abbiamo aggiunto una nuova colonna "Post" nel nostro frame dati con i valori dei dati ("junior", "junior", "senior", "junior", "senior", "senior", "senior", "junior", " junior ',' junior '). Ora conterremo i valori univoci delle colonne "post" e "stipendio" per ciascun dati di gruppo nella colonna "dipendente". Useremo la funzione Agg () per trovare i conteggi di valori univoci per più colonne.

Abbiamo raggruppato i dati nella colonna "dipendente" e applicato la funzione Agg (). All'interno della funzione Agg (), abbiamo superato un dizionario con i nomi delle colonne come tasti e le stringhe della Nune come valori dei tasti. La funzione ha restituito il numero di valori univoci nelle colonne "post" e "stipendio" per ciascun dati di gruppo, i.e, "contabile", "impiegato" e "manager".

Possiamo anche determinare il numero di valori distinti usando la funzione Nune () senza il metodo Agg (). Per questo, creeremo prima un elenco con etichette di colonne, che vogliamo contare i valori distinti. Quindi, useremo le funzioni GroupBy () e Nune sulle colonne specifiche del Frame dati all'interno dell'elenco anziché l'intero frame dati "DF".

Senza la funzione Agg (), abbiamo ottenuto gli stessi risultati di prima quando abbiamo applicato la funzione Agg ().

Possiamo anche raggruppare più colonne e trovare il numero di valori distinti per il gruppo e il sottogruppo. Raggruppiamo i dati dei colonne "dipendente" e "post" e quindi troviamo i valori distinti nella colonna "stipendio" per ciascun gruppo e sottogruppo.

Esempio # 5: determinare i valori distinti dalla colonna DataFrame usando la funzione univoca ()

Quando si lavora con una colonna particolare di un frame dati, viene utilizzata la funzione univoca () e restituisce tutti i dati/valori univoci della colonna. Innanzitutto, creeremo un frame dati da cui troveremo i valori univoci nella colonna specificata per i dati di gruppo di una singola colonna, raggruppata utilizzando la funzione GroupBy ().

Ci sono due colonne nel nostro telaio di dati, io.e., 'Sesso' e 'età'. I valori dei dati nella colonna "genere" sono ("maschio", "maschio", "maschio", "femmina", "maschio", "femmina", "femmina", "maschio", "femmina", "femmina") e la colonna "Age" sta immagazzinando i valori (19, 19, 20, 18, 20, 18, 19, 20, 17, 20). Ora raggrupperemo i dati nella colonna "genere" usando la funzione GroupBy () e troveremo i valori distinti nell'età della colonna per ciascun gruppo.

La funzione ha restituito un frame dati con i valori distinti di una colonna anziché i conteggi di valori distinti. Tuttavia, si può vedere che ci sono quattro valori unici (18, 19, 17, 20) per il gruppo femmina e 2 valori unici per il maschio di gruppo nella colonna "età".

Conclusione

In questo tutorial di Panda, abbiamo discusso di come determinare o contare i valori distinti o i dati univoci in una colonna o colonne del frame dati in Panda. Ora, potresti essere in grado di contare i valori unici nei panda. Abbiamo implementato più esempi in questo articolo per insegnarti come contare i valori distinti da una colonna di dati utilizzando le funzioni di valori_count (), nunique () e univoco () dopo aver raggruppato i dati utilizzando la funzione GroupBy ().