I panda ottengono un valore più frequente

I panda ottengono un valore più frequente
L'obiettivo di questo articolo è mostrare il valore più frequente in un insieme di numeri. Per sommare il numero di volte in cui appare un elemento o un numero, viene utilizzata la funzione Value_Counts () di Python. Il metodo modalità () può quindi essere utilizzato per ottenere l'elemento più spesso che si verifica. Se vuoi diversi modi per ottenere i valori più frequenti in Python, questo articolo ha tutte le linee guida.

Qual è il metodo value_counts () in python?

I valori univoci di un oggetto Pandas vengono contati utilizzando il metodo Value Counts (). In Python, in genere utilizziamo questa tecnica per la lodo di dati e l'esplorazione dei dati.

Il metodo value_counts () può funzionare con una varietà di oggetti Pandas. Serie Pandas, Panda DataFrames e DataFrame Colonne sono esempi di questi (che sono oggetti Serie Pandas).

Tuttavia, a seconda del tipo di oggetto con cui stai lavorando, il modo in cui implementi il ​​metodo Value_Counts () differirà leggermente.

Altri argomenti opzionali possono essere utilizzati per alterare la funzionalità del metodo Value_Counts ().

Sintassi della funzione Modalità serie Pandas ()

In una serie Pandas, il valore più comune è semplicemente la modalità della serie. Il metodo Panda Series () viene utilizzato per acquisire informazioni sulla modalità. La sintassi è la seguente. Le modalità della serie vengono restituite in ordine ordinato.

# df ['colonna'].modalità()

Sintassi della funzione Pandas value_counts ()

Per recuperare il valore di conteggio più alto, utilizzare le funzioni Pandas value_counts () e idxmax (). La sintassi è la seguente:

# df ['colonna'].value_counts ().idxmax ()

Ora diamo un'occhiata ad alcuni esempi pratici per vedere come è possibile ottenere i valori più frequenti seguendo i passaggi.

Esempio 1:

Dobbiamo prima stabilire il frame dati prima di procedere ai passaggi per determinare il valore più frequente con la modalità (). Questo è un telaio di dati con un campo di categoria che useremo per il resto del tutorial. Il frame dati "D_Frame" contiene i nomi ("Kim", "Kourtney", "Scott", "Rob", "Kendall", "Gathie", "Phill") e Informazioni di squadra ("A", "B", " C ',' d ',' e ',' a ',' b ',' a ',' b ',' a '). La colonna "Team" del Frame Data è un campo di categoria con valori che indicano il team assegnato a ciascun studente.

Il modulo Pandas viene importato all'inizio del codice nel codice di riferimento seguente. Il frame dati viene quindi generato e presentato sullo schermo.

Panda di importazione
d_frame = panda.DataFrame (
'Nome': ['Kim', 'Kourtney', 'Scott', 'Rob', 'Kendall', 'Gathie', 'Phill',
'Team': ['a', 'b', 'c', 'd', 'e', ​​'a', 'b'
)
Stampa (d_frame)

Nell'immagine qui sotto, i nomi degli studenti vengono visualizzati insieme al nome del team a cui è stato assegnato.

Ti mostreremo come utilizzare la funzione modalità () per determinare il valore più frequente. La modalità, che è una statistica descrittiva, è fondamentalmente il valore più comune nel set di dati. Ti darà informazioni sul team che ha il maggior numero di studenti.

Abbiamo importato prima il modulo Pandas e generato il telaio di dati, come puoi vedere nel codice. I nomi degli studenti e del team sono inclusi nel frame dati.

Panda di importazione
d_frame = panda.DataFrame (
'Nome': ['Kim', 'Kourtney', 'Scott', 'Rob', 'Kendall', 'Gathie', 'Phill',
'Team': ['a', 'b', 'c', 'd', 'e', ​​'a', 'b'
)
Stampa (d_frame ['team'].modalità())

Fornisce una serie Pandas più la modalità della colonna. Poiché "A" e "B" sono i valori più frequenti nel campo "Team", otteniamo "A" e "B" come modalità.

Si prega di notare che è possibile acquisire la modalità di ciascuna colonna in un telaio dati Pandas utilizzando il metodo modalità ().

Esempio 2:

Ti mostreremo come usare valori_counts () per ottenere il valore più frequente in questo esempio. La funzione value_counts () può essere utilizzata per ottenere conteggi, quindi la funzione Idxmax () può essere utilizzata per ottenere il valore con il maggior numero di conteggi.

Il resto del codice, ad eccezione dell'ultima riga, è identico a quello sopra. Dimostra come viene utilizzata la funzione (value_counts) per scoprire il valore con il conteggio più alto.

Panda di importazione
d_frame = panda.DataFrame (
'Nome': ['Kim', 'Kourtney', 'Scott', 'Rob', 'Kendall', 'Gathie', 'Phill',
'Team': ['a', 'b', 'c', 'd', 'e', ​​'a', 'a']
)
Stampa (d_frame ['team'].value_counts ().idxmax ())

Vedere la schermata risultante in basso. Otteniamo il valore nella colonna "squadra" con il conteggio dei valori massimo.

Esempio 3:

Questo esempio dimostrerà cosa accadrà se il telaio di dati contiene i valori più frequente. Cambiamo il frame dati in modo che la colonna "team" contenga modalità ripetute. Cambiamo il valore di "squadra" di Rob "da" D "a" B "qui.

Panda di importazione
d_frame = panda.DataFrame (
'Nome': ['Kim', 'Kourtney', 'Scott', 'Rob', 'Kendall', 'Gathie', 'Phill',
'Team': ['a', 'b', 'c', 'd', 'e', ​​'a', 'f']
)
d_frame.a [3, 'team'] = 'b'
Stampa (d_frame)

Ora abbiamo modalità ricorrenti, come puoi vedere. "A" appare due volte nella colonna "Team" nel nostro scenario.

Il nome del team per lo studente "Rob" è stato cambiato da "D" a "A" nell'immagine di accompagnamento.

Esempio 4:

Vediamo quali sono i metodi Value Counts () e IdxMax (). Abbiamo aggiornato i valori di dati in questo codice di esempio. Si noti che la squadra "A" e "B" appaiono due volte. Dopodiché, abbiamo usato il valore.Counts () e idxmax () per determinare il valore più comune nel frame dati. Ecco il codice di riferimento.

Panda di importazione
d_frame = panda.DataFrame (
'Nome': ['Kim', 'Kourtney', 'Scott', 'Rob', 'Kendall', 'Gathie', 'Phill',
'Team': ['a', 'b', 'c', 'd', 'e', ​​'a', 'b'
)
Stampa (d_frame ['team'].value_counts ().idxmax ())

Si noti che anche se ci sono molte modalità presenti, questo metodo restituisce solo un singolo valore. Ciò è accaduto perché la funzione idxmax () fornisce solo un risultato: “Se i valori più multipli corrispondono al massimo, il titolo di una fila con quel valore viene restituito."Per recuperare il valore più comune in una serie Pandas, è necessario applicare la funzione" modalità () "della serie Pandas".

Conclusione:

In questo articolo, abbiamo esaminato come trovare il valore più frequente in una colonna o una serie di Panda usando alcuni esempi. Abbiamo discusso di una varietà di funzioni che possono essere utilizzate per raggiungere questo obiettivo. MODE (), Value Counts () e IdxMax () sono alcuni di questi metodi. Se sei nuovo in questo concetto e hai bisogno di una guida passo-passo per iniziare, non andare oltre questo articolo.