I panda contano distinti

I panda contano distinti
Questo articolo esplorerà vari modi e metodi per determinare il numero di elementi univoci in un frame di dati Panda.

Dati di esempio

Prima di discutere come determinare il numero di valori univoci in un telaio di dati, avremo bisogno di dati di esempio.

Un codice di esempio è mostrato di seguito:

# Importa panda
Importa panda come PD
df = pd.DataFrame (
'Stipendio': [120000, 100000, 90000, 110000, 120000, 100000, 56000],
"Dipartimento": ["Game Developer", "Database Developer", "Front-End Developer", "Full-Stack Developer", "Database Developer", "Ricercatore di sicurezza", "Cloud-Engineer"],
'Valutazione': [4.3, 4.4, 4.3, 3.3, 4.3, 5.0, 4.4],
INDICE = ['Alice', 'Michael', 'Joshua', 'Patricia', 'Peter', 'Jeff', 'Ruth'])
df

Il codice sopra dovrebbe creare un frame dati di esempio che possiamo utilizzare in questo tutorial. La forma tabulare risultante dei dati è come mostrata:

Metodo unico di panda n. 1

La funzione univoca () è il primo metodo che possiamo utilizzare per determinare il numero di valori univoci in un frame di dati.

La funzione prende una serie come input e restituisce un elenco dei valori univoci.

Ad esempio, per calcolare gli elementi unici nella colonna salariale, possiamo fare:

Stampa (PD.unico (df ['stipendio']))

Il codice sopra dovrebbe restituire gli elementi univoci nella colonna "stipendio".

[120000 100000 90000 110000 56000]

Se si desidera il numero di valori univoci, puoi ottenere la lunghezza dell'elenco come mostrato:

print (f "articoli unici: len (pd.unico (df ['stipendio']) ")

Il codice sopra dovrebbe restituire:

Articoli unici: 5

#2 Funzione Nune Pandas

La funzione Nuneque () consente di ottenere il numero di valori univoci lungo un asse specificato.

Un esempio è come mostrato:

print (f "[numero di elementi univoci/colonna] \ n df.NUNIQUE (axis = 0) ")

Il codice sopra dovrebbe restituire il numero di elementi univoci in ogni colonna. L'output risultante è come mostrato:

[Numero di elementi univoci/colonna]
Stipendio 5
Dipartimento 6
Valutazione 4
dType: int64

Puoi anche prendere il numero di elementi univoci in una colonna specifica come mostrato:

Stampa (df.stipendio.NUNIQUE ())

Quanto sopra dovrebbe restituire il numero di elementi univoci nella colonna salariale.

#3 PANDAS VALUE_COUNTS ()

Pandas ci fornisce anche la funzione value_count (). Questa funzione restituisce il numero di valori univoci in una colonna specificata.

Un esempio è come mostrato:

Res = elenco (DF.stipendio.value_counts ())
print (f "elementi unici: len (res)")

La funzione value_counts () restituisce il conteggio di ciascun valore nella colonna. Convertiamo quindi il risultato in un elenco e otteniamo la lunghezza.

Questo dovrebbe ottenere il numero di elementi univoci nella colonna:

Articoli unici: 5

Conclusione

Questo articolo ha discusso di vari metodi e tecniche che possiamo usare per determinare il numero di valori univoci in un frame dati Panda.