Filtro nan panda

Filtro nan panda

Mentre lavorano con un gran numero di set di dati, gli utenti spesso incontrano più valori null o NAN. I valori null rappresentano i valori null in un set di dati. In Python, gli sviluppatori si imbattono anche in valori NAN quando lavorano con Panda a Python. Per filtrare questi valori nulli, Python include funzioni diverse.

I risultati di questo blog sono:

  • Cos'è i "panda" in Python?
  • Quali sono i valori NAN?
  • Come filtrare la riga specifica dal set di dati che contiene il valore NAN utilizzando Pandas DataFrame in Python?
  • Come filtrare più righe dal set di dati che contiene il valore NAN utilizzando Pandas DataFrame in Python?
  • Come filtrare tutte le righe dal set di dati che contiene il valore NAN utilizzando Pandas DataFrame in Python?

Cos'è i "panda" in Python?

In Python, "panda"È la libreria più utilizzata per lavorare con float, datetime, stringa, ecc., Tipi di set di dati. Ha molteplici funzioni per esplorare, analizzare, pulire e manipolare i dati desiderati. In altre parole, consente agli utenti di filtrare le righe con i valori NAN usando il "DataFrame"Funzioni, come"DataFrame.dropna ()", E "DataFrame.non nullo()"Funzioni.

Quali sono i valori NAN?

Quasi tutti i set di dati hanno valori null, il null è un particolare valore a punto mobile che rappresenta "Non un numero". I dati sono disponibili in più forme e forme tra cui valori vuoti/mancanti che sono rappresentati come NAN. Come altri linguaggi di sviluppo, Python ha anche diversi modi per rappresentare i valori mancanti nei set di dati.

Come filtrare particolari righe di dati dal set di dati che contiene valore NAN utilizzando il Frame dati Pandas in Python?

Per filtrare le righe specifiche dal set di dati che contiene valori NAN, in primo luogo, creeremo un set di dati contenente valori NAN. Per farlo, importare il “numpy", E "panda"Moduli della libreria e crea un nuovo set di dati. Quindi, controlla il set di dati appena creato:

Importa panda come PD
Importa Numpy come NP
dataframe = pd.DataFrame ('Authors': ['Maria', 'Henry', 'Marry', NP.nan, 'Alex'],
'Nome utente': ['fmn018', NP.nan, 'fm012', 'mg002', 'ma025'],
'Experience': ['1 Year', '2 Year', NP.nan, "6 mesi", "9 mesi"]
)
DataFrame

Come puoi vedere, il set di dati creato include più valori NAN:

Ora, usa il "non nullo()"Funzione per filtrare la riga specifica dalla colonna particolare che contiene valori NAN:

DataFrame [DataFrame ['Experience'].non nullo()]

Produzione

Come filtrare più righe di dati dal set di dati che contiene il valore NAN utilizzando Pandas DataFrame in Python?

A volte, gli utenti devono filtrare le più righe dal set di dati fornito da più di una colonna. Per fare ciò, specificare i nomi delle colonne desiderati e quindi utilizzare il “Tutto()Funzione "con il"non nullo()" funzione:

colonne = ['Experience', 'Nome utente']
DataFrame [dataframe [colonne].non nullo().tutti (1)]

Si può osservare che più righe vengono filtrate dal set di dati che contiene valori NAN dalle colonne specificate:

Come filtrare tutte le righe dal set di dati che contiene il valore NAN utilizzando Pandas DataFrame in Python?

Se gli utenti desiderano filtrare tutte le righe dal set di dati che contengono valori NAN utilizzando il frame dati Pandas in Python, il “dropna ()"La funzione può essere utilizzata:

DataFrame.dropna ()

Produzione

Abbiamo compilato i modi più semplici per filtrare i valori NAN in Python.

Conclusione

Per filtrare le righe con i valori NAN in Python, il "DataFrame"Funzioni, come"DataFrame.non nullo()", E "DataFrame.dropna ()"Vengono utilizzate le funzioni. Questo blog ha fornito i diversi modi per filtrare i valori NAN in Python.