Panda isna

Panda isna
“Panda è uno dei pacchetti del linguaggio Python che rende l'analisi dei dati molto migliore e più facile da fare. Nel dominio dell'informatica, l'analisi dei dati e la preelaborazione è quasi ad ogni fase, e in cui i dati mancanti sono un processo che richiede molto tempo e un processo cruciale da svolgere molto da fare. Quindi, ecco che arriva "Panda isna", che è una funzione utilizzata per rilevare i valori mancanti dai dati. Funziona in modo tale che restituisca un oggetto di dimensioni simile booleano, che indica che i valori nei dati dati sono "na", il che significa nessuno, e i caratteri come le stringhe che sono vuote dichiarate.

I valori mancanti mostrano come "nan" o "nessuno", come spiegato. Il metodo Panda ISNA non ha alcun parametro. Il tipo di ritorno è un telaio di dati con un booleano. Il "nan" indica i valori "veri". Altrimenti, ogni altro dati è mappato come "falso". Per l'implementazione dei codici, useremo lo strumento "Spyder", che è in linguaggio "Python" infuso. Il panda isna è un nuovo oggetto di panda il cui oggetto di input è della stessa dimensione."

La sintassi per i panda isna ()

Possiamo usare il metodo Panda Isna su varie strutture di dati. Iniziare con la sintassi.

DataFrame.isna ()

Nella sintassi sopra di Panda isna () dati, dobbiamo semplicemente inserire il nome del frame dati su cui vogliamo lavorare. Chiamare il metodo viene eseguito utilizzando "Dot isna."Possiamo anche applicare il metodo di Pandas isna () ai dati della serie. Per questo, dobbiamo assegnare il nome dell'oggetto serie con il metodo isna ().

Ora facciamo gli esempi per una migliore comprensione del metodo di Panda Isna. Di seguito sono riportati i modi in cui implementeremo negli esempi per rilevare i valori mancanti nei panda usando il metodo ISNA ():

  • Identificazione dei valori mancanti in una colonna di dati di dati utilizzando Panda Isna.
  • Identificare i valori mancanti nell'intero telaio di dati utilizzando Panda Isna.
  • Utilizzo di Panda ISNA per contare i valori null all'interno di ogni colonna del frame dati.

Creazione del frame dati per l'implementazione di Pandas isna ()

In primo luogo, dobbiamo importare la libreria Pandas come Panda "PD" è una libreria open source per manipolare i dati e quindi importare la libreria numpy come "NP", che viene utilizzata per i calcoli numerici dei dati. Dopo aver importato le librerie, inizieremo a creare un telaio di dati che può anche essere scritto come "DF". Nel "DF", abbiamo il nome, i paesi, le vendite e le spese. Esistono variabili "quattro" in cui 2 colonne hanno dati sui caratteri e le altre due hanno dati numerici. Segui il comando per stampare i "dati di vendita". Il "np.NAN "nel codice è il" NP "come spiegato sopra e il" NAN "non rappresenta un numero; Complessivamente, è per la creazione dei valori mancanti nel frame dati.

L'output mostra un frame dati creato in base ai dati indicati e possiamo vedere che alcuni dei valori mancano come "nan". Gli esempi di seguito che faremo chiariranno come risolvere questo problema.

Esempio 01: Identificazione dei valori mancanti in una colonna DataFrame usando Pandas Isna ()

Qui, identificheremo i valori mancanti nella colonna. Abbiamo selezionato la colonna "Vendite" per rilevare i termini mancanti. Questo metodo aiuterà a trovare i valori mancanti nella colonna che vogliamo conoscere o su cui lavorare invece di applicare il metodo all'intero telaio per concentrarsi sui termini che dobbiamo sapere. Abbiamo creato il frame dati da cui possiamo vedere che nelle vendite c'è un valore che manca, scritto come "NP.nan ”; Funziona con la tecnica di vero e falso. Mostrerà i valori assegnati come "falsi" e quelli mancanti come "vero".

L'output visualizza i risultati in booleano, il che significa vero e falso. I valori veri e falsi in cui possiamo vedere chiaramente dove è scritto il valore mancante è "vero".

Esempio 02: Identificazione dei valori mancanti nell'intero telaio di dati utilizzando il metodo Pandas Isna

In questo esempio, rileveremo il termine mancante come abbiamo fatto nell'esempio precedente, ma qui lo implementeremo nell'intero telaio di dati. Ciò significa che rileveremo i termini mancanti nell'intero "DF". Il "DF" creato ha i dati di vendita, che consistono dal nome, dal nome del paese, dalle vendite e dalle spese. La riga di codice successiva spiega i dati di vendita, che è il nome del "DF" dato; Possiamo sceglierlo da soli, quale nome daremo al tuo "df" e poi c'è il "dot" isna () che si comporta, il metodo e stampa l'output come vero e falso rilevare termini mancanti nell'intero "DF ".

L'output mostra che l'intero telaio di dati è etichettato come "vero" e "falso", che mostra i valori mancanti, come le vendite (3) sono etichettate come "vere" e le spese (2) sono anche scritte come "vere", il che significa Quelli sono l'unità del frame dati in cui mancano i dati.

Esempio 03

Ora, in questo esempio, faremo il conteggio dei valori nel telaio di dati con il metodo Panda ISNA, il risultato di questo metodo sarebbe possibile usando due metodi di Panda, il metodo Panda "Isna" e Panda "Sum". Come sappiamo, isna () viene utilizzato per identificare il valore mancante e la somma che utilizzeremo è per il conteggio di quei valori mancanti nel "DF". Questo metodo è molto utile, non usato molto spesso, ma poiché il trucco viene riconosciuto, l'utilizzo sta aumentando in quanto rende l'output del processo così chiaramente che non è necessario contare in ogni riga o ogni colonna, in particolare, il conteggio delle uscite rende più semplice capire il numero dei termini mancanti nel "DF".

Questo è un metodo di sintassi difficile per mettere due metodi diversi all'interno della stessa parentesi ma con linee diverse. Questa è una tecnica molto utile ma potente per i dati wrangled e l'analisi eseguita sui dati. Possiamo definirlo un metodo complesso, che semplifica il debug e la lettura dei dati.

Qui, l'output visualizza la versione di conteggio dei valori mancanti, il che chiarisce quale colonna e quanti numeri mancano. Le vendite e la colonna delle spese hanno entrambi valori mancanti "2". Mentre il nome e il paese non hanno termini mancanti.

Conclusione

In questo articolo, abbiamo imparato tutti i modi in cui funziona il Panda isna (). Nel "DF", è il modo rapido per controllare i valori mancanti. Abbiamo eseguito gli esempi per una migliore comprensione dell'intero telaio di dati del metodo di Panda Isna, come dal desiderio del metodo di Panda della colonna selezionata e del metodo di conteggio di Panda Isna. Tutti questi metodi, su vasta scala, funzionano per il miglioramento e la facilità degli utenti in quanto sarà difficile rilevare un valore mancante in milioni di set di dati. Quindi, questo approccio sarà un salvavita per tutti coloro che lavorano con un'enorme quantità di dati per qualsiasi processo di sviluppo.