Pandas bfill

Pandas bfill
“In Pandas DataFrame, i valori mancanti del set di dati vengono riempiti all'indietro utilizzando il frame dati.funzione bfill (). Nel frame dati Pandas, se esistono valori mancanti, riempirà i valori NAN del nostro frame dati. Un array unidimensionale con etichette degli assi è la serie Pandas. Le etichette devono essere un tipo hashable; Non devono essere distintivi. L'oggetto ha una vasta gamma di metodi per l'esecuzione delle operazioni che richiedono l'indice e supporta l'indicizzazione sia basata sull'etichetta che. La tecnica di riempimento all'indietro viene utilizzata per popolare i valori NAN nell'oggetto serie con l'aiuto della serie.funzione bfill () nei panda."

Sintassi per l'utilizzo del metodo bfill ()?

La sintassi per la funzione bfill () per il frame dati è la seguente.

Sintassi:


La sintassi per l'utilizzo della funzione bfill () in serie è più uguale con il frame dati. La differenza è che verrà utilizzato il nome della serie, seguito dal metodo BFIFF ().

Sintassi:

Parametri

Asse: 0 o indice

1 e le colonne non sono supportate. Asse = 1 in serie

A posto: booleano, falso per impostazione predefinita.

Apportare modifiche allo stesso oggetto.

Limite: int, nessuno per impostazione predefinita

Il numero massimo di valori NAN successivi da riempire avanti o indietro se viene fornito il metodo. In altre parole, il divario sarà colmato parzialmente se ci sono più di questi NAN consecutivi. Questa è la più alta quantità di voci lungo l'asse completo in cui le voci null o mancanti verranno riempite se il metodo non è fornito. Ha 0 o più se nessuno.

Ritorna: DataFrame o serie. Voci NA piene di dati o serie.

Come utilizzare il metodo Pandas Bfill ()?

Mostreremo come utilizzare la funzione BFIFF () nei frame di dati Pandas e nelle serie negli esempi che seguono.

Esempio n. 1: compilare i valori mancanti del Frame dati utilizzando la funzione BFIFF ()

Come già sappiamo, per riempire i valori NA in un frame dati, il telaio dati.Viene utilizzato il metodo bfill (). Nella direzione inversa, riempie i valori NAN che esistono nel frame dati.

Innanzitutto, creeremo il frame dati dopo l'importazione dei moduli Pandas. Per creare il frame dati in panda, useremo il PD.Funzione dataframe (). I seguenti parametri saranno passati nel PD.Funzione DataFrame () per creare il dati dati richiesto.


Come si può vedere, abbiamo creato 3 colonne x, y e z. In ciascuna delle nostre colonne DF DataFrame sono presenti valori mancanti. Per visualizzare il frame dati, passeremo il frame dati nella funzione print () come argomento.


Ora applicheremo il metodo bfill () per popolare le celle NA nel nostro telaio di dati. Il valore nelle celle NA correnti è popolato dal valore corrispondente nella riga seguente quando Axis = "righe". La riga seguente non verrà compilata se la riga seguente ha anche un valore NA.

Come puoi vedere, nel 4th riga, il 1st la cellula è ancora nan. Questo perché il valore corrispondente nella riga successiva 5 è anche nan. Il 5th Il valore è NAN perché non esiste un valore corrispondente nella riga inferiore da cui la funzione Bfill () può popolare la cella Na.

Cosa succede se usiamo Axis = "Colonne"? La funzione BFIFF () riempirà le celle null con i valori corrispondenti dalla colonna successiva (la colonna destra). Come nel caso di axis = "righe", la colonna seguente non verrà compilata se la colonna successiva ha anche un valore NA.


Nel frame dati sopra, dopo aver utilizzato la funzione bfill (), tutti i valori che hanno un valore corrispondente nella colonna successiva sono stati modificati.

Esempio n. 2: compilare i valori mancanti del frame dati booleano utilizzando la funzione BFIFF ()

In questo esempio, creeremo un frame dati con dati booleani e valori NAN per verificare come la funzione BFIFF () funzionerà su un frame dati booleano.


Abbiamo creato il frame dati con i valori booleani. Ora, la funzione bfill () verrà utilizzata per riempire i valori NA.


Le celle NA sono riempite in cui esistono i valori corrispondenti nella riga successiva del frame dati e non sono valori null. Possiamo anche specificare axis = "colonne" come abbiamo fatto nell'esempio n. 1 per riempire la cella vuota per il valore nella colonna corrispondente della cella NA.

Esempio n. 3: riempire i valori mancanti nell'oggetto serie usando la funzione bfill ()

Abbiamo visto come funziona il BFIFF () nei gesti di dati. Ora, useremo la funzione BFIFF () in un oggetto in serie con uno o più valori null. Innanzitutto, creeremo una serie di una persona e specificheremo il nome dell'indice di ciascun valore nella serie.


Useremo la funzione print () per dimostrare le nostre serie "s".


Come si può vedere, c'è una cella di Na all'indice D. Per riempire quella cella di naio; Utilizzeremo il metodo bfill () sulla nostra serie.


Come puoi vedere, la cella Na è riempita dal valore corrispondente successivo nella serie. Poiché c'è un solo asse singolo nella serie, riempirà sempre i valori mancanti del valore successivo alla cella mancante.

Esempio # 4: compilare i valori mancanti nell'oggetto serie con valori numerici usando la funzione bfill ()

Dopo aver importato i moduli Pandas, ora, utilizzeremo la funzione Bfill () su un oggetto Serie con valori numerici e con uno o più valori null. Innanzitutto, creeremo una serie numerica e specificheremo l'indice per ciascun valore nella serie.


Abbiamo creato la serie richiesta e specificato l'indice di ciascun valore utilizzando il PD.funzione date_range (). Per ottenere un DateTimeIndex con una frequenza fissa, viene utilizzato il metodo Date_Range (). Mentre freq = "m" indica che la serie deve essere creata in base al mese. Visualizziamo la nostra serie usando la funzione print ().


Come puoi vedere, ci sono più valori NA nella nostra serie. Ora riempiremo queste celle null usando la funzione bfill ().


La tecnica di riempimento all'indietro viene utilizzata nella funzione bfill () per riempire le celle null con il valore adiacente successivo nella serie.

Esempio # 5: specificare il limite della funzione bfill () nell'oggetto serie

In questo esempio, creeremo una serie con più di un valore consecutivo per mostrarti come funziona il parametro limite nella funzione BFIFF ().


Utilizziamo la funzione BFIFF () sulla serie con il parametro limite.


La serie nell'esempio sopra menzionato ha due e tre valori mancanti consecutivi, ma poiché il limite è impostato su 2, la "serie.Il metodo bfill () ”ha riempito solo due celle null consecutive; Il terzo è rimasto nullo. Se impostiamo il limite a 3, riempirà tre celle null consecutive nella serie.

Specifichiamo inoltre l'argomento "Inplace = true" per la serie.funzione bfill (). La serie.Il metodo bfill () popola i valori mancanti senza generare un nuovo oggetto fintanto che questa opzione è vera e non restituisce nessuno.


Come puoi vedere, ha riempito tutte le celle NA della nostra serie.

Conclusione

Abbiamo imparato come usare la serie Python Panda ".funzione bfill () "in questo tutorial. Abbiamo studiato la sintassi e i parametri della funzione bfill () prima di utilizzarla su una serie e frame dati costituiti da valori NAN per comprendere come il frame dati.bfill () e serie.BFIFF () Riempimento delle funzioni I valori null esistenti rispettivamente nel frame dati e nelle serie Pandas.