Pandas interpolare

Pandas interpolare
L'interpolazione è un modo per stimare i dati sconosciuti tra i due valori noti dei dati. Il metodo "interpolato" di Pandas viene utilizzato per riempire le qualità mancanti nel frame dati. Non è la versione migliore della ricerca dei dati mancanti o sconosciuti in quanto a volte può influire sull'accuratezza dei dati e può avere errori a breve termine. Ma esiste un "polinomio", che è un tipo di panda interpolato, che viene usato in molti modi. Il Python di Pandas è un linguaggio molto utile per le informazioni relative ai dati sui dati. Utilizzeremo lo strumento "Spyder" per l'implementazione dei codici, che è un software amichevole basato sulla lingua Python. L'interpolazione di Panda può essere eseguita in diversi metodi, dobbiamo sapere quale lavoro dobbiamo fare. Con tale conoscenza, implementeremo il metodo di conseguenza, di cui discuteremo con esempi e spiegazioni complete.

Tipi di panda interpola

Di seguito sono riportati i tre modi in cui l'interpolazione di Panda può essere eseguita:

  • Interpolazione di panda lineari (in avanti, all'indietro, entrambe, colonna singola, asse, imbottitura e polinomio).
  • Interpolazione polinomiale di panda.
  • Interpolazione dei panda attraverso l'imbottitura.

Ci sono alcuni parametri che sono i seguenti:

limit_direction

"Forward", "all'indietro", "entrambi"

La direzione limite è per impostazione predefinita, impostata come "in avanti", il che significa che se non abbiamo specificato il metodo, andrà con il metodo di interpolazione in avanti.

Creazione del telaio dati per l'implementazione del metodo di Pandas interpolato

Innanzitutto, ci concentreremo sulla creazione di dati "DF". Abbiamo importato la libreria Pandas come "PD", che è una libreria open source per manipolare i dati. Quindi, inizieremo a creare il "DF" utilizzando il software "Spyder", in cui abbiamo i dati come in quattro variabili denominate, "W", "X", "Y" e "Z". Tutti hanno valori separati assegnati come "W" che ha i valori "18", "5", "9", "3", "Nessuno". "X" ha i valori "Nessuno", "89", "4", "8" e "Nessuno". "Y" ha i valori "30", "Nessuno", "7", "9", "12". Allo stesso modo, "Z" con i valori "11", "Nessuno", "66", "5" e "8".

Qui, nel codice sopra, viene creato il frame dati che può essere scritto come "DF". Nella prima riga di codice, la libreria Pandas viene importata come "PD". Quindi, viene creato il frame dati in cui abbiamo assegnato le variabili "W", "X", "Y" e "Z", dati ciascuno di loro cinque valori assegnati. Il "nan" nel codice sta per "non un numero".

L'output mostra i valori di dati dati come abbiamo assegnato nel codice. Ci sono i numeri di serie, quindi le variabili, che scendono i valori come assegnato.

Esempio 01: metodo di interpolazione lineare in avanti

Nell'interpolazione lineare, il metodo interpolato () funziona come punti vicino a sinistra e destra, dopo che la stima è stata eseguita. Si presume che questi punti si trovino sul punto di incontro sconosciuto. Come accennato in precedenza nei parametri, se non specifichiamo il parametro, per impostazione predefinita esegue come metodo interpolato in avanti. Il codice seguente è un chiaro esempio del valore predefinito. Qui, abbiamo preso le variabili come "s", "t", "u" e "v" con i loro valori assegnati per il frame dati. Tuttavia, se vogliamo specificare da solo, possiamo andare con lo stesso codice. Basta aggiungere, dopo l'ultima riga di codice, DF. interpolato () può essere scritto con la direzione limite che lo specifica come "in avanti" in modo che sembrerà: "DF.interpolato (limit_direction = 'forward') ".

L'output di seguito mostra l'interpolazione in avanti del codice sopra. Per quanto riguarda i dettagli forniti, il valore predefinito funziona come "interpolazione in avanti", motivo per cui T (0) mostra il valore nullo.

Esempio 02: metodo di interpolazione lineare posteriore

Se vogliamo fare l'interpolazione all'indietro lineare, possiamo farlo allo stesso modo, come abbiamo fatto sopra nell'interpolazione in avanti. Dobbiamo dare la direzione limite come "all'indietro", questa volta, come mostrato nel codice. Qui, le variabili su cui lavoreremo per il DF sono: "D", "Q", "B" e "J" con i loro valori assegnati.

L'output del metodo di interpolazione all'indietro (), il Q (4) è nullo a causa del metodo di interpolazione all'indietro eseguito.

Esempio 03: Entrambi i metodi di interpolazione dei panda lineari

Ora qui, cosa succede se vogliamo fare l'attaccante e l'indietro entrambi sullo stesso codice? È possibile e possiamo farlo semplicemente usando il metodo di interpolazione "entrambi". Qui, per "DF", abbiamo le variabili "P", "U", "O" e "M" con i loro valori corrispondenti assegnati.

Il seguente output è costituito da entrambi, il metodo di interpolazione in avanti e indietro.

Esempio 04: metodo di interpolazione dei panda a colonna singola

Possiamo anche applicare il metodo interpolato su una singola colonna come desiderato. Per la creazione di dati dati, abbiamo usato le variabili "N", "M", "O" e "P" con i valori assegnati. La colonna "N" è selezionata dal "df" per visualizzare con il metodo interpolato ().

L'output qui visualizza l'interpolazione di Pandas a colonna singola.

Esempio 05: Metodo di interpolazione di Axis Panda

A volte, secondo la necessità, vogliamo interpolare per colonna e talvolta per righe in modo che l'attributo "asse" funzioni al meglio. Questa funzione è impostata predefinita come colonna uno mentre, se vogliamo che le righe interpolano, dobbiamo seguire esplicitamente l'asse come 1. La "L", "F", "I" e "T" sono variabili assegnate in questo "df" con i loro valori di conseguenza.

L'uscita dell'asse interpolato ():

Esempio 06: Metodo di interpolazione dei Panda polinomiali

In matematica, un polinomio è un'espressione che consiste di indeterminati, che sono anche chiamati variabili e coefficienti che eseguono le operazioni aritmetiche. Nell'interpolazione, ci sono alcune possibilità di errori che possono verificarsi qua e là a volte. Mentre l'interpolazione polinomiale è la migliore pratica che viene fatta sui dati della serie. I dati acquisiti qui sono in serie: "4", "5", "6", "NP. Nan "," 8 "e" 9 "seguono il metodo interpolato del polinomio. Np.NAN è definito come NP dalla Biblioteca Panda e "NAN" è dichiarato "non un numero".

Il risultato visualizza il metodo di interpolato Panda polinomiale:

Esempio 07: interpolazione di Panda con imbottitura

L'interpolazione del panda con imbottitura è definita come "scrivere o copiare un valore rispettivamente prima di un punto mancante". In questo metodo, le specifiche del limite devono essere affrontate. Il limite dovrebbe essere il numero massimo di "NAN" in quanto riempirà continuamente. Questo metodo funziona solo nella direzione in avanti e anche nei dati della serie. Il "DF" per questo metodo è nella serie come "2", "3", "NP. nan "," 5 "," 6 "," 7 "e" 8 "segue il metodo" pad "per l'imbottitura.

I risultati di output mostrano l'interpolazione di Panda attraverso "imbottitura".

Conclusione

Il metodo di interpolato di Panda è un metodo molto conveniente per riempire il "NAN" o i valori mancanti. In questo articolo, abbiamo imparato vari tipi di interpolazione nel Frame di dati di Pandas, che sia in avanti, all'indietro o entrambi, con asse, polinomi e infine il metodo di imbottitura. Tutti vengono utilizzati per uno scopo specifico e la facilità degli utenti che lavorano su enormi quantità di dati.