“La funzionalità di calcolo della finestra a rotazione è fornita dal Pandas“ DataFrame.rolling ().Metodo medio () ". La media di un numero specificato di intervalli precedenti in una serie temporale è nota come media rotolante."
La seguente sintassi può essere utilizzata per determinare la media di rotolamento per colonne singole o più in un frame di dati Panda:
Esploreremo diverse tecniche per utilizzare questo metodo in questa lezione.
Esempio 1
In questa illustrazione, utilizzeremo i panda "df.rolling ().Metodo medio () "per calcolare la media di rotolamento di una singola colonna.
Dobbiamo prima afferrare i requisiti per la compilazione del codice. Abbiamo bisogno di alcuni software che ci forniscano un ambiente supportato da Python per compilare il nostro script Python. Abbiamo installato lo strumento "Spyder" nel nostro sistema. Dopo aver lanciato lo strumento, possiamo accedere all'interfaccia.
A partire dal programma, inizialmente dobbiamo caricare la libreria essenziale. Il metodo "Rolling ()" su cui si basa il nostro articolo è la funzione Panda. Quindi, per utilizzare questo metodo nel nostro programma, dobbiamo importare la libreria "Panda" e creare "PD" come alias per "Panda".
Dopo che il prerequisito è stato raggiunto, dobbiamo generare un telaio di dati Panda utilizzando il "PD.DataFrame () ”Modulo fornito da Pandas Toolkit. Il "PD.Il metodo DataFrame () "è invocato con 4 colonne che abbiamo specificato come" estate "," inverno "," autunno "e" primavera ". Ogni colonna memorizza 8 valori. I valori identificati per la colonna "estate" sono "200", "130", "280", "100", "270", "360", "120" e "311". La colonna "Winter" ha questi valori "12", "34", "54", "67", "98", "45", "78" e "43". La terza colonna, "Autunno", ha valori come "12", "13", "42", "32", "71", "61", "77" e "89". Per la colonna "Spring", i valori sono "10", "29", "78", "44", "76", "55", "32" e "22".
Il "PD.DataFrame () ”, quando invocato, costruisce un frame dati utilizzando questi valori forniti. Ha quindi bisogno di uno spazio di archiviazione in cui può mettere questo frame dati per un uso successivo. Il recente telaio è ora accessibile menzionando l'oggetto "stagione". Il prossimo requisito è mostrare questo frame dati sullo schermo in modo da poterlo vedere correttamente. Per questo, abbiamo impiegato il metodo "Print ()" di Python. Tra le sue parentesi, forniamo l'input che deve essere visualizzato. Qui abbiamo fornito l'oggetto "stagione" come input al metodo "print ()" per visualizzare il suo contenuto.
Per eseguire lo script sopra menzionato, dobbiamo colpire l'opzione "Esegui file"; In alternativa, puoi anche premere i tasti "Shift+Enter" per eseguire il codice. Questo ci dà un frame dati con 4 colonne e 8 righe. L'elenco degli indici inizia da "0" per impostazione predefinita e termina a "7".
Ora eserciteremo il metodo Pandas "Rolling ()" per calcolare il rotolamento stimato di una singola colonna nel frame dati fornito. Impariamo come ottenere questo.
Abbiamo invocato il "DF.Rolling () "Metodo. Il nome del telaio dati "stagione" con il ".il metodo rolling () ”è scritto. Dato che vogliamo ottenere la finestra di rotolamento per il calcolo della media di rotolamento di una singola colonna, dobbiamo specificare il nome della colonna con il nome del telaio dati. La colonna che abbiamo scelto qui è la colonna "estate" dal frame dati "stagione". Tra le staffe rotonde del metodo "rolling ()", abbiamo definito il valore "3". Significa che vogliamo calcolare il rotolamento della colonna "estate".
IL ".La funzione media () "calcolerà la media per il rotolamento di 3 giorni della" estate ". Vogliamo conservare questa media di rotolamento stimata della colonna "estate" in una nuova colonna. Quindi, per la creazione di una nuova colonna, abbiamo scritto il nome del Frame Data, l'operatore dei sottoscritti e quindi il nuovo nome di colonna come "Summer_Rolling". L'abbiamo assegnato il risultato di "stagione [" estate "].rotolando (3).funzione media () ". Quindi la media rotolante per 3 giorni dei valori della colonna "estate" verrà archiviato nella colonna "Summer_rolling". Infine, stampare il frame dati invocando il metodo "print ()".
Nell'istantanea ceduta, possiamo vedere che le prime due voci che otteniamo sono valori nulli. Questo perché non possiamo stimare la media di rotolamento in quanto può essere calcolata solo quando abbiamo una finestra di 3 giorni, ma per i primi due record, non abbiamo valori precedenti per completare le finestre specificate; Quindi i valori NAN vengono restituiti. Nel 3Rd riga, otteniamo un valore “203.333333 ”, che è il rotolamento medio per i 3 giorni.
Esempio n. 2
Abbiamo imparato a trovare la media di una colonna in un frame di dati Panda. La media di rotolamento può anche essere calcolata per più colonne. Per più colonne, dobbiamo invocare il metodo medio di rotazione separatamente per ogni colonna.
Eserveremo il metodo di rotolamento sul telaio di dati precedentemente generato per stimare la media di rotolamento di più colonne. Il "df.rolling ().il metodo medio () ”viene invocato. Abbiamo invocato questo metodo due volte perché vogliamo calcolare la media di rotolamento per due colonne. Il primo "rolling ().Il metodo medio () "è chiamato dataframe e nome della colonna come" stagionali ["estate"] "e il valore per i giorni di rotazione è specificato" 4 ".
Per archiviare la media di rotolamento calcolata in un'altra colonna, abbiamo inizializzato una colonna "Summer_Rolling". Ciò significa che vogliamo calcolare la media rotolante per una finestra di 4 giorni della colonna "estate" e archiviare il risultato nella colonna "Summer_rolling". Quindi abbiamo impiegato il 2nd “Df.rolling ().Metodo medio () ". La colonna che abbiamo selezionato qui è "Autunno" e la finestra di rotazione è specificata come "4". Per salvare i calcoli, abbiamo creato una colonna "Autumn_Rolling" nella "stagione" esistente del frame dati. Il metodo "Print ()" visualizzerà l'output finale sulla console Python.
Nella schermata di output, si può esaminare che 2 nuove colonne sono state aggiunte al frame dati. Le colonne "Summer_Rolling" e "Autumn_Rolling" contengono una media di rotolamento stimata per le colonne "estate" e "autunno", rispettivamente. I primi 3 valori in entrambe le colonne sono NAN perché non hanno abbastanza voci per completare la finestra di 4 giorni per calcolare la media di rotolamento. Dal 4th Ingresso, ottiene il suo primo valore medio rolling.
Esempio n. 3
La media di rotolamento di tutte le colonne nel frame dati viene calcolata utilizzando i panda “DF.rolling ().Metodo medio () "come passaggio finale.
Per il calcolo della media di rotolamento di tutte le colonne, non abbiamo bisogno di menzionare in particolare il nome di colonna. Abbiamo invocato il "DF.rolling ().funzione media () "semplicemente fornendo il nome del telaio dati come" stagione "e il valore per la finestra di rotolamento come" 5 ". Per preservare il risultato, abbiamo creato un "risultato" variabile. Il "rolling ().Il metodo medio () "calcolerà la media di rotolamento della" stagione "di dati di dati prendendo una finestra di 5 giorni e memorizzando il risultato nella copia del telaio dati utilizzando la variabile" risultato ". Abbiamo utilizzato il metodo "print ()" di Python per esibire il nuovo frame dati.
Questo ci dà il telaio di dati con una media di rotolamento stimata per una finestra di 5 giorni.
Conclusione
Calcolo della media di rotolamento per la finestra specificata in un telaio di dati è un approccio semplice. Abbiamo utilizzato i panda “df.rolling ().Metodo medio () "per stimare la media del rotolamento in questo tutorial. Sono state discusse tre diverse strategie per trovare la media di rotolamento in un telaio di dati. La prima illustrazione si basa sul calcolo della media di rotolamento di una singola colonna, il 2nd Esempio fornisce l'idea di calcolare la media di rotolamento per più colonne e l'ultima istanza è passata brevemente a trovare la media di rotolamento di tutte le colonne presenti nel frame dati. Tutte le tecniche sono state praticamente implementate sullo strumento Spyder.