Pandas Extract Year from DateTime

Pandas Extract Year from DateTime
"Pandas" è un forte pacchetto Python che viene utilizzato per l'elevata efficienza e la velocità di calcolo. Una colonna DateTime in "Pandas" fornisce una vasta fonte di dati di serie temporali che potrebbero essere utili. Ad esempio, potresti visualizzare i tuoi dati su base annuale o mensile. Imparare come estrarre rapidamente tali informazioni può essere molto utile quando si tratta di frame di dati che contengono colonne DateTime. In questo articolo, esploreremo come utilizzare i panda per recuperare i dati dell'anno dalla colonna DataFrame DateTime.

Panda Extract Year from DateTime:

Le colonne DateTime di "Pandas" contengono attributi come anno, mese, giorno e così via. Per recuperare l'anno dalla colonna DateTime di un frame di dati, fai semplicemente riferimento al suo attributo "anno". "Pandas" ha una varietà di metodi semplici per estrarre componenti da un oggetto DateTime, di cui implementeremo due in questo tutorial. La sintassi per questi metodi è riportata di seguito:

Pd.DateTimeIndex ().anno

df.dt.anno

Vedremo ora l'implementazione pratica di questi metodi Python.

Esempio n. 1: utilizzando il "PD.DateTimeIndex ().Metodo anno "per estrarre anni dalla colonna DataFrame DateTime

In questa illustrazione, useremo il primo metodo sopra menzionato, "PD.DateTimeIndex ().anno per estrarre anni dal frame dei dati.

Per implementare praticamente questo metodo nel programma Python, abbiamo utilizzato lo strumento "Spyder". Abbiamo iniziato a scrivere lo script nel file Python. La prima e fondamentale cosa qui è attivare il toolkit di Pandas. A Python viene chiesto di caricare la libreria Pandas nel nostro attuale ambiente di lavoro mediante la sezione Panda import del codice. La sezione "PD" del codice indica a Python di assegnare a Panda l'alias di "PD". È così che possiamo accedere a tutte le caratteristiche dei panda. Abbiamo quindi creato un frame di dati.

Il frame di dati viene generato utilizzando il metodo Pandas “PD.DataFrame () ". Abbiamo invocato questo metodo e inizializzato con quattro colonne: "Titolo", "Lezioni", "Grado" e "Start_Date". La prima colonna, "Title" memorizza i titoli di diversi linguaggi di programmazione. Questi sono "C ++", "Python", "Java" e "R". La seconda colonna, abbiamo creato nella cornice dei dati è "lezioni" e detiene il numero di lezioni per ciascun corso come "30", "26", "35" e "20". La colonna "Grado" racconta il livello a cui vengono offerti questi corsi, io.e., "12", '10 "," 14 "e" 16 ". L'ultima colonna è i dati fondamentali di questo frame di dati perché memorizza i valori DateTime su cui si basa questo tutorial. Questa colonna ha valori "02-02-2022", "09-01-2023", "07-29-2024" e "11-24-2025" come date iniziali di ciascun corso.

La lunghezza della colonna che abbiamo preso per ogni colonna è quattro. Abbiamo bisogno di un oggetto Frame di dati per archiviare il contenuto del frame di dati. Quindi abbiamo creato un "estratto" dell'oggetto di dati di dati e dato il risultato che verrebbe raggiunto chiamando il "PD.Metodo DataFrame () ". Il metodo più utilizzato di Python per visualizzare l'output, "Print ()" è invocato qui per mostrare il contenuto dell'oggetto frame di dati "estratto".


Quando eseguiamo il programma sopra menzionato, otteniamo un frame dati visualizzato sulla console che ha quattro colonne. Qui puoi vedere che la colonna "Start_Date" sta archiviando i valori DateTime.


Ora dobbiamo fare un passo avanti per iniziare con il nostro compito principale per il quale abbiamo generato il frame di dati. Estrarremo l'anno dalla colonna DateTime del nostro frame di dati utilizzando il "PD. DateTimeIndex ().Metodo anno ”qui.

Abbiamo invocato il "PD.DateTimeIndex ().Metodo anno ”subito dopo aver creato e stampato il frame di dati. ".anno ”specifica che stiamo usando questo metodo per estrarre l'anno dalla colonna particolare del DateTime. Può avere anche altri attributi, io.e., ".mese "per estrarre i mesi,".settimana "per recuperare le settimane,".giorno "per ottenere i giorni e molti altri. Abbiamo chiamato la funzione e tra le sue parentesi, abbiamo fornito il nome del nome di dati con il nome della colonna su cui viene applicata la funzione per estrarre gli anni da esso.

Il nome del frame di dati "estratto" viene fornito con la colonna "start_date" con valori DateTime. Quando questa funzione viene invocata, entrerà nel frame di dati "estratto" e, dalla colonna "start_date", recupera gli anni. Ora, per archiviare questi anni, abbiamo creato una nuova colonna "Anno" nel nostro frame di dati "estratto". Quindi gli anni estratti chiamando il "PD.DateTimeIndex ().anno "sarà memorizzato nella colonna" anno ". Abbiamo quindi utilizzato il metodo "Print ()" per visualizzare il frame di dati aggiornato.


Qui abbiamo il nostro frame di dati risultante. Possiamo vedere che questo frame dati ha una nuova colonna "anno" che contiene esplicitamente gli anni, estratta dalla colonna "start_date" corrispondente a ciascun valore che contiene.

Esempio n. 2: utilizzando il "DF.dt.Metodo anno "per estrarre anni dalla colonna DateTime del frame dati

Questa dimostrazione spiegherà come estrarre l'anno da una colonna datetime utilizzando i panda "DF.dt.Metodo ". Vediamo come funziona.

Abbiamo appena aperto lo strumento "Spyder" e abbiamo iniziato a scrivere il codice. Abbiamo caricato la libreria Pandas perché il metodo che vogliamo utilizzare qui è una funzione Panda e possiamo usarla solo se abbiamo questa libreria caricata nel nostro file Python corrente. Abbiamo quindi creato un frame di dati utilizzando il "PD.Metodo DataFrame () ". Abbiamo invocato la funzione e creato tre colonne, che sono "nome", "nascita_date" e "età". La colonna "Nome" memorizza i nomi di alcune persone, che sono "Parker", "Jack", "Leo" e "Rabecca". Il "nascita_date" sta memorizzando la data di nascita di queste persone come "02-02-1989", "09-01-1996", "07-29-1981" e "11-24-2001".

La colonna "Age" detiene rispettivamente l'età attuale come "32", "26", "40" e "21". Abbiamo creato un "biodata" dell'oggetto di dati di dati per archiviare l'output dal "PD.Funzione DataFrame () ". Il metodo "Print ()" viene quindi invocato per visualizzare la cornice di dati risultante memorizzata nell'oggetto "biodata".


Quando eseguiamo questo frammento di codice, otteniamo una cornice di dati con tre colonne fornite, che può essere vista nell'istantanea collegata di seguito.


Ora utilizzeremo questo frame di dati per estrarre l'anno dalla sua colonna DateTime utilizzando il "DF.dt.Metodo ". Qui la colonna "Birth_date" contiene le date con l'anno, quindi dobbiamo applicare la funzione a questa particolare colonna per estrarre l'anno. Per utilizzare questa colonna, dobbiamo prima convertirla in formato DateTime. Perché la funzione che stiamo usando qui contiene un attributo "DT", che è per DateTime. Quindi eseguirà solo se la colonna specificata viene convertita in DateTime. Per fare ciò, abbiamo utilizzato il metodo Pandas "To_datetime ()" e fornito il nome del frame di dati con il nome della colonna tra le sue parentesi.

Ora il tipo di dati della colonna "Birth_date" è stato modificato in DateTime. Abbiamo quindi chiamato il "DF.dt.funzione anno ". Abbiamo menzionato il nome del frame dati con il nome della colonna e ".dt.Anno di estensione. Per archiviare questo anno di valore estratto nella cornice dei dati, abbiamo creato una nuova colonna "anno" nel "biodata". Infine, abbiamo visualizzato il frame dati utilizzando la funzione "print ()".


Questo produce il seguente risultato.

Conclusione:

L'estrazione di un anno da una colonna DateTime dalla cornice dei dati Panda è un esercizio utile. I panda ci insegnano con alcune tecniche molto utili e pratiche per raggiungere il risultato desiderato. In questo tutorial, ti abbiamo introdotto due tecniche di panda per estrarre l'anno dalla colonna DateTime in un frame di dati. Abbiamo elaborato ogni dettaglio nell'implementazione pratica dei codici di esempio. Abbiamo descritto e spiegato tutto ciò che abbiamo usato negli esempi in modo da non affrontare alcuna difficoltà durante la pratica di questi metodi per imparare i panda.