Serie Pandas a CSV

Serie Pandas a CSV

La serie.TO_CSV () "Metodo in Panda emette l'oggetto serie specificato in una notazione valori separati da virgola (CSV). Questa funzione prende semplicemente i valori da una serie e modifica il loro formato aggiungendo virgole per la separazione degli indici e i valori della colonna.

Per utilizzare questa funzione, dobbiamo utilizzare la seguente sintassi:

Questo articolo ti fornirà due diverse tecniche per imparare i modi per utilizzare questo metodo in un programma Python.

Esempio n. 1: utilizzando la serie.Metodo TO_CSV () per convertire una serie con DateTimeIndex in valori separati da virgola

Per modificare una serie in un formato CSV, impiegheremo la "serie.funzione to_csv () ". Questa illustrazione genererà una serie con un DateTimeIndex e quindi la convertirà in un formato di valori separati da virgola.

Per mettere in funzione questo metodo, dobbiamo avere uno strumento che supporta la programmazione di Python. Lo strumento "Spyder" è optato per la compilazione dei codici. Per scrivere lo script su di esso, abbiamo lanciato per la prima volta lo strumento installato nel nostro sistema. Il programma Python ha bisogno di una biblioteca per esercitare i suoi metodi per raggiungere il risultato richiesto. La biblioteca che abbiamo caricato qui è i "panda". Nella stessa riga di codice, l'alias di questa libreria è identificato come "PD". Quindi, ovunque nel programma, dobbiamo scrivere "panda" per accedere a una funzione. Scriveremmo invece "PD".

Il primo passo per iniziare con il codice è generare una serie Pandas. Dobbiamo scrivere "PD" per utilizzare il metodo di creazione della serie da Pandas. Il "PD.La funzione serie () ”è chiamata per costruire una serie con i valori specificati. I valori che abbiamo fornito per la serie sono "Istanbul", "Izmir", "Ankara", "Ankara", "Antalya", "Konya" e "Bursa". Se vuoi dare un nome a questo array di valori, puoi farlo usando il parametro "Nome". Qui, abbiamo chiamato questa serie di valori "città" in quanto tiene i nomi di 6 città. Per archiviare questa serie, è stato creato un oggetto in serie "Turchia".

Per creare un DateTimeIndex, abbiamo invocato il "PD.Metodo Date_Range () ". Tra le parentesi di questa funzione, abbiamo superato 4 argomenti che sono: "avvia", "freq", "periodi" e "tz".

L'argomento "Start" richiede una data e un orario per iniziare a generare un intervallo di data da esso. Qui, abbiamo specificato la data e l'ora di inizio come "2022-03-02 02:30". Il parametro "FREQ" sta classificando la frequenza per l'intervallo di date. Quindi, gli abbiamo fornito il valore "D". Ora creerà un intervallo di date sulla frequenza giornaliera. L'argomento "Periodo" è impostato su "6", il che significa che genererà un intervallo di date per 6 giorni. L'ultimo parametro è "TZ" che specifica il fuso orario per l'area specificata. Abbiamo specificato il fuso orario per "Asia/Istanbul".

Per archiviare questo intervallo di date, abbiamo creato una variabile variabile "datetime". Per impostare DateTimeIndex, abbiamo impiegato la "serie.Proprietà indice ". Il nome della serie "Turchia" è fornito con il ".Proprietà indice ”e assegnato l'intervallo di tempo della data memorizzata nella variabile“ DateTime ”. Pertanto, la proprietà "indice" prenderà i valori dalla variabile "datetime" e li renderà l'elenco indice della serie "Turchia". Infine, per visualizzare la serie di output, abbiamo impiegato il metodo "Print ()" e abbiamo superato la serie "Turchia" come input per visualizzare il suo contenuto.

Abbiamo appena premuto l'opzione "Esegui file" per eseguire lo script. Di conseguenza, possiamo vedere una serie con DateTimeIndex a partire da "2022-03-02 02: 30: 00+03: 00" e terminare a "2022-03-07 02: 30: 00+03: 00" Creazione di un periodo di 6 giorni. Sotto la serie "Freq: D", il nome dell'elenco di array "Cities" e DTYpe "Object" sono anche menzionati.

Ora impareremo a convertire questa serie che abbiamo appena visto nell'istantanea sopra in un formato CSV. Per modificare la serie in valori separati da virgola, abbiamo un metodo fornito dal modulo Panda che è “serie.to_csv () ". Questo metodo prende i valori della serie fornita e aggiunge virgole tra i valori della colonna.

La serie.la funzione to_csv () "è chiamata. Il nome della serie che vogliamo convertire è menzionato con il metodo come "Turchia.to_csv () ". Per preservare i valori separati dalla virgo.

Ecco la nostra serie in formato CSV. Possiamo vedere nell'istantanea che l'indice e i valori della serie sono stati separati usando le virgole in essi.

Esempio n. 2: utilizzando la serie.Metodo to_csv () per convertire una serie con valori NAN in valori separati da virgola

La seconda tecnica per esercitare la "serie.TO_CSV () "Il metodo è applicare questo metodo per convertire una serie che tiene alcune voci nulla in un formato CSV.

Inizialmente abbiamo importato i pacchetti necessari. Il "PD" è realizzato un alias per Panda e "NP" come alias per Numpy. Il toolkit numpy è caricato qui perché faremo alcune voci nulla nella nostra serie usando “NP.Nan ”durante la creazione usando il pdas“ pd.Serie () "Metodo.

Il "PD.La funzione serie () "è invocata per la costruzione di una serie Pandas con questi valori:" Nile "," Amazon ", NP.Nan, "Gange", "Mississippi", "NP.Nan "," Yangtze "," Danube "," Mekong "," NP.Nan "e" Volga ". Esistono un totale di 21 valori definiti per la serie su cui 3 voci tengono "NP.Valori nan ”che significa che 3 valori mancano nella serie. La proprietà "Nome" specifica il nome per questo array di valori che abbiamo fornito "titoli". La proprietà "indice" viene utilizzata per impostare l'elenco dell'indice definito dall'utente invece di seguire l'elenco predefinito.

Qui, vogliamo l'elenco degli indici con i valori "10", "11", "12", "13", "14", "16", "17", "18", "19", "20", e 21 ". Ora, la nostra serie avrà l'elenco degli indici a partire da "10" anziché "0". Ora, memorizza questa serie in modo da poterlo usare più avanti nel programma. Abbiamo inizializzato un oggetto in serie "Rivers" e assegnarci la serie di output generata dal chiamare il "PD.Serie () "Metodo. La serie può essere vista mettendola in mostra utilizzando la funzione "Print ()" di Python.

L'output rendering sul terminale ha stampato una serie il cui elenco di indici a partire da 10 e termina a 21, il che significa che la serie ha 21 valori.

La serie verrà trasformata in un formato CSV con la "serie.Metodo to_csv () ".

Abbiamo invocato la "serie.Metodo to_csv () "con la nostra serie" Turchia ". Quindi, questo metodo prenderà i valori dalla serie "Turchia" e li convertirà in un formato di valori separati da virgola. Il risultato viene salvato nella variabile "converted_csv". E alla fine, la serie convertita è stampata con l'aiuto della funzione "print ()".

Nell'istantanea del risultato seguente, puoi vedere che i valori della serie sono ora modificati in un modo in cui una virgola viene utilizzata per separarli dall'elenco dell'indice. Inoltre, dove mancano i valori, solo il numero dell'indice viene stampato con una virgola.

Conclusione

La modifica di una serie Pandas in un formato CSV è un approccio pratico. Questo può essere ottenuto utilizzando la serie Pandas “.funzione to_csv () ". Questa guida ha messo in pratica due tecniche per impiegare questo metodo. Nella prima illustrazione, abbiamo invocato questo metodo per convertire una serie con un DateTimeIndex in un formato di valori separati da virgola. La seconda istanza ha utilizzato la “serie.TO_CSV () "Funzione per modificare una serie con alcune voci mancanti in un formato CSV. Entrambe le tecniche sono state praticamente implementate utilizzando lo strumento "Spyder" sul sistema operativo di Windows.