Pandas DataFrame da CSV

Pandas DataFrame da CSV
Un frame di dati è una struttura di dati bidimensionali in Python a cui si accede il modulo Panda che memorizza il contenuto in un formato tabulare. In altre parole, usando colonne e righe. Ogni colonna in un telaio di dati può contenere un tipo di elemento vario.

I file CSV o "valori separati da virgole" sono i valori separati dalle virgole e possono essere visualizzati in modo simile a un file Excel. "Pandas" è il pacchetto di scienze dati più essenziale in Python. Durante l'analisi dei dati, dobbiamo gestire set di dati di grandi dimensioni, che sono in genere in formato CSV. Esistono diversi approcci all'utilizzo dei file CSV per creare un frame dati Pandas. La tecnica che abbiamo scelto di spiegare e implementare in questo articolo è il metodo Pandas "read_csv ()". Per leggere ed elaborare i file CSV, il metodo "Leggi CSV ()" di Pandas è essenziale.

Vedremo la sua dimostrazione pratica attraverso l'esempio spiegato ed eseguito nel seguente:

Esempio: utilizzando il metodo Pandas "read_csv ()" per creare un frame dati da CSV

In questa illustrazione, vedremo come possiamo creare un telaio di dati da un file CSV utilizzando il PDA "PD.read_csv () "metodo. Andiamo avanti con l'implementazione di questo concetto praticamente.

Per ogni linguaggio di programmazione con cui selezioni di lavorare secondo i requisiti, è necessario trovare un software o uno strumento per assemblare questo linguaggio. Quando inizi a cercarlo, troverai un sacco di scelte. Nel nostro articolo, il linguaggio di programmazione utilizzato è "Python". Dobbiamo ottenere lo strumento o il software che assemberebbe il linguaggio e si trova compatibile con il nostro sistema. Da una varietà di scelte, abbiamo selezionato lo strumento "Spyder". Dobbiamo scaricarlo dal sito ufficiale di "Spyder".

Quando il download è completo, avviamo la procedura guidata di installazione. Una volta terminata l'installazione, è possibile accedere allo strumento semplicemente scrivendo il suo nome sulla barra di ricerca del laptop. Facendo clic su Apre l'interfaccia dello strumento "Spyder". Qui, siamo tutti pronti a iniziare con la nostra dimostrazione pratica.

Sull'interfaccia dello strumento "Spyder", fare clic sul pulsante "Nuovo file" o premere "Ctrl+N" per aprire un nuovo file. Questo file viene aperto e puoi vedere che il nome del file ha un ".Py ”estensione. Questa estensione si riferisce al file "Python". Siamo tutti pronti per iniziare a scrivere il codice. Ora, a cominciare dal codice, il primo e principale requisito quando si scrive un codice è importare le sue librerie pertinenti le cui caratteristiche si desidera accedere. Nel nostro caso, l'illustrazione si basa sull'implementazione delle funzionalità "panda". Quindi, per primo importiamo la libreria utilizzando la riga di codice "Importa panda come PD". Questo "PD" è una forma breve per i panda, il che significa che ora possiamo caricare i metodi Pandas usando il "PD".

Ora, abbiamo finito di importare la Biblioteca Pandas richiesta. L'attività successiva è imparare come possiamo creare un telaio di dati utilizzando il file CSV. Qui, hai due scelte: o devi creare il tuo file CSV su fogli di calcolo Microsoft Excel o Google o qualsiasi strumento pertinente con ".Estensione CSV "Se è necessario eseguire alcune operazioni su di esso in Python o è possibile scaricare un file CSV di esempio da Internet per scopi di apprendimento. D'altra parte, abbiamo scaricato un file CSV di esempio da Internet per il processo di apprendimento. Abbiamo invocato il "PD.Metodo read_csv () "che legge il file CSV fornito. Tra le sue parentesi, fornire il nome del file CSV.

Come abbiamo detto, il "giorno della settimana.CSV ”Nome file. Una cosa importante da considerare qui è che il file CSV che hai creato o scaricato deve trovarsi nella stessa cartella in cui il tuo ".I file Py "risiedono all'interno del".cartella spyder-py3 ". Altrimenti, quando si tenta di eseguire il programma, lancerà un errore. Quando chiamiamo il "PD.read_csv ("giorni feriali.Metodo CSV ")", legge il contenuto di questo file e crea un frame dati. Ora, per archiviare questo frame dati, abbiamo creato un "campione" dell'oggetto dati che contiene l'output generato dal "PD.read_csv () "metodo. Infine, abbiamo invocato il metodo "print ()" per visualizzare questo frame dati sul terminale.

Essendo nuovo di "Python" e "Spyder", potresti pensare a come eseguire il codice precedentemente scritto. Devi solo premere il pulsante "Esegui file" sull'interfaccia "Spyder" o semplicemente premere i tasti "Shift+Enter" per eseguire il programma. Ecco il nostro telaio di dati creato dal file CSV fornito.

Nel frame dati indicato, abbiamo quattro colonne e sette righe. La prima colonna è "Nome" che memorizza i nomi dei giorni feriali come "Monday", "Martedì", "Mercoledì", "Giovedì", "Venerdì", "Sabato" e "Domenica". La seconda colonna "abbreviazione" memorizza i termini brevi per i dati come "mon."," Mar."," Mer."," Thu."," Veni."," Sat "e" sole ". La terza e la quarta colonna sono "numeriche" e "numerico-2". Memorizzano i numeri da "0" a "7". Entrambi tengono valori numerici per i giorni feriali.

Potrebbe esserci una situazione in cui si desidera solo creare un frame di dati dalle colonne selezionate del file CSV. Questo può essere fatto usando lo stesso "PD.Funzione read_csv () "semplicemente aggiungendo un parametro" usecol ". Questo parametro prende il nome delle colonne che si desidera recuperare dal file CSV per il frame dati. Come abbiamo già visto, le colonne del nostro telaio di dati che vengono importate dal file CSV utilizzano la colonna "Nome" e la colonna "Numerica" ​​da utilizzare dal file CSV per creare un frame dati. Quindi, abbiamo invocato il metodo "Print ()" per visualizzare le colonne selezionate nel frame dati.

L'esecuzione di questo codice ci fornisce il frame dati di output con solo due colonne dal file CSV. Il frame dati è mostrato nella seguente immagine:

Oltre a creare un frame dati utilizzando le colonne selezionate dal file CSV fornito, è possibile eseguire anche altre operazioni. Potrebbe esserci un file CSV contenente dati di grandi dimensioni e non tutto ciò è necessariamente necessario essere visualizzati per il tuo telaio perché a volte un grande dati non è necessario creano un disastro. Quindi, spesso cerchiamo di evitarlo. Possiamo farlo saltando le righe irrilevanti dal frame dati. Dobbiamo aggiungere un parametro "Skiprows" e specificare i numeri di riga che si desidera escludere. Abbiamo specificato i numeri di riga "[1, 3, 5]" qui. Il metodo "Print ()" è chiamato per mostrare il nuovo frame dati.

Qui nell'immagine di output, è possibile osservare che il telaio di dati creato dal file CSV non contiene le righe "1", "3" e "5".

Possiamo anche modificare il nome della colonna del file CSV in base ai nostri requisiti per il frame dati quando chiamiamo il "PD.funzione read_csv () ”. Per completare questa operazione, dobbiamo passare un elenco di stringhe di caratteri al "PD.parametro "nomi" della funzione read_csv () ". Queste stringhe di personaggi servono come nomi delle nuove colonne. Inoltre, sembra logico escludere la prima riga del set di dati di input perché contiene il titolo originale del file CSV. Abbiamo fornito i nomi per le colonne come "nomi = ['c1', 'c2', 'c3', 'c4']". Infine, abbiamo visualizzato il frame dati con nuovi nomi di colonne.

Questo ci porta il seguente tela di dati di output:

Conclusione

I frame dei dati sono i blocchi più utilizzati e importanti dei Python Pandas. Esistono diversi modi per creare un telaio di dati nei panda. Di cui, abbiamo discusso su come creare un telaio di dati da un file CSV in questo articolo. Abbiamo usato un metodo Pandas "read_csv ()" per leggere il file CSV fornito e quindi crearne un frame dati da esso. Attraverso l'implementazione pratica dei codici di esempio eseguiti su "Spyder", abbiamo elaborato l'utilizzo di questa funzione. Abbiamo anche spiegato e implementato i diversi parametri utili forniti da questo metodo per ottenere il risultato desiderato. Prevediamo che il nostro sforzo di rendere facile l'apprendimento nei moduli di panda ti aiuterà davvero nella tua costruzione di abilità Python.