I panda leggono TSV

I panda leggono TSV

In "Pandas", possiamo facilmente leggere file come possiamo leggere i file CSV, possiamo leggere i file TSV, possiamo leggere i file di testo e possiamo anche leggere SQL. Spieghiamo il file TSV qui. È un file di formato di testo in cui i dati tabulari sono archiviati nel formato di testo. Possiamo facilmente creare o leggere il file "Valore separato dalla scheda" in "Pandas" perché i "Panda" contiene una funzione integrata che aiuta a creare e leggere i file TSV. Discuteremo in questo tutorial i metodi che "Pandas" ci fornisce per la lettura del file TSV. Creeremo e leggeremo il file TSV e convertiremo anche i suoi dati dopo aver letto il file TSV nel frame dati.

Metodi per leggere il file TSV in "Panda"

Possiamo leggere il file TSV utilizzando due metodi di "panda" e utilizzeremo questi due metodi in questo tutorial. I metodi sono riportati di seguito:

  • Metodo read_table ().
  • Metodo read_csv ().

Esempio # 01: usando il metodo "read_table ()"

Usiamo lo strumento "Spyder" per aiutare a generare i codici "panda". Prima di descrivere il concetto di lettura del file TSV, abbiamo spiegato come possiamo creare il file TSV in "Pandas". Importiamo la libreria "panda" e quindi creiamo un frame dati "new_df" in cui abbiamo inserito alcune colonne. I dati vengono anche inseriti in ogni colonna. Abbiamo inserito "New_name, new_1, new_2, new_3, new_4 e new_5" che sono le colonne del frame dati "new_df".

Quindi, abbiamo aggiunto il metodo "To_csv ()" in cui aggiungiamo il nome del file. Inseriamo “Newfile.TSV "che convertirà il telaio di dati che abbiamo creato in questo codice nel file TSV e nominiamo questo file" newfile.TSV ". Abbiamo anche regolato il parametro "SEP" in cui abbiamo aggiunto "\ t" come valore. Ora, il "Newfile.TSV ”è creato. Mostreremo anche questo file TSV.

Premiamo "Shift+Enter" che esegue i codici e il "Newfile.TSV ”viene quindi generato. Questo file TSV è mostrato di seguito. Qui, i dati del frame dati sono archiviati in forma di testo. Ora leggeremo anche questo file TSV.

Abbiamo importato di nuovo i "panda" nel nuovo file. Leggiamo il file TSV che abbiamo creato sopra. Posizioniamo "my_dataframe" che memorizza i dati del file TSV dopo averlo letto. Utilizziamo il "PD.read_table () ”Metodo e passa il nome del file che dobbiamo leggere che è“ newfile.TSV ". Questo metodo leggerà i dati presenti nel file TSV e genererà il frame dati dei dati del file TSV, quindi salvali in "my_dataframe". Dopo questo, il "My_DataFrame" viene inserito nel "Print ()". Quindi, verrà stampato sul terminale in esecuzione.

Quando eseguiamo questo codice "PANDAS", i dati del file TSV vengono mostrati come Frame dati sul terminale. I dati del file TSV sono mostrati di seguito che otteniamo dopo aver letto il file TSV.

Esempio # 02: utilizzando il metodo "read_csv ()"

Possiamo anche leggere il file TSV utilizzando il metodo "read_csv ()". Qui, stiamo usando il metodo "read_csv ()" per leggere il "newfile.TSV ". Inizializziamo la variabile "Data" con il metodo "read_csv ()" e abbiamo anche aggiunto due parametri. Innanzitutto, abbiamo aggiunto il nome del file e quindi impostiamo il parametro "SEP". Il suo valore è regolato come "\ t". Stampiamo anche "dati" usando "print ()" qui.

Mostra anche i dati del file TSV in formato dati o possiamo dire che in forma tabulare. Entrambi i metodi funzionano allo stesso modo e restituiscono lo stesso risultato.

Esempio # 03:

Il nuovo file TSV è reso di seguito. Ora, dobbiamo leggere i dati di questo file TSV utilizzando il metodo "Panda".

Abbiamo aggiunto il metodo "read_table ()" per la lettura del file TSV, ma questa volta abbiamo aggiunto un altro parametro. Dopo aver aggiunto il nome del file TSV che è "Istruzione.TSV ", abbiamo anche aggiunto il parametro" index_col "che aiuta a regolare la colonna indice del frame dati che viene creato dopo aver letto il file TSV. Regoggiamo la colonna "RandomName" come indice del frame dati. Quindi, quando viene eseguito il codice, il file verrà letto quindi il frame dati che otteniamo avrà il "nome casuale" come colonna indice. Visualizziamo anche i dati del file TSV dopo aver letto qui utilizzando "Print ()".

Qui, si vede che i dati precedenti del file TSV vengono visualizzati in forma tabulare. Ottiamo questo frame dati leggendo il file TSV con l'aiuto del metodo "read_table ()". Inoltre, si noti che la colonna "RandomName" è impostata qui come colonna indice.

Esempio # 04:

Ora abbiamo un altro file TSV che viene mostrato di seguito. Il file contiene i dati in formato di testo. Leggeremo anche questo file.

Abbiamo creato la variabile "new_columns". Aggiungiamo alcuni nomi perché vogliamo regolare questi nomi come nomi di colonne del frame dati che otteniamo dopo aver letto il file TSV mostrato sopra. I nomi che abbiamo aggiunto sono "class_mammals, class_fish, class_repatiles, class_amphibians e class_birds". Dopo questo, abbiamo utilizzato il metodo "read_table" in cui abbiamo aggiunto tre parametri. Innanzitutto, abbiamo inserito "animali_data.TSV "che è il nome del file TSV e quindi regolato" nessuno "al parametro" header ". Abbiamo anche aggiunto i "new_columns" che abbiamo inizializzato in questo codice al parametro "nomi". Quindi, i nomi che abbiamo aggiunto sopra sono regolati come nomi di colonne del frame dati. Quindi, rendiamo i dati utilizzando "Print ()".

I dati che sono mostrati nel formato di testo nel file TSV sopra vengono convertiti nel frame dati. I nuovi nomi di colonne che abbiamo aggiunto nel codice sono resi e i nomi delle colonne precedenti vengono trasformati nella riga o valori di queste colonne.

Esempio # 05:

Stiamo leggendo lo stesso file che abbiamo mostrato nell'esempio 4 ma questa volta stiamo saltando alcune righe dopo aver letto "animali_data.File TSV ". Abbiamo appena aggiunto il quarto parametro al metodo "read_table ()" che è il parametro "skiprows". Impostalo su "4" perché vogliamo saltare le prime quattro righe del telaio di dati generate dopo aver letto "animali_data.TSV ".

Il frame dati è nuovamente reso ma le prime quattro righe non sono presenti in questo frame dati perché abbiamo saltato le righe "4" del frame dati.

Esempio # 06:

Leggiamo di nuovo "animali_data.File TSV "ma con il metodo" read_csv () ". Abbiamo inserito il "animali_data.TSV "e quindi impostare" sep "su" \ t ". Inoltre, abbiamo regolato il valore "nessuno" per la "intestazione" e i nomi che aggiungiamo qui verranno impostati come nomi di colonne. Abbiamo saltato solo una riga usando il parametro "Skiprows".

Viene visualizzato il frame dati che otteniamo e i nomi delle colonne vengono regolati di conseguenza, come abbiamo inserito nel codice. Inoltre, la prima riga viene rimossa dal telaio di dati qui.

Esempio # 07:

Viene mostrato un altro file TSV. Ora mostreremo come ottenere la colonna selezionata dopo aver letto il file TSV.

Abbiamo applicato il metodo "read_table ()" e aggiunto un nuovo parametro che è i parametri "usecols" e aggiunto il nome della colonna che vogliamo ottenere dalle "auto.File TSV ". Abbiamo aggiunto "prezzo" che è il nome della colonna. Ora accederà solo ai dati della colonna "Price" e li salverà in "CARSDF". Quindi, rendiamo qui i dati della colonna "prezzo".

Viene visualizzata una sola colonna perché abbiamo regolato il parametro "UseCols" nel metodo "read_table ()". Quindi, non ha mostrato gli interi dati del file TSV qui.

Conclusione

Possiamo leggere diversi file in "Panda" con l'aiuto del metodo "Panda". Quindi, abbiamo scritto questo tutorial in cui abbiamo spiegato come leggere il file TSV in "Panda". Abbiamo spiegato per la prima volta la creazione del file TSV e poi abbiamo discusso di due metodi in questo tutorial che aiuta a leggere i dati del file TSV. Abbiamo spiegato il metodo "read_table ()" e il metodo "read_csv ()" e abbiamo spiegato come questi metodi aiutano a leggere il file TSV in "Panda". Abbiamo utilizzato questi metodi in questo tutorial aggiungendo parametri diversi ogni volta in ciascun codice per ottenere risultati diversi.