Rinomonimento di colonne in un telaio di dati Panda

Rinomonimento di colonne in un telaio di dati Panda

Ogni giorno, le persone gestiscono enormi dati che abbiamo chiamato big data. In questi big data, a volte contiene nomi di colonne o talvolta senza i nomi delle colonne. I nomi delle colonne sono presenti, ma contengono un nome irrilevante o alcuni caratteri indesiderati come spazi, ecc. Quindi, dobbiamo prima pre-elaborare quei dati enormi prima di iniziare l'analisi. Quindi prima di tutto, richiediamo la rinomina dei nomi delle colonne.

DataFrame sono dati tabulari orientati alla riga che hanno righe e colonne. Possiamo anche dire che DataFrame è una raccolta di colonne diverse e ogni colonna è di diversi tipi come stringa, numerico, ecc.

$ panda.DataFrame

Un panda DataFrame può essere creato utilizzando il seguente costruttore

$ panda.DataFrame (Data = None, Index = None, Columns = None, DType = None, Copy = False)

Metodo 1: Utilizzo della funzione Rename ():

Sintassi:

df.rinominare (colonne = d, inplace = false)

Abbiamo creato un DataFrame (df), che useremo per mostrare diversi metodi di rinomina ().

In quanto sopra DataFrame, Possiamo vedere che abbiamo quattro colonne ['Name', 'age', 'preferiti_color', 'grade'].

I panda hanno una funzione integrata chiamata Rename () che può cambiare il nome della colonna Instant. Per utilizzare questo, dobbiamo passare una chiave (il nome originale della colonna) e il valore del valore (il nuovo nome della colonna) alla funzione di rinominare sotto l'attributo della colonna. Possiamo anche usare un'altra opzione inplace a true che fa modifiche direttamente a quello esistente DataFrame Per impostazione predefinita, l'inplace è falso.

Dal risultato sopra, possiamo vedere che i nomi delle colonne sono cambiati.

Metodo 2: utilizzando il metodo dell'elenco

Panda DataFrame ha anche dato una colonna Nome attributo che ci aiuta ad accedere a tutti i nomi delle colonne di a DataFrame. Quindi, usando questo attributo colonne, possiamo anche rinominare il nome della colonna. Dobbiamo passare un nuovo elenco di colonne e assegnare all'attributo delle colonne come mostrato di seguito:

Lo svantaggio principale dell'utilizzo del metodo dell'elenco per rinominare il nome di una colonna è che dobbiamo passare tutti i nomi delle colonne anche se vogliamo cambiare solo pochi nomi di colonne.

Metodo 3: rinominare il nome della colonna usando il file read_csv

Possiamo anche rinominare le colonne durante lo stesso read_csv. Per questo, dobbiamo creare un elenco di colonne e passare quell'elenco come parametro per l'attributo dei nomi durante la lettura del CSV.

Usiamo l'intestazione di un attributo = 0, il che significa che sovrascriviamo le colonne precedenti del .File CSV con le nuove colonne che passiamo attraverso l'attributo dei nomi.

In quanto sopra .Metodo CSV, rinominiamo le colonne durante l'utilizzo dell'elenco e passiamo tutte le nuove colonne all'interno di tale elenco. Ma a volte, dobbiamo rinominare solo alcune colonne. Quindi, dobbiamo usare l'attributo UseCols e menzionare i valori dell'indice di quelle colonne all'interno di quello come mostrato di seguito:

In quanto sopra, rinominiamo solo la prima e l'ultima colonna del file CSV e per questo passiamo i valori dell'indice delle colonne (0 e 3) all'attributo USECOLS.

Metodo 4: usando le colonne.str.sostituire()

Questo metodo è sostanzialmente usato quando vogliamo cambiare alcune frasi in alcune altre frasi e non vogliamo cambiare la colonna completa rinominare lo spazio per sottolineare.

Dal risultato sopra, possiamo vedere che ora gli spazi si preparano al sottolineaggio.

Il metodo sopra ha anche la struttura dell'indice (df.indice.str.sostituire()).

Metodo 5: Rinomonimento delle colonne usando set_axis ()

Questo metodo viene utilizzato per rinominare l'indice insieme alla colonna come mostrato di seguito:

Conclusione

In questo articolo, mostriamo diversi metodi su come rinominare le colonne. Il metodo migliore che considero è il metodo Rename () in cui dobbiamo passare solo quelle colonne che vogliamo rinominare nel formato del dizionario (chiave, valore). L'attributo delle colonne è il metodo più semplice, ma lo svantaggio principale è che dobbiamo passare tutte le colonne anche se vogliamo rinominare solo alcune colonne. Possiamo anche rinominare le colonne durante la lettura del file CSV stesso, che è anche una buona opzione. Le colonne.str.sostituire () è l'opzione migliore solo quando vogliamo sostituire alcuni caratteri con altri caratteri.