Colonne di panda

Colonne di panda
Una griglia rettangolare chiamata Pandas DataFrame viene utilizzata per archiviare i dati. I dati salvati in un telaio di dati sono semplici da visualizzare e manipolare. Il frame dati può consistere in più righe e colonne in esso. Ogni riga rappresenta una misurazione di una singola istanza, mentre ogni colonna è un vettore contenente i dati di un attributo o una variabile specifica. Le righe di dati di dati possono avere dati eterogenei o omogenei in una determinata riga, ma ogni colonna di dati contiene dati omogenei in ogni colonna. Gli assi di un telaio di dati nei panda sono etichettati, a differenza di quelli di un array bidimensionale. In questo articolo, discutiamo dei vari metodi per aggiungere, modificare ed eliminare le colonne o i valori di Panda nelle colonne di un telaio di dati in Panda. Questo può essere fatto attraverso vari metodi. Vediamo alcuni di questi metodi in dettaglio.

Come aggiungere colonne o valori a una colonna in panda

Le colonne possono essere aggiunte a un telaio di dati utilizzando i vari metodi. Nel seguente esempio, utilizziamo le funzioni Applica () e Insert () per aggiungere colonne al nostro Frame Data.

Esempio 1: Aggiungi la colonna a DataFrame utilizzando Applica () funzione
È possibile aggiungere più colonne a un frame di dati utilizzando i panda.DataFrame.Metodo Assegna (). Innanzitutto, creiamo un frame dati di esempio utilizzando il PD.Funzione DataFrame () con alcune righe e colonne. La libreria "Pandas" viene importata per prima per creare il frame dati Pandas.

Abbiamo creato il telaio dati "df" passando un dizionario con due chiavi - "C1" e "C2" - con valori ["A", "B", "C"] e ["D", "E", "F ”] Rispettivamente. Passando il dizionario in PD.DataFrame, i tasti diventano l'etichetta delle colonne e i valori nell'elenco diventano i dati di ciascuna cella nelle colonne del frame dati.

Come si può vedere, abbiamo creato un frame dati con due colonne ora. Utilizzando la funzione ASSEGNA (), aggiungiamo ulteriori colonne o colonne al nostro telaio di dati "DF".

La funzione fornisce un nuovo frame dati "new_df" che contiene sia la colonna aggiuntiva (appena aggiunta "C3") sia tutte le vecchie colonne ("C1" e "C2"). Tieni presente che se le colonne attuali vengono riassegnate, tutte saranno sovrascritte.

Esempio 2: Aggiungi la colonna a DataFrame utilizzando la funzione insert ()
Il “DataFrame.Il metodo insert () "può anche essere utilizzato per aggiungere colonne a un frame dati. Creiamo innanzitutto un frame dati con alcune righe e colonne.

Per visualizzare il nostro frame dati "df", viene utilizzata la funzione print ().

Il nostro frame dati ha due righe - A e B - con valori ["1", "2", "3"] e ["4", "5", "6" rispettivamente. Ora utilizziamo il metodo insert () per aggiungere un'altra colonna nel telaio di dati "DF".

Prima di utilizzare la funzione insert (), abbiamo creato un elenco con valori ["7", "8", "9"]. L'indicizzazione delle colonne da parte di dati inizia a zero. Quando abbiamo applicato la funzione insert () con il telaio di dati "DF", abbiamo specificato l'indice 1 per posizionare la nuova colonna "C". Abbiamo anche superato l'elenco "valori" nella funzione dei parametri della funzione insert () per archiviare i valori della colonna "C".

Puoi notare che la nostra nuova colonna viene aggiunta al 2nd Posizione della colonna tra "A" e "B" perché abbiamo specificato l'indice "1" nei parametri della funzione insert ().

Come selezionare le colonne in panda

Le colonne possono essere selezionate in base alle loro posizioni, etichette o dati di indice. Vedremo come selezionare le colonne specifiche e più nei seguenti esempi.

Esempio 1: selezionare una colonna specifica usando i nomi/etichette della colonna
Creiamo un campione di dati di esempio per mostrarti come è possibile selezionare una colonna specifica del frame dati.

Abbiamo creato il frame dati con le colonne "Col1" e "Col2". Il modo più semplice per ottenere una colonna specifica di dati dati è scrivere il nome della colonna come stringa con citazioni tra parentesi [].

Nel frame dati dato, abbiamo due colonne numeriche - "Col1" e "Col2" - con i valori (3, 1, 5) e (7, 2, 6) rispettivamente.

Utilizzando un elenco con più nomi delle colonne di dati all'interno delle staffe "[]", è possibile selezionare più colonne.

Come si può vedere, abbiamo superato un elenco contenente entrambi i nomi di colonne "Col1" e "Col2" tra le staffe.

Esempio 2: selezionare una colonna specifica per il loro tipo di dati
Creiamo un frame dati con colonne con dati diversi.

La colonna "Nome" memorizza i nomi delle persone ("Tim", "Alex", "Joe", "Rick"). Mentre la colonna "Age" memorizza l'età delle persone (12, 11, 11, 13). Controlliamo i dati dei dati delle nostre colonne dati utilizzando l'attributo "dtypes".

Il tipo di dati della colonna "Nome" è "Oggetto" e "Int64" è il tipo di dati della colonna "Age". Ora selezioniamo le colonne per il loro tipo di dati utilizzando la funzione "loc []".

All'interno del DF.funzione loc [], abbiamo specificato il dtypes == 'int64'. I valori vengono restituiti in cui il tipo di dati è "int64" usando ".Attributo valori "con DF.loc [:, (df.funzione dtypes == 'int64').

Esempio 3: selezionare più colonne per i loro indici
Creiamo un nuovo telaio di dati per mostrarti come selezionare più o tutte le colonne del frame dati utilizzando il metodo "Iloc []".

Da quando abbiamo creato il nostro Frame Data, ora utilizziamo il metodo ILOC [] per selezionare più colonne dal nostro Frame Data. Quando viene selezionata una singola colonna, il metodo Iloc [] restituisce un oggetto Serie. Quando viene selezionata più di 1 colonna, viene restituito un frame dati Panda.

Abbiamo specificato l'intervallo indice di colonne da 0 a 3. Si noti che la colonna su Index 3 non fa parte del gruppo. Vengono selezionate solo le colonne dall'indice da 0 a 2.

Come si può vedere, le colonne "W", "X" e "Y" sono selezionate specificando l'intervallo 0: 3.

Come modificare i nomi delle colonne e i valori della colonna

Nell'esempio seguente, modificheremo i nomi delle colonne usando la funzione Rename () e modificheremo i valori utilizzando la funzione Sostituisci ().

Esempio 1: modificare l'etichetta della colonna usando la funzione Rename ()
Innanzitutto, creiamo un telaio di dati con una o più colonne.

Una volta creato il frame dati, possiamo rinominare la sua colonna utilizzando la funzione Pandas Rename (). All'interno della funzione Rename (), utilizziamo un dizionario come originale_label: new_label. E specifichiamo l'etichetta corrente e la nuova etichetta (che vogliamo aggiungere).

Come puoi osservare, abbiamo cambiato il nome della colonna "A" in "nome" e il nome della colonna "B" in "soggetto".

Esempio 2: modificare i valori della colonna usando la funzione Sostituisci ()
Creiamo un telaio di dati con il numero di colonne che memorizzano i valori. Quindi, modifichiamo i valori delle colonne usando la funzione Sostituisci ().

Dal momento che abbiamo creato il nostro frame dati, ora cambiamo i valori della sua colonna usando la funzione sostituita (). Il metodo Sostituisci () scambia il valore nella colonna DataFrame con il nuovo valore specificato.

La funzione sostitutiva () ha sostituito il valore della colonna "x" dalla colonna "5" a 9.

Come rimuovere le colonne Pandas

Le colonne DataFrame possono essere eliminate utilizzando il metodo Drop () e Del in Panda.

Esempio: eliminazione di una colonna da un telaio di dati Pandas
Creiamo prima un frame dati da cui elimineremo le colonne specifiche utilizzando Drop () e DEL Metodi.

Abbiamo un frame dati "df" con 4 colonne ("A", "b", "c", "d"). Il metodo Drop () di DataFrame elimina le righe o le colonne in base a assi corrispondenti e nomi della colonna (etichetta) specificati. Eliminiamo la colonna "A" usando la funzione Drop ().

L'asse = 1 indica che stiamo rimuovendo la colonna, non la riga.

La funzione Drop () ha rimosso correttamente la colonna "A". Ora, usiamo il metodo "Del" sulla colonna "D".

La colonna "D" viene rimossa dal telaio di dati utilizzando il metodo "DEL".

Conclusione

In questo tutorial, abbiamo discusso di quali sono le colonne nel frame dati Pandas. Abbiamo usato le diverse funzioni per aggiungere, modificare ed eliminare le colonne dal nostro frame dati. Questo tutorial è progettato per insegnare le diverse operazioni che è possibile eseguire sulla colonna di un frame dati in Panda. Abbiamo implementato più esempi per insegnarti come è possibile aggiungere colonne o valori in una colonna, come selezionare le colonne, come modificare i nomi delle colonne e i valori delle colonne e come eliminare la colonna da un frame dati Pandas.