Panda selezionare colonne

Panda selezionare colonne
Questo articolo discuterà della selezione di una colonna o di un sottoinsieme di colonne da un frame dati Panda.

Esempio di dati dati

In questo articolo, utilizzeremo un telaio di dati come mostrato nel codice di esempio seguente:

# Importa panda
Importa panda come PD
df = pd.DataFrame (
'Products': ['Product1', 'Product2', 'Product3'],
'Price': [100.9, 10.33, 12.00],
'Quantity': [100, 10, 34],
indice = [1,2,3]
)
df

Il frame dati risultante è come mostrato di seguito:

Sentiti libero di usare il tuo set di dati per una migliore comprensione.

Seleziona le colonne per indice

Il primo metodo di cui discuteremo è la selezione delle colonne per i loro indici. Per questo, possiamo usare il metodo ILoc.

La sintassi è espressa di seguito:

DataFrame.iloc [rows_to_select, [column_indices]]

Ad esempio, per ottenere la prima e la seconda colonne (comprese tutte le righe), possiamo fare quanto segue:

Stampa (df.iloc [:, [0,1]])

Quanto sopra dovrebbe tornare:

Seleziona colonna per intervallo di indice

Possiamo anche selezionare più colonne specificando il loro intervallo di indici. Ad esempio, nel nostro Frame di dati di esempio, possiamo selezionare le colonne dall'indice da 0 a 3 come mostrato:

df.Iloc [:, 0: 3]

Questo dovrebbe restituire l'intero frame dati come mostrato:

Seleziona la colonna per nome

Per selezionare le colonne per nome, possiamo usare la sintassi mostrata di seguito:

Dataframe [['column_name1', 'column_name2…]]

Un esempio è come mostrato di seguito:

df [["prodotti", "prezzo"]

Questo dovrebbe tornare:

Seleziona colonne tra i nomi delle colonne

Potrebbe essere necessario selezionare colonne tra i nomi di due colonne in alcune istanze. Per questo, possiamo usare la sintassi mostrata di seguito:

DataFrame.loc [:, 'start_column': 'end_column']

Nel nostro esempio di dati, possiamo fare:

df.loc [:, "prodotti": "quantità"]

Questo dovrebbe restituire un frame dati come mostrato:

Chiusura

Questo articolo ci ha insegnato come utilizzare le colonne selezionate in un telaio di dati Pandas utilizzando le loro posizioni indici, l'intervallo di indice e i nomi delle colonne.

Grazie per aver letto!!