Panda seleziona colonna per nome

Panda seleziona colonna per nome
Una delle operazioni più comuni durante l'elaborazione dei dati è estrarre una colonna o colonne da un frame dati Panda. Per recuperare le colonne e le righe, il frame dati fornisce l'identificatore di indicizzazione "loc []". Questo metodo seleziona solo colonne o righe per etichette/nomi.

La sintassi per questo metodo è la seguente:

In questo articolo, vedrai la sua pratica implementazione attraverso le diverse tecniche per selezionare le colonne per nome.

Esempio 1: utilizzo della proprietà Pandas loc [] per selezionare una singola colonna per nome

Per estrarre la particolare colonna singola di DataFrame, utilizziamo la proprietà Pandas "loc []" in questa illustrazione. Ottiamo una guida passo-passo per farlo.

Da una vasta gamma di strumenti alternativi, abbiamo optato per lo strumento "Spyder" per eseguire i nostri codici Python. Dopo aver lanciato lo strumento, iniziamo a lavorare con lo script. Venendo al programma Python, controlliamo per la prima volta i prerequisiti per l'esecuzione indisposizione dello script. Qui, come dichiara il titolo, "Pandas" è la biblioteca necessaria per lavorare con le sue funzioni. Cariciamo il toolkit Panda nel nostro ambiente Python scrivendo il "importare panda come PD". Il "PD" viene realizzato un alias per i panda da utilizzare in questo particolare programma anziché "panda".

Per lavorare sulle colonne, abbiamo bisogno di un frame di dati che contiene le colonne. Pandas ci consente di costruire un telaio di dati utilizzando il suo metodo molto semplice che è “PD.DataFrame () ". Questo metodo ha due sezioni: "PD" e "DataFrame". Il "PD", come descritto in precedenza, è l'alias per "panda", il che significa che chiamiamo qualcosa dal modulo Panda. La seconda porzione "DataFrame" è la parola chiave utilizzata per creare il frame dati. Invochiamo il "PD.Funzione DataFrame () "per generare un frame dati. I nomi delle colonne e i loro valori possono essere definiti tra le parentesi di questa funzione.

Inizializziamo il nostro frame dati con 6 colonne con i nomi "Mercurio", "Venere", "Terra", "Marte", "Giove" e "Saturno". Ogni colonna viene assegnato un particolare set di valori. Per "Mercurio", abbiamo valori "13", "2", "24", "19", "9", "52" e "65". La colonna "Venus" memorizza i valori "32", "15", "3", "18", "39", "31" e "7". Nella terza colonna, abbiamo i valori "Earth" "5", "7", "21", "15", "1", "3" e "13". I valori per "Marte" sono "8", "21", "22", "34", "14", "21" e "2". Il "Giove" contiene i valori che sono "11", "1", "35", "62", "5", "15" e "12". L'ultima colonna nel frame dati "Saturno" ha i valori "21", "23", "45", "2", "11", "12" e "9". Ogni colonna nel frame dati conserva una lunghezza uguale dei valori. Ora, abbiamo finito con la definizione della colonna del nostro Frame Data e dei loro valori corrispondenti.

I panda “PD.La funzione DataFrame () ”crea un frame dati con i dati forniti. Ma non ha spazio per preservarlo. Per salvare questo frame dati da qualche parte, in modo da poterlo utilizzare in seguito, creiamo un oggetto DataFrame. Questo oggetto DataFrame è etichettato come "pianeti". Il "PD.DataFrame () "Metodo, quando chiamato, crea un Frame Data e lo memorizza in questo oggetto DataFrame. Per visualizzare il frame dati sullo schermo, abbiamo la funzione di Python "Print ()". Questo metodo visualizza il contenuto di "pianeti" sulla console Python quando viene invocato.

Vediamo il frame dati output dopo aver colpito l'opzione "Esegui file" sullo strumento "Spyder". Il nostro frame dati con 6 colonne e 7 righe è esibito sulla console che può essere vista nell'immagine di output fornita nel seguente:

Il nostro campione di dati per questa dimostrazione è pronto a lavorare e apportare modifiche applicando le funzioni. Dovremmo estrarre una colonna usando il nome della colonna. Ti istruiremo sull'approccio per eseguire questo.

Per selezionare una singola colonna per nome, Pandas DataFrame ci fornisce l'attributo "loc []". Ci consente di scegliere le colonne o le righe menzionando i loro nomi. Utilizziamo il "DF. loc [] "attributo. Il nome del frame dati è fornito come "pianeti". Tra le staffe quadrate, premi nel nome della colonna "Earth" dopo aver lasciato il posto della riga con ":" Colon. Ciò significa che la selezione viene eseguita in termini di colonna. Per archiviare il risultato, inizializziamo un "singolo" variabile che memorizza il contenuto della singola colonna menzionata nella proprietà "loc []". L'esposizione dell'output sullo schermo richiede di chiamare la funzione "print ()". Passiamo la variabile "single" alla funzione "print ()" per mostrare il risultato.

Ecco il nostro frame dati risultante con una sola colonna selezionata. La colonna "Earth" è presentata sullo schermo con il suo contenuto. Il nome della colonna e il tipo di dati del valore sono menzionati sotto la colonna estratta.

Esempio 2: utilizzo del metodo Pandas loc [] per selezionare le colonne più colonne per nome

La selezione di una singola colonna in un frame di dati Pandas viene appresa nell'istanza precedente. Inoltre, possiamo anche estrarre più di una colonna che utilizza la proprietà "loc []" del frame dati ". Mettiamo in pratica questo concetto attraverso questa illustrazione.

Utilizziamo il frame dati creato nell'istanza precedente. Questo frame dati ha 6 colonne. Dobbiamo selezionare più colonne a scelta. Il "df.loc [] "è invocato. Qui, il nome del nostro Frame Data è "pianeti" che forniamo il ".Loc [] "Proprietà. Specifica che vogliamo selezionare le righe o le colonne particolari dal frame dati fornito. Tra le staffe quadrate della proprietà "loc []", abbiamo due selezioni. Il primo posto è selezionare le righe mentre l'altra è per la selezione delle colonne. Per questa guida, salteremo il primo posto e aggiungeremo semplicemente un colon ":" perché non abbiamo bisogno di fare una selezione sulle righe.

Nel luogo della colonna, introduciamo un operatore del pedice "[]" che chiamiamo anche le staffe quadrate. In questo operatore del pedice, scrivi il nome delle colonne. Selezioniamo 3 colonne che sono "Mercurio", "Marte" e "Saturno". L'output di questa proprietà viene salvato nella variabile "Multi". Infine, utilizziamo il metodo "Print ()" per mostrare il risultato sullo schermo.

Il frame dati risultante mostra 3 colonne selezionate utilizzando la proprietà "loc []". Le colonne selezionate compaiono sul terminale mentre il resto viene ignorato.

Esempio 3: utilizzando il metodo Pandas loc [] per selezionare una gamma di colonne per nome

Selezionare le colonne premendo i loro nomi uno per uno a volte diventa un'attività frenetica quando è necessario estrarre un ampio numero di colonne. Se è necessario estrarre le colonne da un elenco di colonne specificato fino a un punto particolare, è possibile farlo fornendo l'intervallo di colonne nell'attributo "loc []". Vediamo il suo esercizio pratico.

Impieghiamo il "df.Loc [] "Proprietà. Nel luogo della colonna, forniamo la gamma di colonne che dobbiamo recuperare. Il primo nome di colonna da dove inizia l'intervallo e il secondo nome di colonna in cui termina l'intervallo, sono entrambi separati da un operatore di colon ":". Qui, selezioniamo la colonna "Venere" per iniziare l'intervallo e la colonna "Giove" in cui la gamma termina. Tra questo intervallo, qualunque colonne esistano, il metodo "loc []" le estrae tutte. Archiviamo il risultato nella variabile "nome" e lo visualizziamo usando il metodo "print ()".

Nell'istantanea di output, possiamo vedere che tutte le colonne da "Venere" a "Giove" sono esposte sullo schermo.

Conclusione

Questa guida si basa sulla selezione delle colonne in un frame dati Panda. Pandas DataFrame ci fornisce un attributo che è “DF.loc [] "per effettuare una selezione su righe o colonne o anche entrambi. Abbiamo lavorato su 3 esempi in questo articolo. Il primo esempio fornisce una spiegazione dettagliata della selezione di una singola colonna in un frame di dati. Il secondo esempio ha funzionato alla selezione di più colonne. Mentre la terza illustrazione è fondata sull'idea di selezionare una gamma di colonne in un telaio di dati.