Panda selezionare riga per valore

Panda selezionare riga per valore
Le righe da un telaio di dati Pandas possono essere selezionate in base a diversi criteri o valori di colonna. Questo articolo fornisce spiegazioni ed esempi per i numerosi approcci per raggiungere questo obiettivo
Dai un'occhiata ai metodi aggiunti a questo scopo:
  • Indicizzazione booleana
  • Loc [] Proprietà
  • Metodo query ()
  • Metodo isin ()

Esploriamo l'implementazione pratica di queste tecniche.

Creazione di un frame dati

Per l'implementazione degli esempi, stiamo utilizzando lo strumento Spyder. Dopo aver avviato lo strumento, abbiamo importato la libreria richiesta che è "Panda" e lo abbiamo alias "PD". Ora, utilizzando la funzione Pandas, creeremo prima un esempio di dati che verrà utilizzato in tutte le illustrazioni in questa guida.

Abbiamo invocato il metodo Pandas “PD.DataFrame () "che avvia il processo di creazione di dati di dati. L'abbiamo inizializzato con 4 colonne "segni", "st_name", "st_id" e "punti". Ogni colonna sta memorizzando un elenco di valori definiti. La colonna "Marks" sta avendo i valori "100", "92", "79", "92", "73", "82" e "90". Per la colonna "ST_NAME", abbiamo valori di stringa "Adam", "Albert", "Elsa", "Ronald", "Maya", "George" e "Jessica". La colonna "ST_ID" è in possesso di valori che abbiamo definito "10", "11", "12", "13", "14", "15" e "16". I valori "14", "13", "14", "12", "11", "10" e "9" sono stati archiviati nella colonna "Points".

La lunghezza dei valori per le colonne è 7 in questo caso. Il "PD.Il metodo DataFrame () ”genererà un frame dati con queste colonne e valori specificati. Ora, per archiviare questo Frame Data, abbiamo creato un oggetto DataFrame "Test" e lo abbiamo assegnato il risultato prodotto dall'invocazione del metodo del costruttore di dati Pandas. D'ora in poi, possiamo accedere a questo frame dati utilizzando l'oggetto "test" come nome di dati per tutte le illustrazioni. Alla fine, il frame dati viene visualizzato sullo schermo utilizzando il metodo di Python "Print ()".

Il comando "Esegui file" ci porterà il frame dati risultante presentato nella console Python.

Esempio 1: selezione delle righe in un frame dati in base ai valori della colonna

Il primo metodo, per selezionare le righe in un telaio di dati è la tecnica di indicizzazione booleana. In questo metodo, abbiamo controllato ogni riga come "vera o falsa" nel frame dati per una particolare condizione di colonna definita. Qualunque sia le righe corrispondono alla condizione che produce "vera" e verrà selezionato come output.

La sintassi per questo metodo per eseguire il programma è:

Per imparare la sua dimostrazione pratica, esaminiamo questi semplici passaggi. Dobbiamo script come il nome del Frame Data; operatore del pedice; e all'interno delle staffe quadrate, scrivi il nome e la condizione della colonna. Il nostro telaio di dati, come menzionato sopra, è "test" e la colonna che abbiamo scelto di applicare la condizione è "segni". Abbiamo applicato una condizione per selezionare le righe in cui il nome della colonna è "segni" e il suo valore è uguale a "92". Quindi, dobbiamo semplicemente estrarre righe in base al valore "Marks" della colonna "92". Per salvare il risultato, una variabile è stata generata e chiamata "Dummy". Passeremo questa variabile "Dummy" al metodo "Print ()" per mostrare il suo contenuto sul terminale quando è invocato.

L'output mostra 2 righe che sono state selezionate dal gesto dati dopo aver controllato la condizione. Puoi vedere che la condizione che abbiamo specificato è stata selezionata righe dove i marchi sono "92". Qui, abbiamo 2 record con tutti i dati visualizzati i cui voti sono "92". Il primo è "Albert" e il secondo è "Ronald".

Esempio 2: selezione delle righe in un frame dati in base ai valori della colonna utilizzando la proprietà LOC []

Il secondo metodo che stiamo usando per recuperare le righe usando i valori della colonna è il "DF.loc [] "con" df.Proprietà valori ".

Abbiamo utilizzato il "DF.Proprietà valori "per controllare una condizione. La colonna che abbiamo selezionato per controllare i valori è "ST_NAME" dal telaio "test". La condizione che abbiamo impostato qui è di selezionare la riga in cui il valore della colonna "ST_NAME" è uguale a "Ronald". Per archiviare il risultato, abbiamo creato una "copia" variabile. Pertanto, questa proprietà controllerà la condizione e rileva le righe che tengono i dati richiesti.

Quindi, abbiamo impiegato la proprietà "Loc []" del Frame Data. Viene fornito il nome del frame dati come "test" con la proprietà "loc []". Tra le staffe quadrate di questo attributo, abbiamo superato la variabile "copia" che ha le righe corrispondenti alla condizione specificata. Il "df.La proprietà loc [] "recupererà semplicemente le righe che la variabile" copia "sta trattenendo. Per preservare il risultato, abbiamo una variabile "dati". Per vedere l'output finale, il "stampa()" Il metodo è invocato con la variabile "dati" come parametro per visualizzare il suo contenuto.

Otteniamo una riga come output che soddisfa la condizione definita. Poiché esiste una sola voce con il valore "ronald" nella colonna "ST_NAME" nel frame dati.

Esempio 3: selezione delle righe in un frame dati utilizzando i valori della colonna utilizzando il DF.funzione query ()

Un'altra tecnica per filtrare le righe in un frame dati in base ai valori della colonna è utilizzando il "Query ()" metodo. Questo metodo comprende l'espressione che restituirà un valore booleano, controlla la condizione su tutte le righe in un telaio di dati e restituisce un frame di dati con solo quelle righe che soddisfano la condizione.

Abbiamo invocato il "DF.funzione query () ". Qui "DF" è il telaio di dati che si chiama "Test". Tra le parentesi del metodo, abbiamo specificato la condizione. L'espressione che abbiamo definito è da "ST_ID" in cui ID è uguale a "10". La funzione "query ()" estraggerà tutte le righe nel frame dati "test" che corrisponde a questa condizione. Il risultato verrà salvato nella variabile "estratto". Infine, i dati memorizzati nella variabile "estratto" vengono visualizzati chiamando il metodo "print ()".

La schermata di output mostra una singola riga perché esiste un solo record associato a "ST_ID" come "10". Puoi vedere che il record si trova sull'indice "0" che è la prima riga nel frame dati.

Esempio 4: selezione delle righe in un frame dati utilizzando i valori della colonna utilizzando il metodo ISIN ()

L'ultima strategia di cui stiamo discutendo qui per selezionare le righe è il metodo "isin ()". Prende una serie o un elenco di valori ed estratti in base ai valori dell'elenco.

Abbiamo definito un elenco di valori come "iterazione" che sta avendo questi valori: "Adamo", "Elsa" e "George". Il "df.la funzione isin () "viene invocata. Il nome del frame dati e il nome della colonna sono forniti con il metodo "isin ()". Tra le parentesi graffe, viene fornita l'elenco "iterazione". Quindi, controllerà la colonna di dati "test" "ST_NAME" per i valori memorizzati nell'elenco. Se trova i valori, restituirà semplicemente la riga selezionata. Abbiamo preservato il risultato nella variabile "Store" e lo abbiamo visualizzato usando il metodo "Print ()".

Questo ci produce tre righe che corrispondevano ai valori nell'elenco.

Conclusione

La selezione di righe specifiche per valori in un telaio di dati è una tecnica utile. Abbiamo dimostrato una varietà di metodi per recuperare le righe in base ai valori della colonna. Per prima cosa ti abbiamo fatto imparare la costruzione di un telaio di dati, quindi abbiamo elaborato 4 esempi utilizzando strategie diverse per estrarre righe. Tutte le illustrazioni sono state compilate ed eseguite su The Spyder.