Panda selezionare riga per indice

Panda selezionare riga per indice
La selezione delle righe da un telaio di dati potrebbe essere necessaria per una varietà di attività di analisi dei dati. Quando si selezionano determinate righe e campionamento di dati di dati Pandas e serie, viene impiegata la tecnica Pandas “Iloc []” per l'indicizzazione basata su interi.

Puoi usarlo seguendo la sintassi data:

Solo gli input con valori interi sono gestiti dalla proprietà "Iloc []". Questi input, tuttavia, possono essere passati in diversi modi.

Imparerai vari approcci alla sottomissione dei dati di dati Pandas utilizzando la proprietà "Iloc []" in questo tutorial.

Esempio 1:

Per selezionare una singola riga nel DataFrame per indice, esamineremo la dimostrazione pratica del "DF.Metodo Iloc [] "fornito da Panda.

La compilazione e l'esecuzione degli esempi saranno eseguite nello strumento "Spyder". Quindi, abbiamo lanciato lo strumento e cercato le librerie necessarie. Abbiamo scoperto che il toolkit "panda" è ciò di cui abbiamo bisogno per lavorare con i metodi per selezionare le righe. La libreria Pandas viene importata nel programma e "PD" è impostata come alias. Ovunque nel codice, dobbiamo chiamare Panda, usare "PD" anziché "Panda".

Il primo utilizzo del toolkit Panda arriva quando dobbiamo generare un frame di dati Panda utilizzando il "PD.Metodo DataFrame () ". Chiamiamo il "PD.Funzione DataFrame () "e specificare i valori per esso. Volevamo che creasse un telaio di dati con 3 colonne: "montagne", "altitudine" e "continente". I valori sono stati identificati per ciascuna colonna e la lunghezza della colonna viene mantenuta uguale per tutte le colonne.

La colonna "montagne" tiene i nomi delle catene montuose che sono "Karakoram", "Hindu Kush", "Alaska Range", "Himalaya" e "Andes". La seconda colonna "Altitude" memorizza la lunghezza in metri di queste catene montuose. I valori per questa colonna sono "8611", "7708", "6194", "8848" e "6961". L'ultima colonna "Continente" sta avendo il nome del continente in cui si trovano queste montagne: "Asia", "Asia", "N_America", "Asia" e "S_America".

Il costruttore di dati di dati, se chiamato, crea un frame dati con i dati forniti. Ma se lo chiamiamo di nuovo nello stesso programma con nuovi dati, perderà quello precedente. Questo perché non trova alcuna memoria per inserire il frame dati. Siamo tenuti a creare uno spazio per preservarlo. Per mantenere il Frame Data per poterlo utilizzare in seguito, abbiamo creato un oggetto DataFrame "Facts". Memorizzerà il frame dati con colonne e righe specificate.

Per visualizzare il risultato, Python ci fornisce un metodo semplice che è il metodo "print ()". Prende solo l'input e lo espone sul terminale. L'input può essere una funzione, una variabile/oggetto, un'operazione matematica o una stringa da visualizzare. Dal momento che vogliamo visualizzare il nostro Frame Data di nuova creazione, abbiamo fornito l'oggetto DataFrame "fatti" come input per il metodo "Print ()" di Python.

Per eseguire lo script, abbiamo premuto i tasti "Shift+Enter". Ecco il nostro telaio di dati con 3 colonne e 5 righe presentate sul terminale che può essere vista nell'istantanea seguente.

Ora, verrà esplorato il recupero di una singola riga nel frame dati fornito. La selezione si basa sull'indice. Per questo, il Frame Data Pandas ha la proprietà “DF.iloc [] ". Solo i valori interi possono essere passati in questo metodo per la selezione.

Abbiamo usato il "DF.Proprietà iloc [] "subito dopo aver visualizzato il frame dati. Il nome dei nostri "fatti" di dati è fornito con il metodo "Iloc []". Tra le staffe quadrate della proprietà, il numero dell'indice, della riga che vogliamo estrarre, è specificato. Qui abbiamo fornito il numero dell'indice "3". Quindi la proprietà "Iloc []" esaminerà il telaio di dati "fatti" e cercherà la riga con l'indice numero 3. Corrisponderà all'indice che abbiamo fornito con ogni indice del frame dati e selezionerà la riga che è uguale al numero dell'indice di input. Dopo aver recuperato la riga, verrà inserito nella variabile "Box" che abbiamo creato per archiviare il risultato della proprietà "Iloc []". Infine, il risultato verrà mostrato sulla console utilizzando il metodo "Print ()".

La riga con indice 3 viene recuperata. Puoi vederlo nell'immagine qui sotto. La riga con l'indice numero 3 ha una montagna chiamata Himalaya, l'altitudine è 8848 e il continente è Asia. Inoltre, il tipo di dati per questa riga menzionata è "oggetto".

Esempio n. 2:

Nell'illustrazione sopra, abbiamo imparato a selezionare una singola riga per indice utilizzando la proprietà Pandas DataFrame "Iloc []". Questa istanza parlerà della selezione di più righe in un frame dati per indice.

Abbiamo impiegato il "DF.Proprietà iloc [] ". Stiamo utilizzando anche il telaio di dati sopra creato in questa istanza. Il nome di dati "Fatti" è scritto con la proprietà "Iloc []" e all'interno del suo operatore di abbonamento, abbiamo utilizzato un'altra fascia quadrata per specificare più indici. Se non aggiungi la staffa 2nd quadrata, lancerà un errore. Gli indici che abbiamo selezionato per visualizzare sono "0", "2" e "4". Quindi estraggerà le file 1, 3 e 5. Il risultato verrà archiviato nella variabile "multipla". La funzione "Print ()" mostrerà l'output.

Le 3 righe selezionate sono state visualizzate sul terminale.

Oltre a selezionare più righe in un frame dati, è anche possibile selezionare quali colonne devono essere visualizzate con le righe.

All'interno delle staffe quadrate del metodo "Iloc []", abbiamo definito gli indici per le righe e gli indici della colonna da selezionare. Nel primo operatore del pedice, abbiamo menzionato gli indici per le righe come indici "1", "2" e "3" e colonne nel 2 ° come "0" e "2". L'uscita viene presentata utilizzando il metodo "print ()".

Tre righe con 2 colonne sono state selezionate nel frame dati risultante.

Esempio # 3:

L'ultima tecnica per esercitare la proprietà "Iloc []" è per la selezione delle righe per valore dell'indice verrà messa in pratica in questo esempio.

Quando si tratta di selezionare un gran numero di righe in un telaio di dati dai valori dell'indice, richiede molto tempo per specificare gli indici delle righe uno per uno, specialmente quando si tratta di set di dati di grandi dimensioni. Qui la proprietà Pandas DataFrame “Iloc []” ci consente di fornire una gamma di valori.

Abbiamo esercitato il "DF.Proprietà iloc [] "con il telaio di dati generato in prima istanza. L'intervallo dei valori dell'indice è specificato come "1: 4". Qui "1" è il numero dell'indice iniziale e "4" è l'ultimo valore dell'indice. Selezionerà i valori tra questo intervallo incluso il valore dell'indice iniziale ma escluso il valore dell'ultimo indice specificato. La variabile "intervallo" viene creata per contenere l'output ". La funzione "Print ()" è invocata per mostrare il risultato.

Questo ci dà il frame dati che può essere visto nell'immagine di output allegata di seguito.

Conclusione

In questo articolo, abbiamo discusso della selezione di righe in un frame di dati utilizzando i valori dell'indice. Abbiamo utilizzato il frame dati Pandas “DF.Proprietà iloc [] "per ottenere i risultati desiderati. Varie tecniche per impiegare la proprietà "Iloc []" sono state spiegate e implementate utilizzando i codici di esempio. Il primo esempio ci dice il modo di estrarre una singola riga per indice, la seconda illustrazione ha funzionato sulla selezione di più righe per indice e righe selezionate anche con colonne specificate e l'ultima istanza ha dato un'idea di input dell'intervallo di valori dell'indice.