I panda ottengono i valori dell'indice

I panda ottengono i valori dell'indice

Gli indici delle righe sono noti come indici di dati, mentre gli indici delle colonne sono noti come nomi di colonne generali. Gli indici vengono utilizzati principalmente per recuperare i dati o archiviare i dati all'interno del frame dati. Tuttavia, possiamo anche recuperare l'indice stesso usando il .Proprietà indice. In questo tutorial, ti insegneremo come ottenere un indice come oggetto di elenco, come è possibile convertire l'indice in una colonna di dati per recuperarlo e come è possibile ottenere l'indice utilizzando più condizioni e la proprietà indice di Pandas.

Come ottenere i valori dell'indice nei panda?

Il frame dati.La proprietà indice può essere utilizzata per ottenere un indice di dati Pandas. Un oggetto Elenco indice contenente l'indice del Frame Data viene restituito utilizzando DataFrame.Proprietà indice.

Sintassi:

panda.INDICE (Data = Nessuno, dType = Nessuno, copia = false, Nome = Nessuno, tupleize_cols = true, ** kwargs)

Dove:

dati: Array-simile (unidimensionale)

dtype: Numpy dtype. È "oggetto" per impostazione predefinita. Sceglieremo il dType adatto ai dati se dType è "nessuno". Se un dType è specificato e sicuro, il dtype verrà forzato. In caso contrario, verrà visualizzato un avviso.

copia: bool. Verrà fatta una copia del dato ndarray.

nome: oggetto. Il nome che viene archiviato nell'indice.

tupleize_cols: bool. Per impostazione predefinita, è vero. Se vero, proverà a creare un multiindex.

I metodi per ottenere l'indice del telaio dati sono dimostrati negli esempi seguenti.

Esempio # 01: estrarre l'indice di riga di dati utilizzando la proprietà NDEX

Creiamo prima un frame dati. Prima di creare il frame dati, importare il modulo Pandas per utilizzare le sue funzioni.

Importa panda come PD
Student_Info = [('Tyson', 23),
('Jack', 25),
('Bruce', 25),
('Peter', 24),
('Nick', 21),
('Haris', 26),
('Randy', 25)
"
df = pd.DataFrame (Student_Info, Columns = ['Name', 'Age'])

Usando un elenco all'interno del PD.Funzione DataFrame (), abbiamo creato il nostro dataframe. Ci sono due colonne nel nostro telaio di dati: nome ed età. La colonna "Nome" sta archiviando i nomi di alcune persone casuali ("Tyson", "Jack", "Bruce", "Peter", "Nick", "Haris", "Randy"). Considerando che la colonna "età" è costituita dall'età di ogni persona (23, 25, 25, 24, 21, 26, 25). All'inizio di ogni riga, esiste un valore dell'indice per ogni riga creata dal costruttore Panda per impostazione predefinita. Ora useremo la proprietà indice per estrarre questa colonna indice.

df.indice

L'output mostra che le righe iniziano da 0, aumentano di 1 e terminano sull'indice prima di 7.

Per stampare ogni valore dell'indice, possiamo usare un iteratore e al suo interno o la funzione di stampa ().

i = df.indice
per x in i:
Stampa (x)

Ora, abbiamo stampato tutti i valori dall'indice da 0 a 7.

Esempio # 02: estrarre l'indice di riga di dati utilizzando una condizione

I valori dell'indice possono essere recuperati specificando una condizione. La proprietà dell'indice raggiungerà i valori dell'indice del telaio di dati che soddisfano la condizione specificata. Quindi, useremo la funzione Tolist () per restituire i valori recuperati come elenco. Usando il PD.Funzione dataframe (), creiamo prima il nostro dati dati.

Importa panda come PD
df = pd.DataFrame (
'Item': ['a', 'b', 'c', 'd', 'e', ​​'f', 'g', 'h',
'Price': [100, 200.150, 100, 200, 320, 100, 100],
'Codice': ['Q', 'W', 'e', ​​'r', 't', 'y', 'u', 'i'
)

Usando un dizionario Python all'interno del PD.Funzione DataFrame (), abbiamo creato un dataframe. Il nostro telaio di dati è composto da tre colonne e 8 righe da 0 a 7. La colonna "elementi" sta memorizzando i valori dei dati come stringa ("a", "b", "c", "d", "e", "f", "g", "h"). La colonna "Price" contiene i valori numerici che rappresentano il pezzo di ciascun articolo (100, 200, 150, 100, 200, 320, 100, 100). Il codice di colonna con i valori dei dati ("Q", "w", "e", "r", "t", "y", "u", "). Ora, recuperiamo i valori dell'indice usando lo script di seguito.

i = df.indice
indice = df ["prezzo"] == 100
risultato = i [indice]
risultato.elencare()

Utilizzando la proprietà Index, abbiamo recuperato gli indici del frame dati "DF". Quindi, abbiamo specificato una condizione per estrarre dati in cui i valori nella colonna del prezzo sono pari a 100. Dopo aver ottenuto i dati, abbiamo recuperato i valori dell'indice delle righe che soddisfano la condizione specificata. Alla fine, la funzione Tolist () viene utilizzata per trasformare l'output in un oggetto Elenco. La funzione ha recuperato un elenco con quattro valori dell'indice, [0, 3, 6, 7].

Esempio # 03: estrarre l'indice della colonna DataFrame utilizzando la funzione get_loc ()

Abbiamo visto come recuperare i valori degli indici di riga di un frame dati. Tuttavia, possiamo anche recuperare i valori degli indici di colonna di un frame dati. Per ottenere il valore dell'indice della colonna di qualsiasi frame dati, è possibile utilizzare la funzione get loc (). Per trovare l'indice, forniamo semplicemente l'etichetta della colonna alla funzione get_loc (). Creiamo un telaio di dati costituito da più di una colonna in modo da poter recuperare la sua posizione indice o il valore dell'indice.

Importa panda come PD
df = pd.DataFrame (
'Class': ['a', 'a', 'b', 'b', 'c', 'c', 'd', 'd',
'Membri': [5, 4, 5, 5, 4, 6, 4, 4],
'Stipendio': [30000, 28000, 32000, 31000, 30000, 26000, 27000, 28000],
'Spese': [12000, 11000, 11500, 13000, 10000, 12500, 10500, 13000]
)

Nel nostro frame dati, abbiamo creato quattro colonne: classe, membri, stipendio e spese. La colonna Classe sta memorizzando i valori dei dati ("A", "A", "B", "B", "C", "C", "D", "D"). I membri della colonna contengono valori (5, 4, 5, 5, 4, 6, 4, 4), mentre lo stipendio e la spesa della colonna contiene i valori dei dati numerici (30000, 28000, 32000, 31000, 30000, 26000, 27000, 28000 ) e (12000, 11000, 11500, 13000, 10000, 12500, 10500, 13000), rispettivamente. Supponiamo di dover trovare il valore dell'indice dello stipendio della colonna:

df.colonne.get_loc ("stipendio")

La funzione ha recuperato l'indice della colonna specificata, 2.

Esempio # 04: estrarre i valori dell'indice della riga specificata usando la funzione get_loc ()

Possiamo anche recuperare la posizione dell'indice degli indici di riga utilizzando la funzione get_loc () se sono specificate le etichette per gli indici di riga. Possiamo specificare le etichette del nostro indice di riga utilizzando un elenco contenente nomi per ciascun valore dell'indice di riga. Aggiungiamo le etichette dell'indice al frame dati che abbiamo creato nell'esempio n. 3.

Importa panda come PD
df = pd.DataFrame (
'Class': ['a', 'a', 'b', 'b', 'c', 'e', ​​'d', 'd',
'Membri': [5, 4, 5, 5, 4, 6, 4, 4],
'Stipendio': [30000, 28000, 32000, 31000, 30000, 26008, 27000, 28000],
'Spese': [12000, 11000, 11500, 13000, 10000, 12500, 10500, 13000],
INDICE = ['r1', 'r2', 'r3', 'r4', 'r5', 'r6', 'r7', 'r'])

Dentro il pd.DataFrame () funzione, abbiamo specificato il parametro indice come elenco contenente etichette da R1 a R8. Le etichette 'R1', 'R2', 'R3', 'R4', 'R5', 'R6', 'R7' e 'R8' hanno sostituito l'indice intero per impostazione predefinita di DataFrame. Ora, recuperiamo la posizione dell'indice per un'etichetta specifica.

Stampa (df.indice.get_loc ("r5"))

Innanzitutto, la proprietà dell'indice viene applicata al telaio dati per ottenere gli indici. Poi, get_loc () La funzione viene applicata per estrarre la posizione dell'indice dell'etichetta indice specificata della riga.

Esempio # 05: estrarre i valori dell'indice di riga usando la funzione numpy dove ():

Possiamo anche ottenere i valori dell'indice specificando una condizione all'interno Dove() funzione di numpy. Creiamo prima un frame dati, importare i panda e la libreria numpy per utilizzare le sue funzioni.

Importa panda come PD
Importa Numpy come NP
df = pd.DataFrame (
'id': ['001', '002', '003', '004', '005', '006', '007', '008'],
'Price': [100, 150, 130, 200, 120, 170, 120, 140],
'Sconto': [30, 40, 10, 20, 60, 10, 30, 60])

Dopo aver importato le librerie richieste, abbiamo creato il nostro telaio. Nel nostro frame dati, abbiamo tre colonne (ID, prezzo e sconto). L'ID, il prezzo e lo sconto delle colonne memorizza i valori dei dati ('001', '002', '003', '004', '005', '006', '007', '008'), (100, 150 , 130, 200, 120, 170, 120, 140) e (30, 40, 10, 20, 60, 10, 30, 60), rispettivamente. Ora, troviamo il valore dell'indice di riga usando il Dove() funzione all'interno della funzione list ().

Elenco (NP.dove (df ["sconto"]> 30))
[array ([1, 4, 7], dType = int64)]

Abbiamo specificato una condizione all'interno della funzione Where () per ottenere le righe in cui il valore nella colonna "sconto" è maggiore di 30. Per creare un elenco con i valori restituiti, abbiamo usato il metodo List ().

Conclusione

Questo articolo ha riguardato come recuperare i valori dell'indice di dati di dati in panda. Abbiamo usato diverse funzioni per recuperare l'indice di riga e colonna del frame dati. Abbiamo implementato più esempi per insegnarti come estrarre l'indice di riga di dati utilizzando la proprietà dell'indice, usando le condizioni e utilizzando la funzione get_loc (). Inoltre, abbiamo discusso di come ottenere i valori dell'indice della colonna usando la funzione get_loc ().