Indicizzazione dei dati di Panda Data

Indicizzazione dei dati di Panda Data
In Panda, l'indicizzazione prevede la raccolta di colonne specifiche e righe di dati da un telaio di dati. Scegliere tutte le righe e persino alcune colonne, parte delle righe e tutte le colonne, o alcune di ciascuna delle righe e delle colonne è ciò che l'indicizzazione comporta. La selezione del sottoinsieme è un altro nome per l'indicizzazione. Quando costruiamo un oggetto Panda DataFrame in Python usando il PD.Funzione DataFrame () Dal modulo Pandas, un indirizzo negli indici di riga o colonna viene automaticamente prodotto per simboleggiare ciascun elemento/punto di dati all'interno del data frame. Tuttavia, gli indici di riga sono l'indice di DataFrame, mentre gli indici di colonna sono semplicemente indicati come colonne. L'indice dell'oggetto DataFrame Pandas identifica essenzialmente determinate righe. Diamo un'occhiata a come modificare l'oggetto dati dell'indice del panda.

Esempio 1

L'opzione indice in Python può essere utilizzata per impostare l'indice di un telaio di dati mentre viene creato. Genereremo un elenco e lo passeremo al PD.Parametro indice del metodo DataFrame (). Mettiamolo in pratica con il codice Python. Abbiamo importato il modulo Pandas qui. Successivamente, abbiamo creato un dizionario e un elenco di Python. Il dizionario è stato utilizzato per avviare lo sviluppo di dati. Come puoi vedere, abbiamo utilizzato la funzione DataFrame con il parametro indice per creare la colonna "RR" l'indice.

Importa panda come PD
dd = 'name': ['Alex', 'ramen', 'Zayn', 'Travis', 'Scott'],
'Marks': [33, 66, 88, 67, 78],
"City": ["New York", "Los Angeles", "Chicago", "San Diego", "Dallas"]
RR = [1, 2, 3, 4, 5]
ff = pd.DataFrame (DD, index = RR)
Stampa (FF)

Vedere l'output nella seguente immagine.

Esempio 2

In Python, possiamo utilizzare vari metodi per creare l'indice di qualsiasi colonna o colonne esistenti di un oggetto Panda DataFrame. In questo scenario, utilizzeremo l'argomento Inplace del metodo Inplace del metodo Inplace del modulo Python Pandas. L'argomento Inplace è impostato su False per impostazione predefinita. Tuttavia, imposteremo il valore di Inplace su True in questo caso. La colonna esistente è passata al PD.Impostare il metodo indice () come nuovo indice sostituisce il vecchio indice di DataFrame. Vediamo come funziona.

Importa panda come PD
dd = 'name': ['Alex', 'ramen', 'Zayn', 'Travis', 'Scott'],
'Rollnum': ['1', '2', '3', '4', '5'],
"City": ["New York", "Los Angeles", "Chicago", "San Diego", "Dallas"]
ff = pd.DataFrame (DD)
print ("\ ninizial dataframe:")
Stampa (FF)
ff = ff.set_index ('rollnum')
print ("\ nfinal DataFrame:")
Stampa (FF)

L'output è indicato nella seguente screenshot.

Esempio 3

In questo caso, useremo l'argomento DROP della funzione Set Index () del modulo Python Pandas. Tuttavia, imposteremo l'argomento di caduta su False in questo caso. In modo che il frame dati non perda la colonna che è stata assegnata come nuovo indice. Mettiamolo in pratica con il codice qui sotto.

Importa panda come PD
dd = 'rollnum': ['1', '2', '3', '4', '5'],
'Nome': ['Alex', 'Ramen', 'Zayn', 'Travis', 'Scott'],
'Marks': [33, 66, 88, 67, 78]
ff = pd.DataFrame (DD)
print ("\ ninizial dataframe:")
Stampa (FF)
ff = ff.set_index ('name', drop = false)
print ("\ nfinal DataFrame:")
Stampa (FF)

Ecco il risultato.

Esempio 4

Creando un elenco di nomi di colonne DataFrame e passandolo alla funzione Set Index (), possiamo impostare diverse colonne dell'oggetto Panda DataFrame proprio come il suo indice. Di conseguenza, l'indice viene definito multi-indice in questo scenario.

Importa panda come PD
dd = 'rollnum': [1, 2, 3, 4, 5],
'Nome': ['Alex', 'Ramen', 'Zayn', 'Travis', 'Scott'],
'Marks': [33, 66, 88, 67, 78],
"City": ["New York", "Los Angeles", "Chicago", "San Diego", "Dallas"]
ff = pd.DataFrame (DD)
print ("\ ninizial dataframe:")
Stampa (FF)
ff = ff.set_index (['rollnum', 'name'])
print ("\ nfinal DataFrame:")
Stampa (FF)

Qui puoi vedere l'output del codice sopra indicato.

Esempio 5

Diverse tecniche possono essere utilizzate per impostare la posizione dell'oggetto Panda DataFrame su qualsiasi oggetto Python, come un elenco, un intervallo o persino una serie. Usando il PD.Funzioni indice (), set indice () e intervallo (), possiamo impostare l'indice dell'oggetto dati (PANDAS) in questo approccio. Innanzitutto, utilizzeremo la funzione Range () per costruire una sequenza di numeri interi Python, che poi invieremo al PD.Funzione indice (). Questo metodo produce l'oggetto indice del frame dati. L'oggetto indice DataFrame di restituzione viene quindi impostato come nuovo indice del Frame dati utilizzando la funzione Set Index (). Implettiamo questo codice.

Importa panda come PD
dd = 'rollnum': [1, 2, 3],
'Nome': ['Alex', 'Ramen', 'Zayn'],
'Marks': [33, 66, 88],
'City': ['New York', 'Los Angeles', 'Chicago']
ff = pd.DataFrame (DD)
print ("\ ninizial dataframe:")
Stampa (FF)
my_list = ['i', 'ii', 'iii']
idx = pd.Indice (my_list)
ff = ff.set_index (idx)
print ("\ nfinal DataFrame:")
Stampa (FF)

Vedere l'output di seguito.

Esempio 6

L'indice dell'oggetto DataFrame Pandas può essere impostato utilizzando l'indice SET () e PD.Metodi di indice (). Inizieremo creando un elenco di Python, che invieremo al PD.Funzione indice (). Questa funzione fornirà un oggetto indice di dati di dati. L'oggetto indice DataFrame di restituzione viene quindi impostato come nuovo indice del Frame dati utilizzando la funzione Set Index ().

Importa panda come PD
dd = 'rollnum': [1, 2, 3, 4, 5],
'Nome': ['Alex', 'Ramen', 'Zayn', 'Travis', 'Scott'],
'Marks': [33, 66, 88, 67, 78],
"City": ["New York", "Los Angeles", "Chicago", "San Diego", "Dallas"]
ff = pd.DataFrame (DD)
print ("\ ninizial dataframe:")
Stampa (FF)
indx = pd.Indice (intervallo (1, 6, 1))
ff = ff.set_index (indx)
print ("\ nfinal DataFrame:")
Stampa (FF)

Il risultato è riportato nello screenshot allegato.

Esempio 7

Usando il PD.Series () e set indice () funzioni, possiamo impostare l'indice dell'oggetto dati di Panda nel metodo precedente. Generare un elenco e passarlo al PD.La funzione Series () restituirà un seriale Pandas che può essere utilizzato come oggetto indice DataFrame. La serie Pandas risultante viene passata al metodo Set Index (), che lo imposta come nuovo indice del Frame Data. Vediamo il seguente codice e capiamo come funziona.

Importa panda come PD
dd = 'rollnum': [1, 2, 3, 4, 5],
'Nome': ['Alex', 'Ramen', 'Zayn', 'Travis', 'Scott'],
'Marks': [33, 66, 88, 67, 78],
"City": ["New York", "Los Angeles", "Chicago", "San Diego", "Dallas"]
ff = pd.DataFrame (DD)
print ("\ ninizial dataframe:")
Stampa (FF)
ser_indx = pd.Serie ([5, 4, 3, 2, 1])
ff = ff.set_index (ser_indx)
print ("\ nfinal DataFrame:")
Stampa (FF)

Qui puoi vedere l'output.

Conclusione

L'indicizzazione è il processo di selezione dei valori da righe e colonne specifiche in un frame dati. Possiamo scegliere tutte le righe e alcune colonne o righe e tutte le colonne che utilizzano l'indicizzazione. Questa sessione ha discusso di argomenti come quello che è l'indice e come è possibile impostare l'indice durante la generazione di un frame dati, il modo in cui è possibile impostare le colonne di dati esistenti come indice o persino multi-indice e come è possibile impostare oggetti Python come l'intervallo, l'elenco, o anche serie come indice.