INDICE CAMBIAMENTO PANDAS

In questo articolo, proveremo a insegnarti come impostare l'indice di Pandas DataFrame utilizzando un elenco di etichette o le colonne già esistenti. Copriamo tutte le situazioni in cui sono assegnate le nuove etichette di riga o le esistenti devono essere modificate. La struttura tabulare nel pacchetto Pandas è chiamata data frame. Ogni riga e colonna è rappresentata dalla sua etichetta. Un indice è un'etichetta di riga, mentre un'etichetta di colonna è un indice o un intestazione di colonna. Python Panda per impostazione predefinita Definire un intervallo di numeri (a partire da 0) come indice per le righe quando si genera un telaio di dati. Ogni riga è identificata in modo univoco usando un indice di riga. Utilizzeremo la funzione set_index () per modificare gli indici delle righe nel frame dati che creeremo o che sono stati creati per impostazione predefinita.

Come modificare l'indice nelle colonne di panda

Possiamo creare una delle colonne nel frame dati nell'indice utilizzando il metodo Panda set_index. Per capire come funziona il metodo set_index (), diamo un'occhiata alla sua sintassi.

Sintassi per il frame dati.set_index

DataFrame.set_index (tasti, drop = true, append = false, inplace = false, verif_integrity = false)

Parametro

Chiavi: Nome di una colonna o un set di nomi di colonne.
gocciolare: Se vero, il valore booleano rilascia la colonna indice.
aggiungere: Se vero, aggiunge la colonna alla colonna indice già esistente.
a posto: Se vero, applica le modifiche al frame dati.
Verify_integrity: Se vero, controlla se ci sono duplicati nella nuova colonna indice.

Come abbiamo visto nella sintassi, ora vedremo come utilizzare la funzione set_index () per impostare o modificare gli indici di un frame di dati nei seguenti esempi.

Esempio 1: Impostazione dell'indice della funzione dati utilizzando set_index ()

Viene creato un frame di dati di esempio con alcune righe e colonne. Solo un semplice telaio di dati contenente un record di studenti "fittizio" viene creato qui. Il nome, l'età, l'oggetto e la tassa sono le quattro colonne o variabili nel frame dati “DF."

Per prima cosa abbiamo importato il modulo Pandas per utilizzare le funzionalità e le funzioni fornite dalla libreria. Quindi, un dizionario viene passato nei parametri del PD.DataFrame () funziona come un argomento per creare un data frame "DF".

Osserva che sul lato sinistro del frame dati visualizzato, c'è un numero all'inizio di ogni riga (i numeri da 0 a 6). Questi numeri sono noti come indici. Ora, utilizziamo il metodo Pandas set_index () per impostare l'indice del frame dati "DF". Per raggiungere questo obiettivo, dobbiamo digitare il nome del frame dati, seguito da un "punto" e quindi il nome del metodo che è "Imposta indice ()". Usiamo il nome della colonna tra le parentesi della funzione set_index ().

La colonna "Commissione" ha preso il posto del precedente indice intero (da 0 a 6). Abbiamo superato la colonna "Commissione" all'interno della funzione set_index () come argomento per impostarla come indice di riga del nostro telaio dati.

Esempio 2: impostazione dell'indice del frame dati utilizzando un elenco

Possiamo anche fornire al telaio dati un elenco di etichette che possono essere stringhe o numeri. Utilizziamo la funzione set_index () per creare un nuovo indice nel frame dati utilizzando l'oggetto elenco. Creiamo il nostro frame dati con dati fittizi dopo l'importazione dei moduli Pandas.

Il nostro frame dati è creato con tre colonne - "nome", "età" e "paese" - memorizzazione dei dati fittizi. Ora, utilizzando un elenco di etichette, viene creato un indice Python che passeremo al Frame dati.Imposta indice () funzione come input.

Abbiamo superato un elenco contenente le etichette degli indici di riga ['r1', 'r2', 'r3', 'r4', 'r5', 'r6'] al pd.indice () funzione e assegnato alla variabile "indice". La variabile viene quindi approvata come argomento all'interno della funzione tra parentesi della funzione set_index () per impostare gli indici del frame dati.

Come visto nel dato di data frame, il nostro elenco specificato ha sostituito l'indice predefinito del frame dati con le etichette ("R1", "R2", "R3", "R4", "R5", "R6").

Esempio 3: impostazione dell'indice del frame dati utilizzando più colonne

I dati dei dati in Python Panda con più di una riga o colonna come indice sono noti come frame di dati multi-indice. Utilizzo del frame dati.funzione set_index (), possiamo impostare diverse colonne come etichette di riga. Si dovrebbe capire che l'impostazione di più di un indice rende complicato il nostro telaio dati. L'indice può essere strutturato in diversi modi. Ti mostreremo come impostare le diverse colonne come indice in modo semplice. Creiamo prima il nostro telaio di dati.

Il nostro frame dati ha quattro colonne: "id", "nome", "corso" e "codice".

Da queste colonne, decidiamo quali colonne sono appropriate da utilizzare come indici del nostro frame dati. Dopo aver deciso le colonne adatte, passiamo un elenco con due etichette all'interno della funzione set_index ().

Le colonne "id" e "codice" sono impostate come indici di riga nel frame dati. Usando i nomi delle colonne all'interno dell'elenco e passandoli a set_index (), abbiamo assegnato queste colonne come indici. L'elenco ["id", "codice"] viene approvato come argomento di set_index (). Sia il nome che le colonne della regione sono i nuovi indici, come si vede nell'output.

Esempio 4: Impostazione dell'indice del frame dati utilizzando Python Series

Un frame dati multi-indice può essere creato assegnando nuove serie utilizzando "DataFrame.Funzione set_index () ”Quando dobbiamo modificare l'indice intero esistente con alcune serie Pandas anziché le colonne del Frame Data. Creiamo prima un frame dati passando un dizionario all'interno del PD.Funzione DataFrame () per dimostrare come una serie può essere passata come indici di primo e secondo livello di DataFrame.

Ora creiamo una serie passando un elenco di numeri interi all'interno delle parentesi del PD.Funzione serie (). Assegniamo questa serie alla variabile "N".

Come visto nel data frame dati, la nostra serie "N" e "N ** 2" sono impostate come indici del primo e di secondo livello.

Esempio 5: Impostazione dell'indice del frame dati utilizzando Python Range

Supponiamo che dobbiamo specificare una serie di numeri interi come indice del telaio dati in modo che possa iniziare a qualsiasi numero. Ad esempio, vogliamo avviare il numero ID per i dati dei dati dipendenti a 1. Non è possibile utilizzare il frame dati.funzione set_index () con un elenco di tutti i numeri come input. Il metodo Python Range () può essere utilizzato in questa situazione. Utilizzando la funzione intervallo (), possiamo creare un indice Pandas che possiamo quindi passare al frame dati.Imposta la funzione indice (). Creiamo un frame dati in modo da poter sostituire la sua row_index utilizzando la funzione intervallo ().

Abbiamo creato il nostro frame dati con le colonne "nome", "rango", "bonus" e "stipendio". Ora, impostiamo l'indice utilizzando la funzione Range () al posto dell'indice intero predefinito. Il metodo intervallo () restituisce una serie di numeri che inizia a 0 per impostazione predefinita, aumenta di 1 (per impostazione predefinita) e termina prima di un numero specificato.

Abbiamo specificato l'intervallo di indice per iniziare a 1, aumentare di 1 e terminare prima di 6. Dopo aver specificato l'intervallo di indice, abbiamo superato la variabile "indice" nella funzione set_index () come input per impostare l'indice di riga del nostro telaio dati.

Conclusione

In questo tutorial, abbiamo discusso degli indici di un telaio di dati e di come impostare i nuovi indici in un frame di dati esistente. Abbiamo visto che il costruttore Python crea un indice intero per ogni riga per impostazione predefinita, ma può essere modificato utilizzando la funzione set_index (). Abbiamo visto la sintassi della funzione set_index () in questo tutorial e implementato i più esempi per insegnare come impostare il indice di riga del telaio di dati usando elenchi, serie e colonne in Panda.

Pitone

Python non tutti gli argomenti convertiti durante la formattazione della stringa

Questo errore può essere risolto correggendo la sintassi dell'operatore %, utilizzando la funzione f...

Dr. Ursula Marini

OS Windows

Cos'è Windows Package Manager

Windows Package Manager o Winget è uno strumento potente per l'installazione e la gestione dei pacch...

Dante Palumbo

Pitone

PANDAS Read_CSV Multiprocessing

Per migliorare la velocità di caricamento dei dati, compresi i suoi benefici e limitazioni il PD.la ...

Nick Marini