Pandas Set Index

Pandas Set Index
La funzione "set_index" di Pandas viene utilizzata per definire il frame dati o la serie come chiave di un frame dati. La funzione "set_index ()" di Pandas crea l'indice di dati sfruttando colonne preesistenti. L'indice può sostituire o espandere il presente indice.

La sintassi per questo metodo è la seguente:

Il primo parametro "tasti" classifica il nome della colonna che vogliamo impostare come indice. L'attributo "Append" aggiunge la colonna fornita quando il valore dell'indice è impostato su True. Il parametro "Drop" rilascia le colonne. Il suo valore predefinito è "vero". Il "Inplace", se valutato come "vero", apporta le modifiche al frame dati originale e non ne crea alcuna copia. L'ultimo parametro "Verify_integrity" controlla la duplicazione del nuovo indice di colonna.

Impareremo l'esecuzione pratica di questo metodo attraverso varie tecniche in questo articolo.

Esempio n. 1: utilizzando il metodo set_index () per modificare la colonna indice

Questa dimostrazione approfondirà l'uso dei panda "df.Metodo set_index () "per modificare l'elenco dell'indice predefinito in un frame dati in una colonna indice definita dall'utente.

Lo strumento "Spyder" viene lanciato per iniziare a lavorare sulla compilation e sull'esecuzione dello script. Abbiamo prima caricato le librerie richieste nel programma. Il pacchetto di cui avevamo bisogno qui sono i "panda". Quindi, l'abbiamo importato come "PD".

Abbiamo generato un telaio dati utilizzando il metodo Pandas “PD.DataFrame () ". Hai la scelta di importare un file CSV o creare un frame dati utilizzando il "PD.Metodo DataFrame () ". Il "PD.Funzione DataFrame () "in Invocate con 4 colonne" EMP_NAME "," Experience "," Encome "e" Bonus ". Ogni colonna sta memorizzando 11 valori.

Abbiamo valori per la colonna "emp_name" come "A", "b", "c", "d", "e", "f", "g", "h", "i", "j", e "k". Le voci per la colonna "Experience" sono "5", "2", "17", "21", "9", "20", "11", "32", "23", "14", e "30". La terza colonna che abbiamo è "reddito" che sta archiviando questi valori "40000", "30000", "100000", "50000", "40000", "70000", "200000", "95000", "60000", "27000" e "98000". La colonna "Bonus" tiene questi valori "30000", "40000", "60000", "30000", "86000", "50000", "60000", "95000", "76000", "27000", e "78000".

Il "PD.Il metodo DataFrame () "costruirà un frame dati con questi valori forniti. Per archiviare DataFrame, abbiamo creato un oggetto DataFrame "Record". L'abbiamo assegnato l'output di chiamare il "PD.Funzione DataFrame () ". Infine, il contenuto è esposto sulla console esercitando la funzione "Print ()" di Python.

Quando eseguiamo il programma Python facendo clic sull'opzione "Esegui file", vediamo un frame dati con 4 colonne e 11 righe. Questo frame dati è stato visualizzato con l'elenco dell'indice predefinito che inizia da "0" e arriva fino alla lunghezza del frame dati.

Potrebbe essere necessario modificare la colonna indice del telaio di dati a volte. Qui impareremo a modificare la colonna indice in un telaio di dati utilizzando il "DF.Metodo set_index () ". Utilizzando questo metodo, modificheremo la colonna indice predefinita con una colonna esistente nel frame dati fornito.

Abbiamo invocato il "DF.Metodo set_index () ". Il nome del frame dati viene fornito come "record" con la funzione "set_index ()". Tra le parentesi di questa funzione, abbiamo fornito il nome della colonna che dobbiamo impostare come colonna indice nel frame dati risultante. La colonna che abbiamo citato è "EMP_NAME". Quindi, il metodo "set_index ()" esaminerà il telaio di dati "Registra", troverà la colonna etichettata come "emp_name" e la imposta come la colonna indice dopo aver lasciato cadere la colonna di indice predefinita. Il risultato viene salvato nella variabile "impostazione". Con l'aiuto della funzione "Print ()", l'abbiamo visualizzata sullo schermo.

La colonna indice di Output DataFrame viene modificata dall'elenco predefinito a "EMP_NAME". L'uscita risultante è fornita nell'immagine seguente.

Esempio n. 2: utilizzando il metodo set_index () per modificare l'indice in più colonne dell'indice

Quando si modificano l'indice del frame dati, possiamo impostare anche più di una colonna come indici del frame dati. Esploriamo il concetto attraverso il programma Python.

Per questa illustrazione, abbiamo utilizzato il frame dati creato nell'esempio precedente. Il "df.Viene invocato il metodo set_index () ". Abbiamo chiamato la funzione con i seguenti parametri: "chiavi", "Inplace", "Append" e "Drop". Le chiavi dell'indice che abbiamo fornito qui sono "emp_name" e "reddito". Sono state selezionate due colonne perché dobbiamo impostare più di una colonna come indici nel frame dati. Il parametro "Inplace" è impostato "true", il che significa che le possibilità saranno effettuate nel frame dati effettivo senza crearne alcuna copia.

Abbiamo impostato il valore "true" per l'attributo "Append". Mantenerlo vero aggiungerà le nuove colonne dell'indice con la colonna di indice già esistente o predefinita. L'ultima proprietà che abbiamo usato qui è "Drop" con il valore "falso". Quindi, non eliminerà le colonne che abbiamo impostato per l'indice dal frame dati. Poiché le modifiche sono preferite da apportare nel frame dati effettivo, quindi non è necessario creare alcun oggetto. Basta stampare il telaio di dati effettivo dopo aver impostato l'indice ci visualizzerà le modifiche. Abbiamo impiegato la funzione "print ()" per mostrare il risultato.

Viene visualizzato il nostro frame dati effettivo aggiornato che ha una colonna indice predefinita e le due colonne di indice di recente specifica come "emp_name" e "reddito".

Esempio n. 3: utilizzando il metodo set_index () per modificare la colonna indice con la colonna del valore float

Possiamo anche modificare la colonna dell'indice predefinito e impostare una colonna Float come indicizzatore nel frame dati. Vedremo la sua pratica implementazione qui.

Dobbiamo prima creare una colonna con valori fluttuanti nel frame dati. Il frame dati dalla prima istanza viene nuovamente utilizzato tranne che i valori nella colonna "bonus" sono ora galleggianti. Abbiamo fornito questi valori per la colonna "bonus": "30.87 "," 40.16 "," 60.98 "," 30.87 "," 86.32 "," 50.92 "," 60.11 "," 95.12 "," 76.24 "," 27.35 "e" 78.52 ". Quindi, abbiamo stampato il frame dati aggiornato utilizzando la funzione "print ()".

Viene mostrato il frame dati con la colonna "bonus" aggiornata.

Abbiamo invocato il "DF.Metodo set_index () "e imposta la colonna della chiave indice come" bonus ". Il parametro "Inplace" è valutato come "vero". Quindi le modifiche verranno apportate nel frame dati effettivo.

La colonna float è impostata come colonna indice nel frame dati che può essere visualizzata nell'immagine seguente.

Esempio n. 4: utilizzando il metodo set_index () per impostare il multiindex nella copia del frame dati

Possiamo impostare il multiindex nel frame dati utilizzando il metodo "set_index ()". Il metodo "set_index" è invocato con il nome del frame dati "Record". All'interno delle parentesi graffe, abbiamo inizializzato l'operatore del pedice e definito i nomi delle colonne come "emp_name" e "esperienza". Qui, abbiamo preferito eseguire la funzione con le impostazioni predefinite in cui "Inplace" è impostato come "falso". Le manipolazioni verranno eseguite nella copia del frame dati.

Per archiviare questa copia di dati di dati, abbiamo creato una variabile "Multi_Index". Infine, abbiamo mostrato il contenuto della copia del frame dati archiviato nella variabile "multi_index" utilizzando la funzione "print ()".

Questo ci dà il seguente risultato:

Conclusione

In questa sessione di apprendimento, abbiamo dimostrato la necessità di modificare la colonna indice in un telaio di dati. Panda ha fornito il metodo “DF.set_index ”è utilizzato in questo tutorial per ottenere il risultato desiderato. Abbiamo fornito la sintassi per utilizzare questa funzione con una breve descrizione dei parametri. Tutte le tecniche per esercitare la funzione "set_index ()" sono praticamente implementate sullo strumento Spyder. Possiamo utilizzare il metodo in base alla nostra necessità di voler impostare una singola colonna come chiave indice o più colonne.