Pandas reindEx

Pandas reindEx

"In" Pandas ", possiamo archiviare molte informazioni in forma tabulare, che è anche conosciuta come il frame dati. Il "Panda" ci facilita il metodo "DataFrame ()" per la costruzione del Frame Data. Il frame dati contiene indici e possiamo anche modificare gli indici del frame dati utilizzando le funzioni di "panda". Il metodo che utilizziamo per la reindexing del frame dati è il metodo "reindEx ()". Questo metodo aiuta a modificare i valori dell'indice della riga e i valori dell'indice delle colonne. Utilizzando questo metodo, possiamo modificare l'indice predefinito del frame dati e anche possiamo modificare l'indice che abbiamo impostato durante la creazione di dati di dati. Utilizzeremo il metodo "reindEx ()" nei nostri esempi "panda" in questo tutorial e spiegheremo questo concetto qui."

Esempio # 01

Lo strumento "Spyder" ci aiuta a sviluppare il codice "Panda" qui in questo tutorial e iniziamo il nostro codice con la parola chiave "importazione", che aiuterà a importare la funzione "panda". Posizioniamo "panda come PD" dopo aver digitato "l'importazione". Dopo questo, creiamo il telaio dati digitando "PD.DataFrame () ". Scriviamo questo "PD" qui perché "DataFrame ()" è il metodo di "Panda". Il "value_df" è il nome della variabile in cui viene salvato il telaio dati. Aggiungiamo "RandomName", che è il nome della colonna e il "RandomName" contiene "Thomas, Oscar, Lilly, Rowan, John, Bromley, Peter, Alexander e Samuel".

Quindi, abbiamo "valore_1", in cui abbiamo inserito "16, 29, 24, 35, 44, 50, 69, 74 e 88". Quindi arriva "value_2" e abbiamo aggiunto "25, 38, 42, 56, 54, 65, 78, 89 e 99". Ora, il "valore_3" arriva dopo e posizioniamo "36, 48, 52, 69, 74, 75, 87, 91 e 69". La colonna "Value_4" è presente dopo questo, dove abbiamo inserito "52, 64, 72, 88, 82, 95, 97, 21 e 39". L'ultima colonna è la colonna "Value_5" qui e in questa colonna, i valori che abbiamo aggiunto sono "66, 78, 82, 99, 34, 45, 57, 61 e 89". Dopo questo, utilizziamo la funzione "print ()" in cui viene aggiunta "valori_df". Stampa sul terminale.


Dopo aver premuto "Shift+Enter", possiamo facilmente ottenere il risultato dei nostri codici nell'app "Spyder". Qui, questo codice restituisce il frame dati con l'indice predefinito. Ora applicheremo il metodo "ReinDex ()" per reindicizzare questo frame dati in "Panda".


La funzione "ReinDex ()" viene utilizzata qui per il valore del valore dell'Indice della riga. Nel frame dati sopra, è possibile vedere che vengono visualizzati i valori dell'indice predefinito della riga e ora stiamo applicando il metodo "reindex ()" per reindexing di quegli indici di riga. Posizioniamo il nome del Frame Data e quindi il metodo "ReinDex ()" in cui posizioniamo quei valori dell'indice che vogliamo aggiungere al Frame Data Frame sopra. Mettiamo "ind_a, ind_b, ind_c, ind_d, ind_e, ind_f, ind_g, ind_h e ind_i" nella funzione "reindex ()". Quindi, gli indici di queste righe verranno aggiornati sul frame dati quando eseguiamo questo codice.


I valori dell'indice della riga vengono visualizzati in questo risultato e si può notare che i valori di dati non vengono visualizzati qui e sono comparsi i valori "nan". Questo perché i nuovi valori dell'indice non corrispondono ai precedenti valori dell'indice del frame dati. Quando il nuovo indice e il vecchio indice non corrispondono, allora mostra "nan" lì. Questi valori "nan" vengono visualizzati per impostazione predefinita quando cambiamo l'indice e non corrisponde all'indice precedente.

Esempio # 02

Ora stiamo modificando i valori dell'indice della colonna del "valore_df", che abbiamo precedentemente creato nell'esempio 1. Dopo aver stampato il "value_df", mettiamo la variabile "colonna" e abbiamo aggiunto alcuni valori ad essa. Aggiungiamo "A_1, B_1, C_1, D_1 ed E_1". Ora, vogliamo regolare questi valori come indice delle colonne, quindi, per questo, stiamo usando il metodo "ReinDex ()" e posizionare il nome della variabile "colonna" in cui sono archiviati i nuovi valori dell'indice della colonna Imposta anche l '"asse" su "colonne", quindi aggiornerà l'indice dell'asse della colonna. Mettiamo il metodo "reindex ()" in "print ()", quindi renderà anche sul terminale.


Come abbiamo utilizzato il metodo "reindex ()", i valori dell'indice di colonna che sono presenti nel primo telaio di dati vengono aggiornati e vengono aggiunti nuovi valori nel frame dati aggiornato. È inoltre possibile notare che tutti i valori del frame dati vengono convertiti in "NAN" perché entrambi i valori dell'indice delle colonne sono diversi.

Esempio # 03

Il "programmazione_data" in questo codice contiene "P_Languages", in cui abbiamo aggiunto "JavaScript, CSS, Web Engineering, OOP, C#, AI, Java e JavaScript". Quindi, abbiamo "ore" in cui posizioniamo "4_HRS, 2_HRS, 3_HRS, 7_HRS, 6_HRS, 5_HRS, 8_HRS e 6_HRS". Successivamente, viene inserito il "P_Code" e inseriamo "11523, 12423, 12321, 11456, 11454, 12267, 13106 e 14123". Aggiungiamo la variabile "P_INDEX" e mettiamo "Pro_a, Pro_b, Pro_C, Pro_d, Pro_e, Pro_f, Pro_g e Pro_H".

Questi valori verranno utilizzati come valori dell'indice delle righe. Modifichiamo il frame dati "Programming_data" nel frame dati "Programming_DF". Aggiungiamo anche il "p_index" a questo frame dati utilizzando il metodo "indice". Mettiamo "programmazione_df" e quindi il metodo "indice" e assegniamo il "p_index" a questo. Ora, i valori dell'indice di cui sopra vengono aggiunti come valori dell'indice delle righe al frame dati. Stampiamo anche il "programmazione_df".

Successivamente, aggiungiamo alcuni nuovi valori dell'indice nella variabile "new_index" e questi sono "P_1, P_2, P_3, P_4, P_5, P_6, P_7 e P_8". Dato che vogliamo aggiornare i valori dell'indice delle righe, utilizziamo il metodo "reindex ()" e mettiamo "new_index" come parametro di questa funzione e memorizziamo anche il frame dati aggiornato nel "newprogramming_df" e posizioniamo il "newprogramming_df" in " print () "per la visualizzazione.


I valori dell'indice vengono aggiornati e possiamo anche dire che abbiamo reinded il telaio di dati che abbiamo creato. Tutti i valori del frame dati vengono anche convertiti in "NAN" perché entrambi i valori dell'indice sono diversi.

Esempio # 04

Attualmente stiamo alterando i valori dell'indice "Programming_DF" delle colonne, che abbiamo precedentemente sviluppato nell'esempio 3. Posizioniamo la variabile "colonna" e inseriamo nuovi valori in essa. La variabile "P_Code, P_Languages, Hours e New" viene aggiunta alla variabile "colonna". Quindi, utilizziamo nuovamente il metodo "Reindex ()" in cui impostiamo la variabile "Colonna", che aggiornerà i valori dell'indice della colonna precedente e aggiungerà questi nuovi valori dell'indice di colonna al Frame Data.

Qui, puoi notare che i nuovi valori che abbiamo aggiunto in "colonna" sono gli stessi che abbiamo aggiunto nel frame dati sopra, ma la sequenza è diversa, quindi cambierà la sequenza delle colonne e regolerà tutte le colonne come noi menzionato nella variabile "colonna". Inoltre, aggiungiamo un altro valore dell'indice che non è presente nel frame dati sopra, che è "nuovo" qui, quindi i valori "nan" appariranno in questa colonna.


La sequenza delle colonne viene modificata qui e tutti i valori vengono visualizzati in quanto è presente nelle colonne di dati originali e la colonna "nuova" nel frame dati aggiornato contiene tutti i valori "nan" perché questa colonna non è presente nel frame dati originale.

Conclusione

Abbiamo presentato questo tutorial che ci aiuta a comprendere in dettaglio la nozione di "reindex di panda". Abbiamo discusso di come possiamo reindilare la colonna di un frame dati e i valori dell'indice della riga. Abbiamo spiegato che la funzione "reindex ()" di "panda" è utilizzata per farlo. Abbiamo fatto diversi esempi in cui abbiamo modificato i valori dell'indice delle righe del frame dati e anche i valori dell'indice dell'indice di colonna del frame dati. Abbiamo reso i risultati di tutti i codici che abbiamo fatto qui in questo tutorial e li abbiamo anche spiegati in profondità.