Panda DataFrame Pivot

Panda DataFrame Pivot
Panda è la biblioteca di Python. Utilizziamo panda per molti scopi. Possiamo creare il telaio di dati in Panda e Pivot che viene fornito DataFrame. Per privare o rimodellare il frame dati, i panda forniscono il metodo "pivot ()". Un frame di dati specificato può essere riorganizzato utilizzando il metodo "Pivot ()" attraverso l'indice e i valori della colonna specificati. Quando vogliamo rimodellare il telaio dati, utilizziamo il metodo "Pivot ()". Quando utilizziamo il metodo "Pivot ()", deve utilizzare il valore di indice univoco. L'aggregazione dei dati non è supportata dal metodo "Pivot ()"; Valori multipli producono un multiindex nelle colonne. In questa guida, esploriamo in dettaglio il metodo "Pivot ()" nei panda. E ti daremo una dimostrazione visiva dei codici in cui rimodiamo il frame dati usando "Pivot ()".

Sintassi:

DataFrame.Pivot (self, indice = Nessuno, colonne = nessuna, valori = nessuna)

Esempio 1:

Mostreremo l'esempio pratico del metodo "Pivot ()" in Panda. Facciamo il codice Pandas nell'app "Spyder". Come sappiamo, dobbiamo importare alcune funzioni dei panda come "PD". Sviluppiamo questo codice, quindi applichiamo il metodo "Pivot ()". Questo metodo viene applicato al frame dati. Per prima cosa creiamo il telaio di dati qui. Il frame dati che sviluppiamo qui è chiamato "CARS_DATA" in cui aggiungiamo i dati relativi alle auto. Facciamo la prima colonna con il nome "Car_name" in cui aggiungiamo alcuni nomi di auto come "Wagonr, Swift, Lexus, Mehran, Mustang, Alto e Jaguar".

Inseriamo anche altre colonne che si chiamano "Car_model, Car_no e Challan". I dati in quelle colonne sono anche inseriti qui. La colonna "CAR_MODEL" contiene i numeri di modello delle auto che sono "2014, 2001, 2010, 2015, 2020, 2012 e 2019". La colonna "CAR_NO" contiene "R123, R456, R162, R102, S127, W190 e Z345". Quindi, abbiamo la colonna "Challan" in cui aggiungiamo i valori "500, 4000, 500, 6000, 2000, 1000 e 2000". Questo è il frame dati completo che contengono quattro colonne. Successivamente, abbiamo impostato i valori dell'indice per le righe che sono "R1, R2, R3, R4, R5, R6 e R7". Inseriamo questi valori dell'indice al "CARS_DATA" utilizzando il metodo "indice".

Quindi, lo inseriamo nel metodo "Print ()" per il rendering sulla console. Non rimodiamo il telaio di dati o applichiamo ancora il metodo "Pivot ()". Visualizziamo semplicemente i dati di dati "CARS_DATA".

Premiamo il "shift+ enter" per eseguire questo codice. Dopo aver premuto tali chiavi, otteniamo il risultato fornito del codice che visualizza il telaio di dati che abbiamo sviluppato nel codice Pandas. Ora applichiamo il metodo "Pivot ()" a questo frame dati e lo rimodella secondo la nostra scelta.

Qui, aggiungiamo queste righe al nostro codice Pandas e utilizziamo il metodo "Pivot ()". Questo metodo "Pivot ()" contiene tre parametri. Nel primo parametro, abbiamo impostato il nuovo indice che è il "car_model". Il secondo parametro è il nome della colonna che abbiamo impostato qui come "sfidante". E il terzo parametro è il parametro del valore che noi come "car_name". Ora, il frame dati "CARS_DATA" viene rimodellato e appare come abbiamo definito. La colonna "CAR_MODEL" appare come indice, la colonna "sfidante" appare come i nomi della colonna e i valori del frame dati sono "car_name".

Qui, appare il frame dati rimodellato e tutte le regolazioni dei valori vengono visualizzate di conseguenza che abbiamo definito nel codice. L'indice in questo frame dati rimodellato è il "car_model". Il nome della colonna qui è la colonna "sfidante". Tutti i "CAR_NAME" sono regolati qui come valori. Il "nan" appare qui nella cella vuota.

Esempio 2:

Il frame dati che sviluppiamo in questo esempio è "new_interview_df". Ma prima creiamo un elenco nidificato con il nome "New_Interview". E poi, convertiamo questo elenco nidificato nel frame dati. L'elenco "New_Interview" contiene il "Pro_Language" in cui abbiamo "Java, C#, Python, OOP e Python". Ha "code_office" in cui mettiamo "BAR12, LON34, PAR33, LON56, BAR53, LON11 e BAR34". Successivamente, abbiamo "EMP_SALARY" e inserisci il "18000, 25000, 20000, 15000, 34000, 22000, 31000 e 43000". Il "new_interview" si trasforma in "new_interview_df" con l'aiuto del "PD.Metodo DataFrame ". Abbiamo anche inserito il metodo "new_interview_df" nel metodo "print ()". Appare sulla console dopo l'esecuzione.

Ora rimodiamo il metodo "new_interview_df" con l'aiuto del metodo "Pivot ()". Questa volta, menzioniamo il metodo "Valori, indice e colonna" all'interno del metodo "Pivot ()". Qui, impostiamo "emp_salary" come valori, "code_office" come indice e "pro_language" come colonne. Quindi, stampiamo questo frame dati rimodellato.

L'originale, così come i frame dati rimodellati, vengono qui. Potresti notare che il valore, l'indice e i nomi delle colonne vengono modificati e un nuovo frame dati rimodellato appare sotto il frame dati originale. Nel frame dati rimodellato che è apparso qui, l'indice è il "code_office", i nomi delle colonne sono "pro_language" e i valori sono "emp_salary".

Esempio 3:

Creiamo di nuovo un altro elenco per questo esempio. Questo elenco è chiamato "temp_list" che ha "Città, temperatura e umidità". Il "mese" che inseriamo qui è "gennaio, maggio, giugno, febbraio e luglio". La "città" ha "New York, Birmingham, Mumbai, Baljiam e Bangalore". Nella "temperatura" e "umidità", aggiungiamo rispettivamente il "62, 68, 70, 77, 69" e "60, 66, 69, 74, 63". Quindi, cambiamo il "temp_list" nel frame dati "temp_df". Quindi rendiamo questo "temp_df" qui.

Ora, vogliamo ruotare o rimodellare questo "temp_df". Il metodo "Pivot ()" qui aiuta a farlo. Abbiamo impostato il "mese" come indice e la "città" come nome della colonna. I valori che abbiamo impostato qui sono sia "temperatura" che "umidità". Appaiono come due frame di dati separati con valori diversi.

Questo risultato mostra che dopo il rimodellamento, ci sono due frame dati separati da punti. Il primo telaio di dati contiene i valori di "temperatura" e il secondo frame dati contiene i valori di "umidità". Gli indici e i nomi delle colonne per entrambi i frame dati sono gli stessi. L'indice per entrambi i frame dati è il "mese" e le "colonne" per entrambi sono "città".

Esempio 4:

Questo codice contiene un telaio di dati "DF" in cui posizioniamo "A01" come prima colonna e aggiungiamo "James, James e Mina". La seconda colonna è "A02" che ha "ingegnere, ingegnere e insegnante". La terza colonna si chiama "A03" dove mettiamo "44, 63, 21". Stampiamo il "DF" e applichiamo il "perno" qui. "A01" è l'indice, "A02" è la colonna e "A03" è il valore. Ora, controlla l'output di ciò che accade con questo frame dati.

Ecco il risultato di questo codice. Potresti notare che il messaggio di errore viene visualizzato nell'output che dice che l'indice contiene le voci duplicate. Significa che non impostiamo quelle colonne come un indice che contiene le voci duplicate perché gli indici sono valori univoci. Quindi, fai attenzione al riguardo mentre gira qualsiasi tela di dati.

Conclusione

L'obiettivo di questa guida è rendere più comprensibile la logica della funzione "Pandas Pivot ()" per te. Abbiamo descritto questo concetto in grande profondità in modo che sarebbe facile applicare la funzione "Pivot ()" nel codice Pandas. Abbiamo spiegato il metodo "Pivot ()". Abbiamo utilizzato questo metodo per rimodellare o ruotare il frame dati in Panda. Abbiamo anche spiegato la sua sintassi qui. In questa guida, abbiamo esaminato quattro esempi descrittivi e pratici, guardando attentamente ogni riga di codice. Abbiamo fornito il risultato per ogni codice qui insieme agli script.