Tavolo per pivot panda

Tavolo per pivot panda

Python fornisce molte biblioteche per svolgere compiti diversi. Il "panda" è anche una biblioteca di Python. Utilizziamo questa libreria per manipolare e analizzare i dati. Possiamo facilmente progettare il frame dati in "Panda". Inoltre, progettiamo anche le "tabelle per pivot" utilizzando le funzioni di "panda". Una tabella pivot è una caratteristica di fogli di calcolo che consente varie disposizioni di tabelle per varie prospettive di dati identici. Una tecnica interattiva per riassumere un vasto volume di dati è la "tabella pivot". Il metodo "Pivot_table ()" di "panda" ci aiuta a progettare le tabelle pivot utilizzando i dati dei dati dei dati. Possiamo impostare il suo indice, colonne e valori all'interno del metodo "Pivot_table ()" secondo la nostra scelta o necessità. Possiamo anche applicare funzioni di aggregazione a questi pivot_tables in "panda". In questo tutorial, creeremo la tabella pivot utilizzando il metodo "Pivot_table ()" e spiegheremo in dettaglio questa "tabella pivot".

Sintassi

panda.pivot_table (dataframe_name, valori = valori_names, index_names, colons = column_names, aggfunc = 'media')

Per prima cosa aggiungiamo il nome del frame dati i cui dati vogliamo utilizzare nella tabella pivot. Quindi, nei valori, aggiungiamo i nomi di quelle colonne che vogliamo regolare come valori della tabella pivot. Successivamente, inseriamo i nomi delle colonne del telaio di dati che desideriamo impostare come indice della tabella pivot. Ora, nelle colonne, impostiamo i nomi delle colonne che vogliamo regolare come nomi di colonne della tabella pivot. Quindi, possiamo anche aggiungere la funzione di aggregazione ad esso. Ora faremo il codice "panda" e mostreremo la creazione della tabella pivot nei nostri codici. Diamo un'occhiata agli esempi seguenti.

Esempio 01

Iniziamo questo esempio posizionando "Importa" per l'importazione dei moduli di "Panda" nell'app "Spyder". Posizioniamo "panda come PD" dopo la parola chiave "importazione". Importiamo anche un'altra libreria che è la "numpy" allo stesso modo. Mettiamo "importazione" e poi aggiungiamo il "numpy come np", quindi ci aiuterà ad accedere ai metodi della libreria "numpy". Dopo aver importato entrambe le librerie, ci muoviamo verso la creazione del frame dati. Il frame dati è chiamato "spese_df" e quindi utilizziamo il metodo "panda" "PD.DataFrame () "Quindi, ci aiuta a creare DataFrame.

I dati che aggiungiamo in "Spese_DF" contengono tre colonne che sono denominate "exp_id, spese_type e denaro". I dati che aggiungiamo "exp_id" sono "E1, E2, E3, E4, E5 ed E6". Quindi, in "Spese_Type", posizioniamo: "alloggi, intrattenimento, trasporti, cibo, bollette e tasse". L'ultima colonna è la colonna "Money" che aggiungiamo: "$ 1500, $ 1200, $ 200, $ 3000, $ 5000 e $ 2000". Ora, visualizziamo semplicemente questo "spese_df usando" print () ". Il frame dati viene creato e visualizzato. Non abbiamo ancora usato il metodo "Pivot_table ()". Innanzitutto, mostreremo questo frame dati. Quindi, applichiamo il metodo "Pivot_table ()" anche in questo esempio.

Ottiamo il risultato di questo codice nell'app "Spyder" con l'aiuto delle chiavi "Shift+Enter" o anche possiamo utilizzare l'icona "Esegui" di questa app. Solo il frame dati è mostrato qui nel risultato e tutti i dati vengono aggiunti a questo frame dati. Ora applicheremo il metodo "Pivot_table" per la creazione della tabella pivot utilizzando i dati di questo frame dati.

Aggiungiamo queste righe fornite al codice sopra. Qui, puoi vedere che accediamo al metodo "Pivot_table ()" di "Panda" usando "PD" con quel metodo. Dopo questo, aggiungiamo il nome del frame dati come primo parametro. Quindi, nel "valori", abbiamo impostato la colonna "Money" in modo che visualizzerà come valori nelle celle della tabella per pivot. Nel "indice", impostiamo il "exp_id". Quindi, la colonna "Exp_id" si convertirà nell'indice della tabella pivot. Regoviamo anche la "spesa_type" nelle "colonne" in modo che i valori della colonna "spese_type" appariranno come i nomi della colonna della tabella pivot.

Quindi, applichiamo anche la funzione di aggregazione "aggfunc" e la imposta su "NP. somma "che aggiungerà valori. La "somma" è la funzione della libreria "numpy" che otteniamo posizionando il "NP". Abbiamo memorizzato questa "tabella pivot" nella variabile "tabella" e abbiamo aggiunto questa variabile "tabella" in "stampa" per la visualizzazione.

Ecco il tavolo per pivot. Si noti che i "nomi di colonne" di questa tabella per pivot sono i valori della colonna "Spese_Type" del frame dati. L '"indice" di questa tabella pivot è i valori del "exp_id" del frame dati che abbiamo creato sopra. Inoltre, i "valori" che vengono aggiunti nelle celle di questa tabella di perno sono i valori della colonna "denaro" del frame dati.

Esempio 02

Importiamo nuovamente le librerie "panda" e "numpy" per generare il nuovo codice. Creeremo la tabella pivot dopo aver letto il file CSV e convertito i dati del file CSV nel frame dati. Quindi, utilizzare i dati del Frame dati per la creazione della tabella pivot. Proviamo come realizziamo la tabella pivot utilizzando i dati del file CSV. Dopo aver importato le librerie, utilizziamo il metodo "read_csv" del "panda". Quindi, aggiungi il nome del file CSV in esso che legge i dati di questo file CSV e memorizza questi dati sotto forma di dati di dati nella variabile "DF".

Quindi, stampiamo questo "DF". Posizioniamo anche il metodo "Head (8)" con questo in modo che visualizzerà solo le prime righe "8" del frame dati. Dopo questo, utilizziamo il metodo "Pivot_table ()" in cui inseriamo il nome del frame dati. Quindi, mettiamo due indici per la tabella pivot che sono le colonne "order_id e unità" del frame dati. Nei "valori", posizioniamo le colonne "importo" e "paese" del telaio di dati in modo che vengano aggiunte come valori della tabella pivot. Nella funzione di aggregazione, aggiungiamo il "NP. funzione di somma ". Questa tabella pivot è archiviata in "Pivot_result" e visualizziamo anche "Pivot_result" usando "Print ()".

Il frame dati, così come la tabella pivot, è reso in questo risultato e puoi facilmente controllare gli indici e i valori della tabella pivot. Tutti i valori e gli indici della tabella pivot sono regolati di conseguenza come abbiamo impostato nel codice.

Esempio 03

Possiamo anche creare una tabella per giri con molti metodi di aggregazione. Qui, progettiamo il frame dati e quindi abbiamo creato la tabella pivot seguendo lo stesso metodo di cui abbiamo già discusso in precedenza. Nel metodo "Pivot_table ()", regoliamo "emp_type" come "indice". Il "emp_pay" è impostato come "valori" di quella tabella pivot e aggiungiamo più funzioni di aggregazione qui e queste sono "somma, media e conta". Quindi, tutte queste funzioni si applicheranno ai valori della tabella per pivot. Questo "pivot_table ()" è salvato in "risultato" e stampiamo il "risultato" anche per mostrare la tabella pivot sul terminale.

Il frame dati e la tabella pivot sono entrambi mostrati qui. Nella tabella pivot, è possibile notare che le tre colonne- "somma, media e conta"- contiene il risultato dopo aver applicato queste funzioni ai dati della tabella pivot. Inoltre, si noti che scrive gli stessi valori una volta nella colonna indice e non duplica alcun valore dell'indice qui.

Conclusione

In questo tutorial, abbiamo studiato il "Tavolo dei perni" in "Panda". Abbiamo discusso di cosa sia una tabella pivot, perché utilizziamo questa tabella pivot e come creare questa tabella per pivot in "Panda". Abbiamo spiegato il metodo che è il metodo "Pivot_table ()" che ci aiuta a creare la "tabella pivot" in "Panda" utilizzando i dati del frame dati. Abbiamo anche utilizzato questo metodo "Pivot_table ()" anche nei codici "Panda". Abbiamo applicato molte funzioni di aggregazione su questa "tabella pivot". Abbiamo anche sviluppato la "tabella pivot" dopo aver letto il file CSV in questo tutorial.