Come tracciare i dati in Pandas Python

Come tracciare i dati in Pandas Python
La visualizzazione dei dati svolge un ruolo importante nell'analisi dei dati. Pandas è una forte libreria di analisi dei dati in Python per la scienza dei dati. Fornisce varie opzioni per la visualizzazione dei dati con .Metodo trama (). Anche se sei un principiante, puoi facilmente tracciare i tuoi dati utilizzando la libreria Pandas. È necessario importare panda e matplotlib.Pacchetto Pyplot per la visualizzazione dei dati.

In questo articolo, esploreremo vari metodi di trama dei dati utilizzando il Pandas Python. Abbiamo eseguito tutti gli esempi sull'editor di codice sorgente PyCharm utilizzando il matplotlib.Pacchetto Pyplot.

Trama in Pandas Python

A Panda, il .Plot () ha diversi parametri che puoi utilizzare in base alle tue esigenze. Principalmente, usando il parametro "gentile", puoi definire quale tipo di trama creerai.

La sintassi per la trama dei dati utilizzando Pandas Python

La seguente sintassi viene utilizzata per tracciare un frame di dati in Pandas Python:

# Importa panda e matplotlib.pacchetti piploti
Importa panda come PD
Importa matplotlib.Pyplot come Plt
# Prepara i dati per creare dati dati
data_frame =
'Column1': ['field1', 'field2', 'field3', 'field4',…],
'Colonna2': ['field1', 'field2', 'field3', 'field4',…]

var_df = pd.DataFrame (data_frame, columns = ['column1', 'column2])
Stampa (variabile)
# grafico della barra di trama
var_df.complotto.bar (x = 'column1', y = 'column2')
Plt.spettacolo()

Puoi anche definire il tipo di trama usando il parametro del genere come segue:

var_df.trama (x = 'column1', y = 'column2', kind = 'bar')

Gli oggetti Pandas DataFrames hanno i seguenti metodi di trama per la trama:

  • Trama a dispersione: complotto.dispersione ()
  • Plotting di bar: complotto.bar (), trama.barh () dove h rappresenta le barre orizzontali.
  • Trama della linea: complotto.linea()
  • PROGETTURA DI PIE: complotto.torta()

Se un utente utilizza solo il metodo trama () senza utilizzare alcun parametro, crea il grafico della linea predefinita.

Ora elaboreremo alcuni importanti tipi di trama in dettaglio con l'aiuto di alcuni esempi.

Trama a dispersione nei panda

In questo tipo di trama, abbiamo rappresentato la relazione tra due variabili. Facciamo un esempio.

Esempio

Ad esempio, abbiamo dati di correlazione tra due variabili GDP_growth e Oil_price. Per tracciare la relazione tra due variabili, abbiamo eseguito il seguente pezzo di codice sul nostro editor di codice sorgente:

Importa matplotlib.Pyplot come Plt
Importa panda come PD
gdp_cal = pd.DataFrame (
'GDP_growth': [6.1, 5.8, 5.7, 5.7, 5.8, 5.6, 5.5, 5.3, 5.2, 5.2],
'Oil_price': [1500, 1520, 1525, 1523, 1515, 1540, 1545, 1560, 1555, 1565]
)
df = pd.DataFrame (gdp_cal, colonne = ['oil_price', 'gdp_growth'])
Stampa (DF)
df.Plot (x = 'oil_price', y = 'gdp_growth', kind = 'dispersi', color = 'rosso')
Plt.spettacolo()

Grafici di linea che tracciano nei panda

Il diagramma del grafico delle linee è un tipo di tracciamento di base in cui vengono visualizzate le informazioni fornite in una serie di punti dati che sono ulteriormente collegati da segmenti di linee rette. Utilizzando i grafici delle linee, puoi anche mostrare le tendenze degli straordinari informazioni.

Esempio

Nell'esempio di seguito, abbiamo preso i dati sul tasso di inflazione dell'anno scorso. Innanzitutto, preparare i dati e quindi creare dati di dati. Il seguente codice sorgente traccia il grafico della linea dei dati disponibili:

Importa panda come PD
Importa matplotlib.Pyplot come Plt
Infl_cal = 'Year': [2001, 2002, 2003, 2004, 2005, 2006, 2007, 2008, 2009, 2010, 2011],
'Infl_rate': [5.8, 10, 7, 6.7, 6.8, 6, 5.5, 8.2, 8.5, 9, 10]

data_frame = pd.DataFrame (infl_cal, colonne = ['anno', 'infl_rate'])
data_frame.trama (x = 'anno', y = 'infl_rate', kind = 'line')
Plt.spettacolo()

Nell'esempio sopra, è necessario impostare il tipo = "riga" per la trama del grafico delle linee.

Metodo 2# usando la trama.metodo di riga ()

L'esempio sopra, puoi anche implementare utilizzando il seguente metodo:

Importa panda come PD
Importa matplotlib.Pyplot come Plt
Inf_cal = 'anno': [2001, 2002, 2003, 2004, 2005, 2006, 2007, 2008, 2009, 2010, 2011],
'Inflation_rate': [5.8, 10, 7, 6.7, 6.8, 6, 5.5, 8.2, 8.5, 9, 10]

data_frame = pd.DataFrame (INF_CAL, colonne = ['Inflazione_RATE'], indice = [2001, 2002, 2003, 2004, 2005, 2006, 2007, 2008, 2009, 2010, 2011])
data_frame.complotto.linea()
Plt.Titolo ("Riepilogo del tasso di inflazione degli ultimi 11 anni")
Plt.ylabel ('inflation_rate')
Plt.xlabel ('anno')
Plt.spettacolo()

Il grafico della riga seguente verrà visualizzato dopo l'esecuzione del codice sopra:

Plottura del grafico a barre nei panda

La trama del grafico a barre viene utilizzata per rappresentare i dati categorici. In questo tipo di trama, le barre rettangolari con altezze diverse sono tracciate in base alle informazioni fornite. Il grafico a barre può essere tracciato in due diverse direzioni orizzontali o verticali.

Esempio

Abbiamo preso il tasso di alfabetizzazione di diversi paesi nell'esempio seguente. Vengono creati i frame dati in cui "country_names" e "alfabetity_rate" sono le due colonne di un frame dati. Usando i panda, puoi tracciare le informazioni nella forma del grafico a barre come segue:

Importa panda come PD
Importa matplotlib.Pyplot come Plt
lit_cal =
"Country_names": ["Pakistan", "USA", "China", "India", "UK", "Austria", "Egitto", "Ucraina", "Saudia", "Australia",
'Malaysia'],
'litr_rate': [5.8, 10, 7, 6.7, 6.8, 6, 5.5, 8.2, 8.5, 9, 10]

data_frame = pd.DataFrame (lit_cal, colonne = ['country_names', 'litr_rate'])
Stampa (data_frame)
data_frame.complotto.bar (x = 'country_names', y = 'litr_rate')
Plt.spettacolo()

Puoi anche implementare l'esempio sopra utilizzando il seguente metodo. Imposta il kind = "bar" per il grafico a barre che traccia in questa riga:

data_frame.trama (x = 'country_names', y = 'litr_rate', kind = 'bar')
Plt.spettacolo()

Grafico a barre orizzontali

Puoi anche tracciare i dati su barre orizzontali eseguendo il seguente codice:

Importa matplotlib.Pyplot come Plt
Importa panda come PD
data_chart = 'litr_rate': [5.8, 10, 7, 6.7, 6.8, 6, 5.5, 8.2, 8.5, 9, 10]
df = pd.DataFrame (data_chart, colonne = ['litr_rate'], index = ['Pakistan', "USA", "China", "India", "UK", "Austria", "Egitto", "Ucraina", "Saudia" , "Australia",
'Malaysia'])
df.complotto.barh ()
Plt.Titolo ("tasso di alfabetizzazione in vari paesi")
Plt.Ylabel ('country_names')
Plt.xlabel ('litr_rate')
Plt.spettacolo()

In df.complotto.Barh (), il barh viene utilizzato per la trama orizzontale. Dopo aver eseguito il codice sopra, il seguente grafico a barre viene visualizzato sulla finestra:

PIE PROGETTO DI PIE IN PANDAS

Un grafico a torta rappresenta i dati in una forma grafica circolare in cui i dati vengono visualizzati a fette in base alla quantità data.

Esempio

Nell'esempio seguente, abbiamo visualizzato le informazioni su "Earth_Material" in diverse sezioni sul grafico a torta. Innanzitutto, crea il frame dati, quindi, utilizzando i panda, visualizza tutti i dettagli sul grafico.

Importa panda come PD
Importa matplotlib.Pyplot come Plt
Material_per = 'Earth_part': [71,18,7,4]
dataframe = pd.DataFrame (Material_per, Columns = ['Earth_part'], Index = ['Water', 'Mineral', 'Sand', 'Metals'])
DataFrame.complotto.Pie (y = 'earth_part', figsize = (7, 7), autopct = '%1.1f %% ', startlengangle = 90)
Plt.spettacolo()

Il codice sorgente sopra traccia il grafico della torta dei dati disponibili:

Conclusione

In questo articolo, hai visto come tracciare i dati di dati in Pandas Python. Diversi tipi di trama vengono eseguiti nell'articolo sopra. Tracciare più tipi come scatola, esabina, ist, kDE, densità, area, ecc., Puoi usare lo stesso codice sorgente semplicemente modificando il tipo di trama.