Matplotlibgrat Scatter in Python

Matplotlibgrat Scatter in Python
L'umano può comprendere il visivo più rispetto alla forma del testo. Ecco perché le persone suggeriscono sempre di disegnare il grafico dei big data per capirlo in modo molto semplice. Esistono diversi tipi di grafici disponibili sul mercato come grafici a barre, istogrammi, grafici a torta, ecc. Questi diversi grafici vengono utilizzati in base al set di dati e ai requisiti. Ad esempio, se si dispone di un set di dati delle prestazioni dell'azienda negli ultimi 10 anni, il grafico del grafico a barre fornirà ulteriori informazioni sulla crescita dell'azienda. Quindi, in questo modo, la scelta del grafico dipende dal set di dati e dai requisiti.

Se sei uno scienziato dei dati, a volte devi gestire i big data. In questi big data, stai elaborando i dati, analizzando i dati e quindi generando il rapporto su questo. Per generare il rapporto su questo, è necessario aver bisogno di un'immagine chiara dei dati e qui i grafici sono in atto.

In questo articolo, spiegheremo come usare il Matplotlibgrat Scatter in Python.

IL diagramma a dispersione è ampiamente utilizzato dall'analisi dei dati per scoprire la relazione tra due set di dati numerici. Questo articolo vedrà come usare il matplotlib.Pyplot per disegnare un diagramma a dispersione. Questo articolo ti fornirà dettagli completi che devi lavorare sulla trama a dispersione.

Il matplotlib.PyPolt offre diversi modi per tracciare il grafico. Per tracciare il grafico come una dispersione, utilizziamo la scatter di funzione ().

La sintassi per utilizzare la funzione Scatter () è:

matplotlib.Pyplot.SPIREST (X_DATA, Y_DATA, S, C, MARKER, CMAP, VMIN, VMAX, ALPHA, LINEWIDTHS, Edgecolors)

Tutti i parametri di cui sopra, vedremo nei prossimi esempi per capire meglio.

Importa matplotlib.Pyplot come Plt
Plt.SPIREST (X_DATA, Y_DATA)

I dati che abbiamo trasmesso sulla dispersione X_DATA appartengono all'asse x e Y_DATA appartengono all'asse y.

Esempi

Ora, tracceremo il grafico Scatter () usando parametri diversi.

Esempio 1: usando i parametri predefiniti

Il primo esempio si basa sulle impostazioni predefinite della funzione Scatter (). Passiamo solo due set di dati per creare una relazione tra di loro. Qui, abbiamo due elenchi: uno appartiene alle altezze (h) e un altro corrisponde ai loro pesi (W).

# Scatter_Default_arguments.Py
# Importa la libreria richiesta
Importa matplotlib.Pyplot come Plt
Dati # H (altezza) e W (peso)
H = [165, 173, 172, 188, 191, 189, 157, 167, 184, 189]
W = [55, 60, 72, 70, 96, 84, 60, 68, 98, 95]
# trama un appezzamento a dispersione
Plt.dispersione (h, w)
Plt.spettacolo()

Produzione: SPATTER_DEFAULT_ARGUMENTI.Py

Nell'output di cui sopra, possiamo vedere i dati dei pesi (W) sull'asse y e le altezze (h) sull'asse x.

Esempio 2: Scatter () trama con i loro valori di etichette (asse x e asse y) e titolo

In Esempio_1, disegniamo semplicemente il diagramma a dispersione direttamente con le impostazioni predefinite. Ora, personalizzeremo la funzione del diagramma a dispersione uno per uno. Quindi, prima di tutto, aggiungeremo etichette alla trama, come mostrato di seguito.

# EBELS_TITLE_SCATTER_PLOT.Py
# Importa la libreria richiesta
Importa matplotlib.Pyplot come Plt
# h e w dati
H = [165, 173, 172, 188, 191, 189, 157, 167, 184, 189]
W = [55, 60, 72, 70, 96, 84, 60, 68, 98, 95]
# trama un appezzamento a dispersione
Plt.dispersione (h, w)
# Imposta i nomi degli axis lables
Plt.xlabel ("peso (w) in kg")
Plt.ylabel ("altezza (h) in cm")
# Imposta il titolo del nome del grafico
Plt.Titolo ("Dispresse diagramma per altezza e peso")
Plt.spettacolo()

Riga da 4 a 11: Importiamo la libreria matplotlib.Pyplot e crea due set di dati per l'asse x e l'asse y. E passiamo entrambi i set di dati alla funzione del diagramma a dispersione.

Riga da 14 a 19: Impostiamo i nomi delle etichette dell'asse X e dell'asse Y. Abbiamo anche impostato il titolo del grafico a dispersione.

Produzione: EBELS_TITLE_SCATT_PLOT.Py

Nell'output sopra, possiamo vedere che il diagramma a dispersione ha i nomi delle etichette dell'asse e il titolo del diagramma a dispersione.

Esempio 3: utilizzare il parametro marcatore per modificare lo stile dei punti dati

Per impostazione predefinita, il marcatore è un round solido, come mostrato nell'uscita sopra. Quindi, se vogliamo cambiare lo stile del marcatore, possiamo cambiarlo attraverso questo parametro (marcatore). Anche noi possiamo anche impostare le dimensioni del marcatore. Quindi, ne vedremo in questo esempio.

# marker_scatter_plot.Py
# Importa la libreria richiesta
Importa matplotlib.Pyplot come Plt
# h e w dati
H = [165, 173, 172, 188, 191, 189, 157, 167, 184, 189]
W = [55, 60, 72, 70, 96, 84, 60, 68, 98, 95]
# trama un appezzamento a dispersione
Plt.SPIREST (H, W, marker = "V", S = 75)
# Imposta i nomi degli axis lables
Plt.xlabel ("peso (w) in kg")
Plt.ylabel ("altezza (h) in cm")
# Imposta il titolo del nome del grafico
Plt.Titolo ("Scatter trama in cui il marcatore cambia")
Plt.spettacolo()

Il codice sopra è lo stesso spiegato negli esempi precedenti tranne la riga seguente.

Riga 11: Passiamo il parametro marcatore e un nuovo segno utilizzato dal diagramma a dispersione per disegnare punti sul grafico. Abbiamo anche impostato le dimensioni del marcatore.

L'output seguente mostra punti dati con lo stesso marcatore che abbiamo aggiunto nella funzione di scattering.

Produzione: marker_scatter_plot.Py

Esempio 4: cambia il colore del diagramma a dispersione

Possiamo anche cambiare il colore dei punti dati in base alla nostra scelta. Per impostazione predefinita, mostra con colore blu. Ora cambieremo il colore dei punti dati del diagramma a dispersione, come mostrato di seguito. Possiamo cambiare il colore del diagramma a dispersione usando qualsiasi colore che desideri. Possiamo scegliere qualsiasi tupla RGB o RGBA (rosso, verde, blu, alfa). L'intervallo di valori di ogni elemento tupla sarà tra [0.0, 1.0] e possiamo anche rappresentare l'RGB o RGBA in formato esadecimale come #FF5733.

# Scatter_Plot_Colour.Py
# Importa la libreria richiesta
Importa matplotlib.Pyplot come Plt
# h e w dati
H = [165, 173, 172, 188, 191, 189, 157, 167, 184, 189]
W = [55, 60, 72, 70, 96, 84, 60, 68, 98, 95]
# trama un appezzamento a dispersione
Plt.SPIREST (H, W, marker = "V", s = 75, c = "rosso")
# Imposta i nomi degli axis lables
Plt.xlabel ("peso (w) in kg")
Plt.ylabel ("altezza (h) in cm")
# Imposta il titolo del nome del grafico
Plt.Titolo ("Cambiamento del colore della trama a dispersione")
Plt.spettacolo()

Questo codice è simile agli esempi precedenti, tranne la riga seguente in cui aggiungiamo la personalizzazione del colore.

Riga 11: Passiamo il parametro "C", che è per il colore. Abbiamo assegnato il nome del colore "rosso" e ottenuto l'output nello stesso colore.

Se ti piace usare la tupla a colori o esadecimale, passa a passare quel valore alla parola chiave (c o colore) come sotto:

Plt.SPIREST (H, W, marker = "V", s = 75, c = "#ff5733)

Nella funzione di dispersione sopra, abbiamo superato il codice colore esadecimale anziché il nome del colore.

Produzione: SPARE_PLOT_COLOUR.Py

ESEMPIO 5: Scatter Trama Cambia del colore in base alla categoria

Possiamo anche cambiare il colore dei punti dati in base alla categoria. Quindi in questo esempio, lo spiegheremo.

# Colour_Change_By_Category.Py
# Importa la libreria richiesta
Importa matplotlib.Pyplot come Plt
# i dati H e W si radunano da due paesi
H = [165, 173, 172, 188, 191, 189, 157, 167, 184, 189]
W = [55, 60, 72, 70, 96, 84, 60, 68, 98, 95]
# Imposta il nome del paese 1 o 2 che mostra l'altezza o il peso
# i dati appartengono a quale paese
country_category = ['country_2', 'country_2', 'country_1',
'country_1', 'country_1', 'country_1',
'country_2', 'country_2', 'country_1', 'country_2']
# mappatura dei colori
Colors = 'country_1': 'Orange', 'country_2': 'blu'
Colour_list = [Colors [i] per i in country_category]
# stampa la lista dei colori
Stampa (Colour_List)
# trama un appezzamento a dispersione
Plt.SPIREST (H, W, marker = "V", S = 75, C = Colour_List)
# Imposta i nomi degli axis lables
Plt.xlabel ("peso (w) in kg")
Plt.ylabel ("altezza (h) in cm")
# Imposta il titolo del nome del grafico
Plt.Titolo ("cambio di colore trama a dispersione per la categoria saggio")
Plt.spettacolo()

Il codice sopra è simile agli esempi precedenti. Le linee in cui abbiamo fatto le modifiche sono spiegate di seguito:

Riga 12: Mettiamo gli interi punti dati nella categoria di paese_1 o country_2. Queste sono solo ipotesi e non il vero valore per mostrare la demo.

Linea 17: Abbiamo creato un dizionario del colore che rappresenta ogni categoria.

Linea 18: Mappiamo la categoria del paese con il loro nome di colore. E la dichiarazione di stampa seguente mostrerà risultati come questo.

['Blue', 'Blue', 'Orange', 'Orange', 'Orange', 'Orange', 'Blue', 'Blue', 'Orange', 'Blue'

Riga 24: Finalmente, passiamo il Colour_List (riga 18) alla funzione di dispersione.

Produzione: Colour_Change_By_Category.Py

Esempio 6: modifica il colore dei bordi del punto dati

Possiamo anche cambiare il colore dei bordi del punto dati. Per questo, dobbiamo usare la parola chiave Edge Color ("EdgeColor"). Possiamo anche impostare la larghezza della linea del bordo. Negli esempi precedenti, non abbiamo usato alcun edgecolor, che per impostazione predefinita nessuno. Quindi, non mostra alcun colore predefinito. Aggiungeremo il colore dei bordi sul punto dati per vedere la differenza tra i precedenti esempi di grafico a dispersione con il grafico dei punti dati del colore dei bordi.

# Edgecolour_Scatterplot.Py
# Importa la libreria richiesta
Importa matplotlib.Pyplot come Plt
# h e w dati
H = [165, 173, 172, 188, 191, 189, 157, 167, 184, 189]
W = [55, 60, 72, 70, 96, 84, 60, 68, 98, 95]
# trama un appezzamento a dispersione
Plt.SPIREST (H, W, marker = "V", S = 75, C = "Red", EdgeColor = 'Black', LineWidth = 1)
# Imposta i nomi degli axis lables
Plt.xlabel ("peso (w) in kg")
Plt.ylabel ("altezza (h) in cm")
# Imposta il titolo del nome del grafico
Plt.Titolo ("Cambiamento del colore della trama a dispersione")
Plt.spettacolo()

Riga 11: In questa riga, aggiungiamo solo un altro parametro che chiamiamo EdgeColor e Linewidth. Dopo aver aggiunto entrambi i parametri, ora il nostro grafico a dispersione sembra qualcosa, come mostrato di seguito. Puoi vedere che l'esterno del punto dati è ora delimitato dal colore nero con larghezza di linea = 1.

Produzione: Edgecolour_Scatterplot.Py

Conclusione

In questo articolo, abbiamo visto come usare la funzione del diagramma a dispersione. Abbiamo spiegato tutti i principali concetti necessari per disegnare un diagramma a dispersione. Potrebbe esserci qualche altro modo per disegnare il diagramma a dispersione, come un modo più attraente, a seconda di come utilizziamo parametri diversi. Ma la maggior parte dei parametri che abbiamo coperto dovevano disegnare la trama in modo più professionale. Inoltre, non utilizzare troppi parametri complessi, che possono confondere il significato effettivo del grafico.

Il codice per questo articolo è disponibile sul collegamento Github di seguito:

https: // github.com/shekharpandey89/dispett-plot-matplotlib.Pyplot