Se sei uno scienziato dei dati, a volte devi gestire i big data. In questi big data, stai elaborando i dati, analizzando i dati e quindi generando il rapporto su questo. Per generare il rapporto su questo, è necessario aver bisogno di un'immagine chiara dei dati e qui i grafici sono in atto.
In questo articolo, spiegheremo come usare il Matplotlibgrat Scatter in Python.
IL diagramma a dispersione è ampiamente utilizzato dall'analisi dei dati per scoprire la relazione tra due set di dati numerici. Questo articolo vedrà come usare il matplotlib.Pyplot per disegnare un diagramma a dispersione. Questo articolo ti fornirà dettagli completi che devi lavorare sulla trama a dispersione.
Il matplotlib.PyPolt offre diversi modi per tracciare il grafico. Per tracciare il grafico come una dispersione, utilizziamo la scatter di funzione ().
La sintassi per utilizzare la funzione Scatter () è:
matplotlib.Pyplot.SPIREST (X_DATA, Y_DATA, S, C, MARKER, CMAP, VMIN, VMAX, ALPHA, LINEWIDTHS, Edgecolors)Tutti i parametri di cui sopra, vedremo nei prossimi esempi per capire meglio.
Importa matplotlib.Pyplot come PltI dati che abbiamo trasmesso sulla dispersione X_DATA appartengono all'asse x e Y_DATA appartengono all'asse y.
Esempi
Ora, tracceremo il grafico Scatter () usando parametri diversi.
Esempio 1: usando i parametri predefiniti
Il primo esempio si basa sulle impostazioni predefinite della funzione Scatter (). Passiamo solo due set di dati per creare una relazione tra di loro. Qui, abbiamo due elenchi: uno appartiene alle altezze (h) e un altro corrisponde ai loro pesi (W).
# Scatter_Default_arguments.PyProduzione: SPATTER_DEFAULT_ARGUMENTI.Py
Nell'output di cui sopra, possiamo vedere i dati dei pesi (W) sull'asse y e le altezze (h) sull'asse x.
Esempio 2: Scatter () trama con i loro valori di etichette (asse x e asse y) e titolo
In Esempio_1, disegniamo semplicemente il diagramma a dispersione direttamente con le impostazioni predefinite. Ora, personalizzeremo la funzione del diagramma a dispersione uno per uno. Quindi, prima di tutto, aggiungeremo etichette alla trama, come mostrato di seguito.
# EBELS_TITLE_SCATTER_PLOT.PyRiga da 4 a 11: Importiamo la libreria matplotlib.Pyplot e crea due set di dati per l'asse x e l'asse y. E passiamo entrambi i set di dati alla funzione del diagramma a dispersione.
Riga da 14 a 19: Impostiamo i nomi delle etichette dell'asse X e dell'asse Y. Abbiamo anche impostato il titolo del grafico a dispersione.
Produzione: EBELS_TITLE_SCATT_PLOT.Py
Nell'output sopra, possiamo vedere che il diagramma a dispersione ha i nomi delle etichette dell'asse e il titolo del diagramma a dispersione.
Esempio 3: utilizzare il parametro marcatore per modificare lo stile dei punti dati
Per impostazione predefinita, il marcatore è un round solido, come mostrato nell'uscita sopra. Quindi, se vogliamo cambiare lo stile del marcatore, possiamo cambiarlo attraverso questo parametro (marcatore). Anche noi possiamo anche impostare le dimensioni del marcatore. Quindi, ne vedremo in questo esempio.
# marker_scatter_plot.PyIl codice sopra è lo stesso spiegato negli esempi precedenti tranne la riga seguente.
Riga 11: Passiamo il parametro marcatore e un nuovo segno utilizzato dal diagramma a dispersione per disegnare punti sul grafico. Abbiamo anche impostato le dimensioni del marcatore.
L'output seguente mostra punti dati con lo stesso marcatore che abbiamo aggiunto nella funzione di scattering.
Produzione: marker_scatter_plot.Py
Esempio 4: cambia il colore del diagramma a dispersione
Possiamo anche cambiare il colore dei punti dati in base alla nostra scelta. Per impostazione predefinita, mostra con colore blu. Ora cambieremo il colore dei punti dati del diagramma a dispersione, come mostrato di seguito. Possiamo cambiare il colore del diagramma a dispersione usando qualsiasi colore che desideri. Possiamo scegliere qualsiasi tupla RGB o RGBA (rosso, verde, blu, alfa). L'intervallo di valori di ogni elemento tupla sarà tra [0.0, 1.0] e possiamo anche rappresentare l'RGB o RGBA in formato esadecimale come #FF5733.
# Scatter_Plot_Colour.PyQuesto codice è simile agli esempi precedenti, tranne la riga seguente in cui aggiungiamo la personalizzazione del colore.
Riga 11: Passiamo il parametro "C", che è per il colore. Abbiamo assegnato il nome del colore "rosso" e ottenuto l'output nello stesso colore.
Se ti piace usare la tupla a colori o esadecimale, passa a passare quel valore alla parola chiave (c o colore) come sotto:
Plt.SPIREST (H, W, marker = "V", s = 75, c = "#ff5733)Nella funzione di dispersione sopra, abbiamo superato il codice colore esadecimale anziché il nome del colore.
Produzione: SPARE_PLOT_COLOUR.Py
ESEMPIO 5: Scatter Trama Cambia del colore in base alla categoria
Possiamo anche cambiare il colore dei punti dati in base alla categoria. Quindi in questo esempio, lo spiegheremo.
# Colour_Change_By_Category.PyIl codice sopra è simile agli esempi precedenti. Le linee in cui abbiamo fatto le modifiche sono spiegate di seguito:
Riga 12: Mettiamo gli interi punti dati nella categoria di paese_1 o country_2. Queste sono solo ipotesi e non il vero valore per mostrare la demo.
Linea 17: Abbiamo creato un dizionario del colore che rappresenta ogni categoria.
Linea 18: Mappiamo la categoria del paese con il loro nome di colore. E la dichiarazione di stampa seguente mostrerà risultati come questo.
['Blue', 'Blue', 'Orange', 'Orange', 'Orange', 'Orange', 'Blue', 'Blue', 'Orange', 'Blue'Riga 24: Finalmente, passiamo il Colour_List (riga 18) alla funzione di dispersione.
Produzione: Colour_Change_By_Category.Py
Esempio 6: modifica il colore dei bordi del punto dati
Possiamo anche cambiare il colore dei bordi del punto dati. Per questo, dobbiamo usare la parola chiave Edge Color ("EdgeColor"). Possiamo anche impostare la larghezza della linea del bordo. Negli esempi precedenti, non abbiamo usato alcun edgecolor, che per impostazione predefinita nessuno. Quindi, non mostra alcun colore predefinito. Aggiungeremo il colore dei bordi sul punto dati per vedere la differenza tra i precedenti esempi di grafico a dispersione con il grafico dei punti dati del colore dei bordi.
# Edgecolour_Scatterplot.PyRiga 11: In questa riga, aggiungiamo solo un altro parametro che chiamiamo EdgeColor e Linewidth. Dopo aver aggiunto entrambi i parametri, ora il nostro grafico a dispersione sembra qualcosa, come mostrato di seguito. Puoi vedere che l'esterno del punto dati è ora delimitato dal colore nero con larghezza di linea = 1.
Produzione: Edgecolour_Scatterplot.Py
Conclusione
In questo articolo, abbiamo visto come usare la funzione del diagramma a dispersione. Abbiamo spiegato tutti i principali concetti necessari per disegnare un diagramma a dispersione. Potrebbe esserci qualche altro modo per disegnare il diagramma a dispersione, come un modo più attraente, a seconda di come utilizziamo parametri diversi. Ma la maggior parte dei parametri che abbiamo coperto dovevano disegnare la trama in modo più professionale. Inoltre, non utilizzare troppi parametri complessi, che possono confondere il significato effettivo del grafico.
Il codice per questo articolo è disponibile sul collegamento Github di seguito:
https: // github.com/shekharpandey89/dispett-plot-matplotlib.Pyplot