Diagramma a dispersione in r

Diagramma a dispersione in r
“Le rappresentazioni visive dei dati includono grafici e grafici. Il tuo obiettivo di data scientist è quello di dare un perfetto senso di grandi quantità di informazioni. Tre procedure sono coinvolte nell'analisi dei dati. Ottenere dati, pulire e modificare i dati è una parte importante del processo. Per valutare ulteriormente i dati, costruisci un display visivo da esso. Le visualizzazioni dei dati con la trama sono strumenti straordinari per semplificare l'analisi complicata. Ma prima, passiamo attraverso alcuni principi di trama fondamentali come le trame di dispersione. Un diagramma a dispersione è un diagramma che presenta i livelli di due variabili numeriche in un insieme di dati come punti geometrici all'interno di un diagramma cartesiano."

Qual è il diagramma a dispersione nel linguaggio di programmazione R in Ubuntu 20.04?

Il confronto delle variabili viene eseguito usando grafici a dispersione. Quando dobbiamo sapere quale ulteriore variabile è influenzata da un'altra, dobbiamo confrontare le due variabili. Il diagramma a dispersione è un gruppo di punti tratteggiati sugli assi X e Y che rappresentano pezzi di dati distinti. Il layout dei punti generati dimostra una correlazione tra due variabili quando i loro valori vengono visualizzati lungo l'asse x e l'asse Y.

Sintassi del diagramma a dispersione nel linguaggio di programmazione R in Ubuntu 20.04

In R, puoi creare un diagramma a dispersione in una varietà di metodi. Trama (x, y), in cui i parametri xey sono vettori numerici che specificano le posizioni (x, y) nella trama, è la funzione più semplice.

Trama (x, y, main, xlab, ylab, xlim, ylim, axes)

Come accennato in precedenza, x Eventuali parametri X sono obbligatori per grafici al grafico a dispersione, ma il diagramma a dispersione supporta anche alcuni parametri opzionali, che sono descritti come segue:

X: Le coordinate orizzontali sono impostate con questa opzione.

y Le coordinate verticali sono impostate con questa opzione.

XLAB: L'etichetta per l'asse orizzontale.

Ylab: L'etichetta dell'asse verticale.

principale: L'argomento del grafico è definito dal parametro principale.

Xlim: Il parametro XLIM viene utilizzato per rappresentare i valori X.

Ylim: L'opzione limica viene utilizzata per tracciare i valori di y.

Axes: Questa opzione determina se il diagramma dovrebbe includere entrambi gli assi.

Come costruire il diagramma a dispersione in R in Ubuntu 20.04?

Diamo un'occhiata a un esempio per mostrare come possiamo usare la funzione della trama per creare un diagramma a dispersione. Utilizzeremo il set di dati di esempio nei nostri esempi, che è un set di dati preconfigurati nell'ambiente R.

Esempio n. 1: usando il metodo della trama per la costruzione del diagramma a dispersione R in Ubuntu 20.04

Il metodo trama () nel linguaggio di programmazione R può essere utilizzato per creare un diagramma a dispersione.

Per costruire il diagramma a dispersione, abbiamo bisogno del set di dati. Quindi qui, abbiamo inserito il set di dati USarrest dalla lingua R. Abbiamo selezionato le due colonne da questo set di dati per realizzare il diagramma a dispersione. Le prime voci sono mostrate dal set di dati usarrest. Quindi, abbiamo la funzione del diagramma in cui sono impostati i due input, x e y. Per X input, è selezionata la colonna "Murder" e per l'ingresso Y abbiamo la colonna "UrbanPop". Alcuni ingressi opzionali vengono passati all'interno della funzione, come le etichette per xey sono impostate con XLAB e YLAB. All'interno della gamma Xlim e Ylim, sono impostati i valori dei parametri X e Y. Inoltre, il titolo del diagramma a dispersione è impostato chiamando l'opzione “Main."

L'output del diagramma a dispersione viene generato di seguito.

Esempio n. 2: usando il metodo coppia per costruire le matrici del diagramma a dispersione R in Ubuntu 20.04

Utilizziamo una matrice a dispersione quando abbiamo più variabili e vogliamo correlare una variabile con gli altri. Le matrici di dispersione vengono create utilizzando il metodo delle coppie ().

Qui, abbiamo selezionato il set di dati di esempio Iris dalla lingua R. Quindi, stampare le prime sei voci del set di dati IRIS. Alle colonne del set di dati Iris, abbiamo applicato il metodo della coppia. Ogni colonna verrà accoppiata con la colonna rimanente nella funzione della coppia.

Le metriche a dispersione sono visualizzate nella figura seguente.

Esempio n. 3: usando i valori adattati in un diagramma a dispersione in R in Ubuntu 20.04

È possibile espandere il grafico aggiungendo un nuovo livello di dati. Nella regressione lineare, puoi visualizzare il valore montato. Per costruire un diagramma a dispersione, utilizziamo i metodi GGPlot () e Geom_point () del pacchetto GGPlot2.

Inizia con questo esempio; Abbiamo importato il modulo GGPlot2 da R. Quindi, abbiamo utilizzato il metodo GGPlot in cui viene fornito il nome del set di dati "MTCARS". La funzione "AES" viene utilizzata all'interno del metodo GGPlot per la creazione dei registri per i parametri X e Y. Per la regressione lineare, viene utilizzato un set aggiuntivo di funzionalità, "STAT_SMOOTH". Il metodo di levigatura è controllato dall'opzione STAT_ liscia (). L'errore standard (SE) è mantenuto falso e la linea della dimensione è impostata sul valore 1.

Esempio n. 4: usando un nome dinamico per il titolo di trama a dispersione in R in Ubuntu 20.04

Non abbiamo ancora inserito alcun dato sui grafici. Sono richiesti grafici informativi. Senza ricorrere a una documentazione aggiuntiva, il lettore dovrebbe essere in grado di comprendere il messaggio dietro l'analisi dei dati solo guardando la trama. Di conseguenza, sono necessarie buone etichette quando si utilizzano grafici. Le etichette possono essere aggiunte utilizzando la funzione Labs ().

Abbiamo una variabile qui come Scatter_Graph a cui è assegnato il metodo GGPlot. GGPlot Imposta il suo parametro come l'esempio sopra ma per un set di dati diverso. Il set di dati utilizzato qui è l'iride. Quindi, abbiamo nuovamente utilizzato la variabile Scatter_Garph e questa volta abbiamo impostato i nomi dinamici sul diagramma a dispersione.

Puoi vedere le informazioni aggiuntive sul diagramma a dispersione all'interno della figura seguente.

Esempio # 5: usando il metodo 3dScatterplot per la costruzione del diagramma a dispersione in R in Ubuntu 20.04

Il pacchetto ScatterPlot3D ti consente di creare un diagramma a dispersione tridimensionale. Scatterplot3d è una tecnica utile che utilizza la sintassi (x, y, z).

Abbiamo incluso il modulo ScatterPlot3D all'interno del nostro script R sopra. Ora possiamo usare la funzione ScatterPlot3D. Alla funzione ScatterPlot3D, abbiamo superato tre parametri che sono le colonne selezionate dalla crescita del denti del set di dati.

Il diagramma a dispersione 3D viene reso nel seguente grafico.

Conclusione

Questo articolo mira a informarti sulla trama a dispersione in R. I grafici a dispersione sono grafici di dispersione che vengono utilizzati per visualizzare i punti dati dai parametri (di solito due, ma tre sono possibili). Lo scopo principale della trama di Scatter è di aiutare a visualizzare i dati e se le variabili numeriche hanno una relazione. Abbiamo visto vari approcci che ci aiutano a creare il diagramma a dispersione nel modo più semplice. Ogni metodo ha la sua funzionalità ed è molto facile da capire.