I punti box sono un tipo di grafico che mostra come i dati uniformi vengono dispersi in un set di dati. Il set di dati è diviso in tre quartili a causa di questo. Questo grafico raffigura il set di dati minimo, massimo, medio, primo, secondo e terzo quartile.
La scatola di un bocconcastro inizia nel primo quartile (25 percento) e termina nel terzo (75 percento). Di conseguenza, la casella riflette la metà (50 percento) dei dati centrali attraverso una linea all'interno di quella che indica la media. Nonostante incluso i valori anomali di Boxplot, una divisione è modellata su entrambi i lati della scatola ai dati più assoluti, se esistono, sarà rappresentata dai cerchi.
Questo tutorial ti istruirà su come utilizzare R per creare grafici box."
Creazione di boxplot in R
Un diagramma Box e Whisker possono essere creati usando la funzione "BoxPlot ()" di R ". Vari input possono essere utilizzati per creare questo grafico, inclusi vettori e frame di dati. Nel grafico equivalente, puoi anche inserire una formula come input quando si produce grafici a box per numerosi gruppi.
Creazione di boxplot utilizzando un vettore in R
Se si desidera creare un diagramma di scatola in R da un vettore, basta passare il vettore alla funzione "boxplot ()".
Qui abbiamo creato una "S" vettoriale e abbiamo assegnato un elenco di valori numerici. Usando la funzione "BoxPlot ()", passa questa "S" vettoriale come parametro. Il diagramma Box in R è impostato per essere verticale per impostazione predefinita, ma se si desidera cambiarlo in orizzontale, puoi farlo impostando l'espressione "orizzontale" "vera."
Di seguito viene visualizzata una vena orizzontale creata da un vettore.
È essenziale tenere presente che i punti box oscurano la distribuzione sottostante dei dati. Per risolvere questo problema, la funzione "stripChart ()" in R potrebbe essere utilizzata per inserire punti in una diagramma box.
Qui abbiamo usato il metodo “jitter."" PCH "significa personaggi della trama. Il "PCH" predefinito in R è 1, che crea un cerchio vuoto, mentre "pch = 19" significa cerchi solidi. Quindi quello che abbiamo usato sono i cerchi solidi con un colore arancione. I valori anomali non verranno esagerati se i punti dati sono jitter.
Creazione di boxplot usando "Notch" in R
Possiamo anche fare un diagramma box con una tacca in r. Ci aiuta a determinare quanto bene le mediane di vari gruppi di dati interagiscono tra loro. Specificando l'argomento Notch su True, è possibile illustrare gli intervalli di confidenza al 95 percento per la mediana nella golosa della scatola R. La scatola rappresenta i limiti superiore e inferiore, mentre la linea centrale può vedere la mediana.
Un "tacca" o restringimento della scatola, viene utilizzato attorno alla mediana in grafici della scatola tacca. Le tacche possono aiutare a determinare l'importanza di una discrepanza nelle mediane. Se non c'è sovrapposizione tra la tacca di 2 scatole, ci sono buone probabilità che le mediane non siano le stesse.
Il boxplot disegnato dal "tacca" è rappresentato di seguito.
Creazione di boxplot utilizzando un set di dati in R
Per creare un diagramma box in R, è possibile utilizzare anche i frame dati nella funzione "boxplot ()". In questo caso, utilizzeremo la base R fornita set di dati integrata “Chickweight."
Qui puoi vedere il set di dati all'interno della tabella "pulcino". Contiene 4 colonne peso, tempo, pulcino e dieta. Tutte le colonne hanno valori numerici memorizzati in esse.
Sceglieremo 2 colonne, io.e., Peso e dieta, dal set di dati. Utilizzando la funzione "BoxPlot ()", disegneremo grafici a box per la data selezionata.
Nel pezzo sopra, abbiamo progettato un diagramma box di "peso" contro la "dieta."Abbiamo specificato i nomi delle variabili con il nome del set di dati. All'interno delle parentesi graffe della funzione "BoxPlot ()", abbiamo usato il nome del telaio dati "Chickweigh."
La diagramma di boxi risultante mostra chiaramente la dispersione del outliner.
Per rendere questa diagramma box visivamente migliore e più dettagliata, puoi aggiungere punti. Puoi raggiungere questo obiettivo usando la funzione "StripChart ()".
Puoi vedere i punti che abbiamo creato per mostrare la divisione dati essenziale in ogni diagramma box.
Creazione di più diagrammi box in R
Creazione di più grafici box è un'altra tecnica che può essere utilizzata nella programmazione R. Per implementare questo metodo, stiamo utilizzando un set di dati integrato nella base R.
Il set di dati che abbiamo usato qui è "alberi" forniti da R Base. Possiamo anche aggiungere colori al boxplot. Nella funzione "BOXPLOT ()", impostiamo il colore "Col" come "Rainbow", che metterà in diversi colori a ciascun diagramma Box.
Se si desidera tracciare un diagramma box distinto per ogni colonna nel tuo telaio R, puoi farlo con l'utilizzo della funzione "Lapply ()".
Divideremo la grafica "par" in una riga e il numero di colonne nel set di dati in questo esempio. I singoli grafici, d'altra parte, potrebbero essere tracciati. La funzione "Invisible ()" impedisce che il testo di output della funzione "Lupply" sia visibile.
L'immagine seguente mostra il diagramma box creato per ciascuna colonna di dati singolarmente.
Conclusione
La programmazione r fornisce una varietà di operazioni che possono essere eseguite. La creazione di un diagramma box è un altro metodo utile e semplice per visualizzare visivamente i dati nei grafici. In questo articolo, abbiamo discusso di quali sono i grafici box e come visualizzano i dati. Abbiamo spiegato quattro diverse tecniche che possono essere utilizzate per disegnare grafici a scatole in R, usando RStudio in Ubuntu 20.04. Compreso l'utilizzo di vettori semplici per creare grafici a box, utilizzando "Notch", utilizzando dati e creazione anche più grafici box. Abbiamo dimostrato ogni metodo elaborando diversi esempi di codici. Questo renderà l'apprendimento r per la creazione di grafici box molto più facili per te.