Iniziare con RStudio su Ubuntu Linux

Iniziare con RStudio su Ubuntu Linux
Questo tutorial illustrerà come installare RStudio su Ubuntu 20.04.

RStudio fornisce un ambiente di sviluppo integrato per gestire le cose "R" del linguaggio di programmazione gratuito, che è disponibile sotto la licenza di GNU. RStudio è un ambiente di elaborazione ideale per generare visualizzazioni statistiche dettagliate e, come tale, è utilizzato dagli statistici in tutto il mondo.

RStudio è anche disponibile come programma software e come applicazione server, utilizzata da una varietà di diverse distribuzioni Linux e per Windows e MacOS.

Scarica il linguaggio di programmazione r (prerequisiti)

L'applicazione desktop RStudio necessita del linguaggio di programmazione R per funzionare su Linux Distrys. È necessario scaricare una versione R compatibile con il sistema operativo Linux. Puoi scaricarlo utilizzando un repository di software.

1- Download R con il browser Web

Se non sei in grado di ottenere R dal centro software, significa che il repository deve essere aggiornato per primo. Puoi semplicemente saltare tutto questo e scaricarlo dal web digitando questo link:

https: // cran.studio.com

Nella casella di ricerca sul tuo browser web. La loro homepage dovrebbe assomigliare allo screenshot di seguito:

2- Download R dal Terminal Linux

Accendi il terminale CLI, digita il comando in basso e premi Invio:

Quindi eseguire un aggiornamento con i comandi di seguito:

$ sudo apt-get update

Questo comando prenderà gli aggiornamenti di R e acquisirà tutti i file pertinenti dal repository principale di Ubuntu.

Quindi emettere il seguente comando per installare R:

Il comando sopra passa attraverso l'elenco dei pacchetti, rivelando quanto spazio su disco si riempirà, quindi chiede la conferma. Premi il tasto "Y" sulla tastiera per continuare con l'installazione.

Molto probabilmente l'output confermerà l'installazione.

Puoi cercarlo nella casella di ricerca come illustrato di seguito:

Installazione di RStudio su Ubuntu 20.04 con terminale di comando

Con il linguaggio di programmazione host installato, ora possiamo procedere all'installazione di RStudio. Per dimostrare l'installazione, utilizzeremo il terminale della riga di comando.

Accendi il terminale e emette quanto segue

$ sudo apt-get Installa gdebi-core

Ti verrà richiesto di inserire la password di root. Una volta immessa la password, inizierà l'installazione del pacchetto

$ wget https: // download1.RStudio.Org/Desktop/Bionic/AMD64/RStudio-1.3.1093-AMD64.Deb

Il pacchetto RStudio Online è ora collegato e viene trasferito sul tuo disco rigido.

Ti verrà chiesto di inserire nuovamente la password di root. Immettere la password per leggere e caricare l'elenco dei pacchetti.

L'installazione chiederà l'autorizzazione per continuare, premere il tasto Y sulla tastiera.

L'output verificherà l'installazione, come mostrato di seguito.

Iniziare con Rstudio:

Per lanciare Rstudio, vai alla casella di ricerca e alla ricerca RStudio. Lo vedrai all'interno di uno degli elenchi come mostrato di seguito:

Fai clic sull'icona RStudio per avviarla.

Studio di set di dati con RStudio

Con RStudio, è possibile visualizzare qualsiasi dati sotto forma di grafici, tabelle e grafici.

Per capire come i dati sono rappresentati visivamente in RStudio, prendiamo la popolazione del censimento del campione 2010 per ogni codice postale come esempio.

Il processo di analisi dei dati può essere vagamente ridotto ai seguenti quattro passaggi:

Dati grezzi a 1-import

È possibile importare i dati grezzi direttamente dal Web in RStudio facendolo sistematicamente nella finestra della console con il comando seguente:

$ CPD <- read.csv(url("https://data.lacity.org/api/views/nxs9-385f/rows.csv?accessType=DOWNLOAD")

Con il comando eseguito, RStudio otterrà i dati come file CSV dal Web e il contenuto verrà assegnato alla variabile CPD.

Un altro modo per l'importazione di dati su RStudio è scaricare manualmente il set di dati sul tuo harddrive e quindi aprire il contenuto con la funzione di dati di importazione di RStudio.

Vai all'opzione di set di dati di importazione nella scheda Ambiente e seleziona il file del set di dati da caricare. Fai clic su OK e verrai visualizzato la finestra di dialogo sul set di dati. Qui è dove specificherai i parametri, così come i nomi e i decimali. Quando hai finito, fai clic su Importa e il set di dati verrà aggiunto a RStudio e una variabile verrà assegnata al suo nome.

Per vedere quali set di dati sono in uso, emettere il comando di seguito con la variabile attribuita a un set di dati:

$ View (CPD)

2 -Manipulando i dati

Ora che hai importato il set di dati, c'è molto che puoi fare per trasformare questi dati. I dati vengono manipolati attraverso le caratteristiche di trasformazione. Supponiamo di voler visitare un certo array all'interno del set di dati. Se dovessimo andare alla colonna di popolazione totale nel nostro set di dati, inseriremmo il comando di seguito:

$ CPD $ Popolazione totale

I dati sono anche recuperabili sotto forma di un vettore:

$ CPD [1,3]

La funzione del sottoinsieme in RStudio ci consente di interrogare il set di dati. Diciamo che dobbiamo evidenziare le file in cui il rapporto maschio -femmina è positivo. Per scegliere quelle righe, emetteresti il ​​seguente comando:

$ a <- subset(cpd , Total Males > Femmine totali)

Nel comando sopra, il primo parametro che abbiamo assegnato doveva essere la variabile attribuita al set di dati a cui abbiamo applicato la funzione. La condizione booleana è considerata come il secondo parametro. Inoltre, la condizione booleana deve essere valutata per ogni riga. Funge da fattore decisivo se una riga deve far parte dell'output.

3 -Usando le funzioni medie sul set di dati

RStudio ha funzioni specifiche per elaborare le medie sul set di dati:

$ media (CPD $ Maschi totali) - Calcola una media semplice
$ mediana (cpd $ femmine totale) - dà la mediana per una colonna
$ quantile (cpd $ total popola
$ var (cpd $ total maschi) -works out the varianza per una colonna
$ SD (CPD $ FEMLES TOTALE) -Gives Standard Deviation

Per ottenere il report riassunto sul set di dati, è possibile eseguire una di queste funzioni anche sull'intero set di dati.

$ Riepilogo (CPD)

4 -create un grafico per il set di dati

Se hai intenzione di lavorare spesso con Rstudio, troverai il suo strumento di visualizzazione molto intraprendente. È possibile creare un grafico da qualsiasi set di dati importato con la trama e altre funzioni di visualizzazione in RStudio.

Per generare un diagramma a dispersione per il set di dati, emetterai il seguente comando:

$ trama (x = s $ maschi totali, y = s $ femmine totali, type = 'p')

Ora, discutiamo dei parametri coinvolti qui. In ogni parametro, S si riferisce al sottoinsieme del set di dati originale e aggiungendo "P", stai indicando che si desidera che l'output sia tracciato.

Puoi anche rappresentare il tuo set di dati sotto forma di un istogramma:

$ HIST (CPD $ Totale famiglie)

Allo stesso modo, per ottenere un grafico a barre del set di dati importato:

$ conta <- table(cpd$Total Population)
$ Barplot (conteggi, main = "distribuzione totale della popolazione",
$ xlab = "Numero di totalizzatore")

Gestione dei dati in serie temporali non rivestiti

Per gestire i dati con serie temporali spaziate in modo non uniforme, è necessario integrare il pacchetto zoo con RStudio. Per ottenere il pacchetto zoo, vai all'angolo in basso a destra dello schermo in RStudio e al componente del pacchetto. Il pacchetto zoo converte i dati di serie temporali irregolari in oggetti zoo. Gli argomenti inseriti per creare oggetti zoo sono i dati, che vengono prima, seguiti dal valore da ordinare da.

Gli oggetti dello zoo forniscono supporto per facilità d'uso. Tutto quello che devi fare è digitare "trama" e verrai visualizzato tutti i metodi della trama che puoi usare con quel pacchetto zoo.

Se ti trovi confuso su ciò che una certa funzione RStudio ha da offrire, inserisci il nome di quella funzione e seguilo con "?"Per vedere il prompt nel menu di aiuto. Inoltre, premendo lo spazio CTRL+dopo un nome di funzione produce la finestra di completamento automatico.

Avvolgendo

Questo tutorial ha illustrato come è possibile impostare RStudio su Ubuntu 20.04 e coperto le basi della rappresentazione statistica e della manipolazione con Rstudio. Se desideri utilizzare meglio RStudio, familiarizzare con le basi della programmazione R dovrebbe essere un buon primo passo. RStudio è uno strumento potente e ha applicazioni in molti settori in tutto il mondo: intelligenza artificiale e data mining, per citarne alcuni.

Conoscere il nocciolo della programmazione R è un po 'una curva di apprendimento, ma vale la pena lo sforzo.