Regressione lineare in R

Regressione lineare in R
Uno dei metodi di analisi dei dati più utilizzati è la regressione. L'apprendimento automatico sta avanzando e con esso arriva un noto algoritmo: la regressione lineare. Questo articolo ti farà conoscere come utilizzare la funzione di regressione lineare di R. I modelli di regressione si adattano alle linee ai dati osservabili per interpretare le associazioni con le variabili. È possibile utilizzare la tecnica per determinare come cambia una variabile dipendente come variabili indipendenti.

L'esplorazione della regressione è una tecnica statistica popolare per stabilire un modello della relazione tra due variabili. Una di queste variabili è definita variabile predittiva e il suo valore viene determinato attraverso studi. La variabile di risposta è l'altra variabile e la variabile predittore consente di ottenere un valore.

Qual è la regressione lineare nel linguaggio di programmazione R in Ubuntu 20.04?

Le due variabili sono collegate da un'equazione nella regressione lineare, in cui la potenza esponenziale di entrambe le variabili è una. Se raffigurato come grafico, una connessione lineare indica una linea retta in matematica. Una curva è formata da una connessione non lineare in cui il valore esponenziale di qualsiasi variabile non è equivalente a una.

Sintassi della regressione lineare nell'equazione matematica:
La regressione lineare ha la successiva equazione matematica a tutto tondo:

y = ax+b

Sintassi della regressione lineare nel linguaggio di programmazione R:
In R, la sintassi di base per l'esecuzione di un'analisi di regressione è la seguente:

lm (y ~ x)

Dove y è l'elemento che contiene la variabile da prevedere che dipende e x è la formula del modello matematico. Il comando LM () restituisce i coefficienti X ma non ha altri dati statistici. Possiamo usare la funzione LM () per creare un modello di relazione tra il predittore e la variabile di risposta.

Come la regressione lineare viene utilizzata in R in Ubuntu 20.04

I seguenti sono i quattro passaggi per stabilire una relazione:

  • Usando i metodi LM () in R, costruisci un modello di relazione.
  • Raccogli prima i coefficienti dal modello che hai costruito e usali per creare l'equazione matematica.
  • Per scoprire la inesattezza media nella previsione, ottenere un riepilogo del modello di relazione noto anche come residui.
  • Utilizzare la funzione prevet () in r per prevedere il nuovo valore per l'intercetta X.

Esempio n. 1: ottenere i coefficienti di regressione creando un modello di relazione

Qui, abbiamo creato il semplice modello di relazione delle due variabili per eseguire la regressione usando la funzione LM (). Questo ci porta i coefficienti del modello di relazione. Dimostriamo questo usando il seguente script:

Come mostrato nell'esempio precedente, abbiamo dichiarato una "A" variabile che viene inizializzata con un numero casuale come rappresentazione vettoriale. Quindi, abbiamo creato un'altra variabile a cui abbiamo anche assegnato la raccolta dei numeri casuali. La funzione LM () è chiamata all'interno della nuova relazione variabile. A questa funzione LM (), abbiamo superato le variabili "A" e "B" per generare le relazioni tra loro. Alla funzione di stampa, la variabile di relazione viene passata per mostrare l'output.

Quando viene eseguito il codice di regressione precedente, mostra la regressione dei risultati del coefficiente della variabile "A".

Esempio n. 2: ottieni un riepilogo della relazione

Il metodo Summary () in R può essere utilizzato per visualizzare i risultati del modello. Questa funzione crea una tabella con gli input più essenziali dal modello lineare.

Qui, abbiamo creato la variabile "A" a cui abbiamo assegnato la raccolta di alcuni numeri. C'è un'altra variabile "b" che ha anche un numero casuale. Queste variabili sono ora chiamate all'interno della funzione lm () che viene memorizzata nella relazione variabile. Qui, la variabile "B" è la variabile dipendente che deve essere prevista. Nella funzione di stampa, abbiamo una funzione di riepilogo per la relazione di regressione. Abbiamo superato la variabile di relazione all'interno della funzione di riepilogo come input.

Questa tabella di output riassume la formula che ha generato i risultati ("chiamata") e descrive i residui del modello ("residui"), che rappresentano il modo in cui l'intero modello si adatta ai dati effettivi. La tabella "coefficienti" arriva dopo. La prima riga mostra le stime dell'intercetta Y, mentre la seconda riga mostra il coefficiente di regressione del modello.

Esempio n. 3: utilizzando la funzione previsione per nuovi valori

Utilizziamo la funzione di previsione nella regressione lineare per i nuovi valori. Questa funzione porta due parametri sull'oggetto e i dati appena creati che sono il vettore. La formula che è già stata prodotta con la funzione LM () è chiamata oggetto. I nuovi dati vettoriali comprendono il nuovo valore per la variabile predittore.

Come riflesso nell'immagine precedente, abbiamo creato per la prima volta due vettori, "V1" e "V2". Quindi, abbiamo chiamato questi vettori nella funzione LM (). Il vettore "V1" è la variabile prevista e la "v2" è la variabile di risposta. Quindi, con la nuova variabile "X", troviamo il nuovo valore con "V1" è uguale a 150. La funzione Prevet prende l'oggetto "x" e i risultati della funzione LM ().

Quando viene eseguito lo script R precedente, genera i seguenti risultati:

Esempio #4: Rendi il diagramma di regressione lineare

Possiamo anche creare il diagramma di regressione del rivestimento in R. Abbiamo visualizzato il grafico di regressione lineare dal seguente script:

Abbiamo creato la variabile predittore e risposta come "x" e "y". Quindi, li abbiamo chiamati all'interno della funzione LM (). Il file PNG della trama viene creato in cui viene visualizzata la trama. Quindi, abbiamo disegnato il nostro diagramma di regressione lineare con alcuni input nella funzione della trama.

Puoi vedere il diagramma di regressione lineare come segue:

Conclusione

L'articolo regressione lineare in R finisce qui. La regressione lineare è un argomento molto vasto ma abbiamo fornito tutte le possibili spiegazioni necessarie per questo argomento. Il collegamento tra due variabili può essere stimato usando la regressione lineare. Qui, abbiamo coperto alcuni esempi di regressione lineare. Abbiamo la funzione LM () utilizzata nella regressione lineare. Quindi, abbiamo compreso la funzione di riepilogo della regressione lineare. Viene anche dimostrata la funzione di previsione e abbiamo anche rappresentato graficamente la regressione lineare.