Regressione lineare numpy

Regressione lineare numpy

“Stiamo vivendo in un'epoca in cui siamo circondati da scienze dei dati, set di dati più grandi, alti computer di potenza computazionale e intelligenza artificiale. La scienza dei dati e l'intelligenza artificiale si sono fatte strada verso la navigazione autonoma dei veicoli; Le immagini sono riconosciute da loro, decisionando settori energetici e finanziari, settori del mercato azionario e anche i nostri circoli sociali sono stati rivoluzionati dall'apprendimento automatico e quindi dal progresso nelle scienze biomediche. La regressione lineare è una delle più importanti tecniche di apprendimento automatico che ci consente di eseguire analisi statistiche dei dati o calcoli scientifici e qualunque campo scegliamo dove vogliamo diventare artificialmente intelligenti, incontreremo la regressione lineare.

La regressione lineare è un metodo nell'apprendimento automatico che viene utilizzato per apprendere la relazione tra una variabile dipendente, diciamo "y" e le varie variabili indipendenti "x". Sulla base di questa relazione tra le variabili, la regressione lineare prevede gli eventi futuri per la "Y". Le variabili nella regressione lineare sono le caratteristiche che rappresentano gli attributi dell'osservazione e l'osservazione è l'unico punto dati nel set di dati. L'output previsto dipende da queste osservazioni e dalle caratteristiche. Le applicazioni di regressione lineare includono la previsione dei prezzi delle case a seconda delle caratteristiche (come l'area della casa, le camere da letto che ha, l'interno della casa), le previsioni meteorologiche, la previsione del mercato azionario, ecc."

Procedura

L'articolo mostrerà il metodo di implementazione per i modelli di regressione lineare. Applicheremo questo modello a un set di dati e per implementare questo modello, seguiremo alcuni passaggi per addestrare prima il modello per imparare a prevedere e quindi testare il modello per verificare la chiusura della previsione del modello L'output effettivo.

Sintassi

La sintassi per il modello di regressione è la seguente:

$ modello = regressione lineare ()


Useremo la funzione sopra menzionata per implementare il modello di regressione adattando il set di dati a questo modello. Forgheremo i dati sul modello di regressione lineare per stimare il valore per l'output usando l'ipotesi e la funzione di perdita come:

Y_predred (h (x) = b0 + b1*x), che è il valore previsto per la risposta di output "y" dal modello.

Funzione di perdita = Actual_y - Y_predied

Valore di ritorno

Il valore di ritorno per il modello di regressione è continuo in quanto la regressione ha una variabile dipendente continua come output, "y" e variabili multiple, "x", che può essere discreta o continua.

Esempio # 01

Iniziamo a implementare il modello di regressione lineare. Per l'implementazione di questa funzione, useremo l'interprete "Spyder" di Python. Per iniziare a implementare il modello, dovremmo applicare determinate funzioni e classi dai diversi pacchetti di libreria. La prima e principale biblioteca per questa implementazione sarebbe la "numpy". Conosciamo tutti questa libreria numpy in quanto ciò consente le operazioni e l'implementazione degli array multidimensionali e delle matrici, ed è un pacchetto open source. Questo verrà utilizzato nel programma per implementare l'array con dimensioni diverse.

Un altro pacchetto importante è "Scikit-Learn", questo pacchetto è costruito sul numpy e consente la pre-elaborazione dei dati e la riduzione della dimensionalità e implementa i modelli di regressione, le classificazioni e il clustering. Useremo questo pacchetto per l'implementazione del modello di regressione lineare in Python. Per importare questo pacchetto, utilizzeremo il comando "import" numpy con il prefisso chiamato "np", quindi dal pacchetto di Scikit Learn, importeremo il modello di regressione lineare come "da Sklearn.linear_model import linearregression ".

Dopo aver importato questi pacchetti, ora è il momento di creare i dati con cui vogliamo lavorare e farlo, definiremo la variabile dipendente (output) come "y" e la variabile indipendente (regressore) come "x". Per questo esempio, manterremo queste variabili semplici come oggetto array 1-D e questo segna i dati più semplici per la regressione. Dichiareremo la "X" come "NP". Array ([2, 12, 22, 32, 42, 52]). Reshape (-1, 1) "e" Y "come" NP. Array ([2, 10, 14, 20, 32, 36]) ". Y è monodimensionale e abbiamo rimodellato la x per essere (-1, 1) poiché vogliamo che la X abbia solo una colonna e diverse righe, quindi ha due dimensioni come la forma della X (6, 1).

Ora adatteremo queste variabili al modello di regressione lineare e, per farlo, chiameremo il metodo "Regressione lineare (). Fit (x, y) "e assegnarlo al" modello "variabile. Una volta che abbiamo montato il modello ora, controlliamo se il modello funziona o meno chiamando e applicando il ".Punteggio "sul modello come" modello. Punteggio (x, y) ". IL .Il punteggio prende anche il predittore come "x" e la risposta come "y", e dà il r^2, che è il coefficiente della determinazione, il che significa che indica quanto bene il modello può fare previsioni.

Ora per controllare i valori per gli attributi di "ipotesi = b0 +b1*x", useremo il "modello. intercetta ", che darà" B0 "e" Modello. coef_ "che restituirà il valore per" B1 "che sono i valori stimati dal modello per" Y ". Ora, dopo aver ottenuto questi valori, prevederemo usando il modello che chiama il "modello. prevedi (x) ”e salvalo in y_predicted. La risposta sarà prevista dal modello e quindi abbiamo addestrato il nostro modello; Ora, per testare come funziona il modello sul set di dati di test, passeremo i nuovi valori di X ai parametri del "modello. prevedere (x_new) ". Il modello fornirà i valori previsti come risposta all'output per la nuova "X". Il codice per l'allenamento e quindi il test del modello di regressione lineare è riportato di seguito nella figura.


Conclusione

Abbiamo addestrato un modello, che è "regressione lineare", dall'apprendimento di Numpy e Scikit su un set di dati per prevedere la risposta per il set di dati, quindi abbiamo testato questo modello per prevedere la risposta per il nuovo set di dati.