"Il pacchetto numpy di Python offre una funzione chiamata" Corroef "; Questa funzione viene utilizzata ogni volta che dobbiamo calcolare i coefficienti di correlazione per il "momento del prodotto di Pearson". I coefficienti di correlazione che abbiamo calcolato per il discorso del momento del prodotto Pearson sull'entità della correlazione tra le due variabili. Questi coefficienti di correlazione vengono spesso calcolati quando i due grafici sono tracciati sul diagramma sparso e ci aspettiamo che la relazione tra queste variabili sia più inclinata verso la relazione lineare, quindi usando il coefficiente di correlazione, stimiamo l'affiliazione lineare tra le variabili e Questi coefficienti di correlazione sono rappresentati come "R".
Il numpy è noto per essere la biblioteca più riconoscibile di Python e tutte le operazioni (matematiche e algebriche) possono essere applicate sugli Array ND utilizzando le funzioni che questo pacchetto di biblioteca offre."
Procedura
Questo articolo mostrerà il metodo per stimare la correlazione tra le due variabili usando la funzione Numpy Corcoef (). Impareremo il metodo per scrivere il programma nello script Python per questa funzione eseguendo praticamente il programma sul compilatore Python per diversi esempi.
Sintassi
Le funzioni prendono le variabili o gli array e le correlazioni tra tali array saranno quindi calcolate dalla funzione e verranno restituite come output della funzione.
numpy. corrcoef (x, y = nessuno, rowvar = true, bias =, ddof =, dtype)
La "x" e "y" sono gli array che dobbiamo specificare per calcolare i coefficienti di correlazione della variabile. "Row Var" è un parametro opzionale; Se il suo valore è impostato su true, che è anche il suo valore predefinito, la funzione considera che ogni riga sia una variabile altrimenti per il caso di false ogni colonna rappresenta una variabile. "DType" è il tipo di dati che predefinito è il "float" per l'output e il resto due parametri "bias" e "ddof" sono opzionali o non sono considerati, quindi non ci preoccupiamo di usarli.
Valore di ritorno
Il valore di restituzione per il metodo Numpy corcoef () sarà i coefficienti di correlazione che riveleranno la correlazione tra le variabili.
Esempio # 01
Quando lavoriamo su statistiche e scienze dei dati, sappiamo che questi due campi sono più interessati a conoscere la relazione tra le variabili nel set di dati. Ogni punto dati in un set di dati è l'osservazione e le proprietà di ciascuna osservazione sono rappresentate come caratteristica e queste funzionalità sono le variabili del set di dati. E qualunque set di dati che utilizziamo tratta la funzione o le variabili e le osservazioni.
Per comprendere la correlazione tra le caratteristiche, pensa a un esempio di "come l'accuratezza nel sparare al basket al bersaglio del giocatore è influenzata dall'altezza del giocatore". Ora abbiamo imparato qual è esattamente la caratteristica e quanto è importante sapere sulla loro correlazione. Quindi, con ciò, esploriamo questa funzione corcoef () implementandola su ND-Arrays per trovare la correlazione tra le caratteristiche degli array. Il software che utilizzeremo per implementare l'esempio è "Spyder", che ha installato pacchetti di libreria in esso.
Inizieremo con la scrittura del programma e importeremo il modulo numpy dalla biblioteca Numpy; Questo è obbligatorio lavorare con gli Arraggi ND. Passeremo al passaggio successivo e creeremo due array (unidimensionali) chiamando il "NP. Metodo array () "e nominerà rispettivamente gli array" arr_1 "e" arr_2 ". Possiamo inizializzare gli array con elementi casuali, quindi per l'esempio li specificheremo come "[3, 6, 9]" per arr_1 e "[4, 7, 8]" per arr_2. Ora vogliamo conoscere la correlazione tra questi due array, quindi inoltreremo questi array all'argomento di input della funzione "NP. corrcoef (arr_1, arr_2) ”e quindi inserire i risultati di questa funzione. Il codice per questo esempio viene riscritto nel linguaggio di programmazione "Python" come segue:
La funzione ha restituito un array 2D dei coefficienti di correlazione con il tipo di dati predefinito "float". Con questi coefficienti di correlazione, ora possiamo stimare la linearità nella relazione tra due o anche più di due variabili. Per questo esempio, se osserviamo la matrice 2D, i valori diagonali superiori sono "1", questo perché questi valori sono la correlazione tra arr_1 e arr_1 e arr_2 con arr_2, mentre i valori di basso livello e di destra correlazione tra arr_1 e arr_2 e sono gli stessi e hanno il valore “0.96 ”, e questo rappresenta i coefficienti di correlazione del momento del prodotto Pearson.
Esempio # 02
Questo esempio prenderà il corrcoef () per gli array bidimensionali e definiremo questi due array con il metodo "NP. vettore ()". Gli elementi per entrambi questi array saranno "([3, 6, 9], [4, 7, 8])" e "([6, 3, 8], [2, 5, 12])", rispettivamente. Avremo nominato questi due array 2D "arr_1" e "arr_2", quindi passeremo questi array al metodo Numpy Corcoef () e salveremo i risultati da questa funzione e li visualizzeremo usando il metodo print (). Il codice per questo esempio è mostrato nella figura allegata di seguito. Copieremo quel codice e lo faremo eseguito sul compilatore "Spyder".
L'output ha visualizzato l'array a quattro dimensioni con i coefficienti di correlazione come elementi con il tipo di dati float. Questi coefficienti rappresentano la relazione tra gli array bidimensionali che avevamo dichiarato nell'esempio. Dall'articolo, osserva che la diagonale superiore ha lo stesso valore di 1, che mostra che sono i coefficienti di correlazione per le stesse variabili e i valori in altri luoghi vanno variabili; Questo perché questi valori mostrano la correlazione tra le diverse variabili.
Conclusione
Questa guida copre la funzione del coefficiente di correlazione per il "momento del prodotto di Pearson". Abbiamo dimostrato nell'articolo come possiamo applicare questa funzione sugli array monodimensionali e multidimensionali e in quale forma la funzione restituirà l'output per ND-Array. Abbiamo ulteriormente analizzato gli output dalla funzione per i due diversi esempi.