Scipy Chi-quadrato

Scipy Chi-quadrato
Python è un noto linguaggio di programmazione di livello ad alta prestazione che consente varie funzioni e operazioni ingegneristiche, tecniche, orientate agli oggetti e matematiche. Python fornisce numerose biblioteche per i suoi utenti e uno dei linguaggi di programmazione più famosi e open source è "Scipy". La libreria Scipy contiene informazioni e applica le sue operazioni a diversi metodi di apprendimento automatico e.G., Algoritmi di apprendimento automatico e ottimizzatori che utilizziamo in sistemi artificialmente intelligenti. Usiamo un modulo chi-quadrato dalla libreria Scipy per eseguire i vari test per i dati categorici.

Procedura

Nell'articolo, utilizzeremo la funzione Chi-quadrato dalla libreria Scipy e effettueremo diversi test per i dati. Le informazioni sull'uso di questa funzione nello script Python saranno anche discusse e applicate a vari esempi in questo articolo.

Sintassi

Poiché eseguiremo i due test per verificare la relazione tra le variabili usando il metodo chi-quadro, discuteremo le due diverse sintassi per questa funzione.

Test di Chi Square -> $ chisquare (f_obs, ddof = 1, f_exp = nessuno, axis = 1)

Test di indipendenza di Chi Square -> $ CHI2_Contingency (osservato, lambda_ = nessuno correzione = false)

Valore di ritorno

Questa funzione restituisce il valore p-valore e il valore di test chi quadrato nel suo output.

Esempio # 01

Condurremo il primo test usando il quadrato chi che abbiamo discusso nella sintassi come test chi_square. Questo test ci racconta della relazione tra le variabili categoriche. Questa funzione utilizza il modulo "Statistiche" dell'attributo dal Scipy. Le statistiche calcolano il test in cui dobbiamo assumere un'ipotesi nulla e il chi quadrato verifica questa ipotesi nulla se i dati contengano o meno le frequenze specificate. Prende le frequenze osservate e previste come parametri e se queste due frequenze sono inferiori o meno o meno "cinque", il test è considerato non valido.

Eseguiremo lo stesso test nell'esempio, il compilatore che utilizzeremo per implementare l'esempio è "Google Collab" che funge da compilatore open source. Esegue il programma senza alcuna rata dei pacchetti della libreria poiché ha già i pacchetti installati. Dopo aver aperto il compilatore, crea semplicemente un progetto con un nome univoco e poi passiamo al passaggio successivo in cui importeremo i pacchetti della libreria per eseguire il test Chi Square.

Il test Chi Square è riportato nel modulo Statistiche di Python Scipy, quindi importeremo le "statistiche" dallo Scipy nel nostro progetto. Una volta che avremo importato questa libreria, definiremo un array con gli elementi come frequenze almeno più grandi o uguali a cinque. Quindi, definiremo l'array con il nome "array" con le frequenze osservate come "[3, 4, 6, 8, 10, 2]". Dopo aver creato correttamente questo array, chiameremo la funzione Chi Square con le "statistiche" del prefisso come "statistiche. chisquare () ". All'argomento di input di questa funzione, passeremo l'array che è il F_OBS (frequenza osservata) il parametro della funzione Chi Square.

Dopo aver eseguito il codice menzionato nello snippet di seguito, otterremo l'output come statistica Chi Square e il valore p. Questo test di Chisquare sarà valido poiché abbiamo definito almeno cinque frequenze osservate nel parametro di questa funzione.

dalle statistiche di importazione di Scipy
Array = [3,4,8,10,12]
statistiche.Chisquare (Array)

Esempio # 02

La funzione Chi Square ha un altro test per le variabili categoriche con il nome "Test Chi_square per l'indipendenza". Ora, questo test è leggermente diverso dal test chi-quadro di cui abbiamo discusso nell'esempio sopra poiché questo test controlla se esiste una relazione significativa tra le due variabili della classe categorica. Per questo test, Chi_square utilizza la funzione del modulo stat "contingenza chisquare" dal Python Scipy. Il test è condotto per mostrare se le variabili sono indipendenti l'una dall'altra o no. Per lavorare con questa funzione, creiamo un altro nuovo array. Per creare e definire questo nuovo array, dovremo importare il numpy con il nome "NP" in modo da poter chiamare il "NP" nel codice più avanti al posto del numpy.

Un altro importante pacchetto di biblioteche che deve essere importato per il corretto funzionamento del test di contingenza Chi Square sono le "statistiche". Importeremo il modulo statistico dalla biblioteca Scipy dalla lingua Python. Con la riuscita importazione delle librerie richieste per il progetto o il test di indipendenza Chi Square, nel passaggio successivo, definiremo un array con il nome "OBS_ARRAY". Useremo “NP. Il metodo array () "per creare questo array e le dimensioni dell'array verranno impostate su 2-dimensionali e gli elementi che questo array conterranno saranno come" ([2, 2, 2], [8, 8, 8] ) ". Questo array verrà utilizzato come osservazione che è il parametro di input per la funzione di contingenza chi_2 ().

Per chiamare il test di contingenza per l'indipendenza delle due variabili appartenenti alle classi categoriche, useremo le statistiche del prefisso e chiameremo la funzione Chi_2Contingency come "statistiche.Chi2_Contingency (OBS_ARRAY) ". Eseguiremo il seguente codice mostrato nella figura per ottenere i risultati per il test di indipendenza della funzione di contingenza quadrata Chi.

Importa Numpy come NP
dalle statistiche di importazione di Scipy
obs_array = np.Array ([[2, 2, 2], [8, 8, 8]])
statistiche.CHI2_Contingency (OBS_ARRAY)

Questa funzione restituisce il valore delle statistiche del test Chi Square, il valore p del test e i valori di quelle frequenze previste per le osservazioni che passiamo nei parametri della funzione. L'uscita della funzione viene visualizzata nella figura seguente.

Conclusione

L'articolo fornisce informazioni dettagliate sul metodo Chi Square che utilizza il modulo "Statistiche" dalla libreria Scipy. Abbiamo condotto due tipi di test per i metodi Chi Square implementando i due diversi esempi nello script Python e abbiamo mostrato come appare l'output o i valori di restituzione di questa funzione e cosa significano nel contesto del Scipy Chi Square ( ) metodo.