SCIPY ZSCORE

SCIPY ZSCORE
Quando vuoi eseguire un po 'di calcolo statistico in Python, la prima libreria a cui fai riferimento è Scipy. Il linguaggio di programmazione di Python ha diverse librerie preziose che puoi usare in qualsiasi situazione in base al tuo bisogno. Tuttavia, Scipy è una delle biblioteche più comuni a cui puoi rivolgersi per ogni problema. Puoi eseguire qualsiasi tipo di calcolo statistico, lavoro scientifico, calcolo matematico, ecc. con Scipy. In questo articolo, vedrai uno dei metodi statistici forniti da Scipy, che è ZScore. Miriamo a esplorare e comprendere la funzione ZScore fornita dalla Biblioteca Scipy in questo articolo con l'aiuto di esempi. Cominciamo!

Cos'è ZScore?

Nelle statistiche, il punteggio z è la differenza tra la deviazione media e standard. Prendi un punto dai tuoi dati, sottrai la media da esso e quindi dividi per la deviazione standard. In altre parole, ZScore è la misura della dispersione dei dati, quindi dice a quanti valori la media dei dati è lontana dalla deviazione standard dei dati. Lo ZScore negativo mostra che la deviazione standard è al di sotto della media, lo 0 ZScore mostra che la deviazione media e standard è la stessa e lo ZScore positivo mostra che la deviazione standard è al di sopra della media.

Cos'è Scipy Zscore?

Lo ZScore è un metodo che è riportato nella biblioteca Scipy di Python. Viene utilizzato per calcolare automaticamente lo ZScore nel linguaggio di programmazione Python. Tutto quello che devi fare è fornire i tuoi dati e lasciare che la funzione ZScore faccia il lavoro. La sintassi della funzione ZScore è riportata nella seguente illustrazione per la tua comprensione:

ZScore prende uno richiesto e due parametri opzionali. Il parametro dell'array rappresenta l'array di input o i dati degli oggetti e deve essere fornito poiché il suo ZScore deve essere calcolato. Il parametro dell'asse è l'asse accanto al quale deve essere calcolata la media. È un parametro opzionale, quindi se non lo menzioni esplicitamente, la funzione ZScore utilizza il valore predefinito di 0. Il parametro DOF è un altro parametro opzionale che rappresenta il grado di libertà che viene utilizzato per correggere la deviazione standard. La funzione ZScore restituisce lo ZSCOre dei dati dati. Ora, apprendiamo con l'aiuto di esempi su come calcolare lo ZScore in un programma Python. Considera i seguenti esempi.

Esempio 1:

Come discusso in precedenza, ZScore trova la differenza tra la deviazione media e standard. Quindi, dobbiamo prima avere un elenco di dati da cui dobbiamo calcolare lo ZScore. Questo esempio spiega il processo passo -passo su come calcolare lo ZScore dei dati forniti. Considera il codice di esempio indicato nel seguente frammento di codice:

Importa Numpy come NP
dalle statistiche di importazione di Scipy
Array1 = [5, 10, 15, 20, 25]
Array2 = [2, 4, 6, 8, 10]
Print ("\ Narray 1 contiene:", Array1)
Print ("\ Narray 2 contiene:", Array2)
Print ("\ Narray 1 Z-Score: \ n", statistiche.ZSCORE (Array1))
Print ("\ Narray 2 Z-Score: \ n", statistiche.ZSCORE (Array2))

Quando dobbiamo utilizzare una funzione o un metodo da una determinata libreria, dobbiamo importare la libreria nel programma prima di utilizzare una delle sue funzioni per evitare errori. Quindi, come puoi notare, per primo importiamo la libreria Numpy come NP e la libreria SCIPY per importare il pacchetto StatS. Dopo aver importato le librerie richieste, forniamo due matrici di dati diversi in modo da poter vedere i diversi risultati della funzione ZScore. Entrambi gli array sono mostrati sullo schermo usando il comando print (). Gli array vengono passati alla funzione ZScore per calcolare lo ZScore. E il comando print () viene nuovamente utilizzato per mostrare il risultato. Ora, vediamo il seguente risultato:

Esempio 2:

Come abbiamo appreso la sintassi della funzione ZScore, sappiamo che prende un asse di parametro opzionale che è 0 per impostazione predefinita. In questo esempio, forniamo esplicitamente il valore dell'asse 1 per esplorare e comprendere come la funzione ZScore cambia il suo calcolo. Considera il seguente codice di esempio:

Importa Numpy come NP
dalle statistiche di importazione di Scipy
Array1 = [[5, 10, 15, 20, 25], [4, 8, 2, 6, 10]]
Array2 = [[2, 4, 6, 8, 10], [1, 2, 5, 3, 9]]
Print ("\ Narray 1 contiene:", Array1)
Print ("\ Narray 2 contiene:", Array2)
Print ("\ Narray 1 Z-Score lungo l'asse 1: \ n", statistiche.ZScore (array1, axis = 1))
Print ("\ Narray 2 Z-Score lungo l'asse 1: \ n", statistiche.ZSCORE (Array2, Asse = 1))

Ancora una volta, le librerie Numpy e Scipy vengono importate in quanto abbiamo bisogno di loro per utilizzare il pacchetto statistiche e l'array numpy insieme alla funzione ZScore. Come puoi notare, abbiamo fornito 2 array bidimensionali. Il parametro dell'asse può essere utilizzato con array multidimensionali, quindi in questo esempio abbiamo usato array bidimensionali. L'asse = 1 indica che lo ZSCORE calcolato di ciascun punto dati negli array è relativo all'array in cui si trovano. Se si confronta il risultato di entrambi gli array con il risultato che viene calcolato nell'esempio precedente, si potrebbe notare che il risultato della prima dimensione è lo stesso poiché i dati sono gli stessi e l'asse =. Ora, vediamo il seguente risultato:

Esempio 3:

Negli esempi precedenti, abbiamo utilizzato i dati di array semplici e definito specificamente i dati negli array. Possiamo anche definire un frame dati per la funzione ZScore per calcolare lo ZSCORE dei dati nel frame dati. In questo esempio, spiegheremo come dichiarare un telaio di dati e quindi passarlo alla funzione ZSCORE per calcolare la ZSCORE dei dati dati. Considera il seguente esempio di esempio per la tua comprensione:

Importa panda come PD
dalle statistiche di importazione di Scipy
data = pd.DataFrame (NP.casuale.Randint (1, 10,
size = (3, 3)), colonne = ['x', 'y', 'z'])
dati.Applicare (statistiche.zcore)

La libreria Pandas viene importata nel programma come PD poiché la funzione DataFrame () è fornita dalla libreria Pandas. La libreria Scipy è, come al solito, importata quando utilizziamo la funzione ZScore. Il frame data () viene dichiarato con valori casuali usando il casuale.funzione randint (). La dimensione del telaio dati è data 3 x 3, il che significa 3 righe e 3 colonne. I nomi per ogni colonna sono "X", "Y" e "Z". DataFrame () viene passato alla funzione ZScore per calcolare lo ZSCORE di ciascun punto dati. Vedi il seguente risultato:

Conclusione

Questo articolo è una rapida panoramica della funzione ZScore fornita dalla libreria Scipy. In Python, lo ZScore è una funzione fornita dalla libreria Scipy che viene utilizzata per calcolare automaticamente lo ZScore dei dati dati. Questa guida ha fornito alcuni esempi per spiegare come utilizzare la funzione ZScore in un programma Python.