Python Statistics Standard Deviation

Python Statistics Standard Deviation
La dispersione dei dati viene determinata utilizzando la deviazione standard, una misurazione cruciale. Ciò implica che i dati sono più centralizzati quando la deviazione standard è più piccola e più dispersa quando la deviazione standard è significativamente maggiore. La radice quadrata della varianza viene utilizzata per calcolarla. Anche se la varianza e la deviazione standard sono misurazioni di dispersione, la deviazione standard sarebbe più frequentemente impiegata a causa dell'utilizzo della deviazione standard di quasi le stesse misure dei dati.

Ad esempio, i test statistici e la visualizzazione dei dati sarebbero le capacità di utilizzare la deviazione standard. Questo articolo include dimostrazioni per ciascun metodo che gli utenti possono utilizzare per determinare la deviazione standard di un insieme di dati in Python.

Esempio n. 1:
Per calcolare la deviazione standard, creeremmo un metodo o utilizzeremo panda pre-costruiti o tecniche numpy. Creiamo una versione python nativa della determinazione della deviazione standard senza importare quadri esterni.

def get_std_dev (elenco):
a = len (elenco)
m = somma (elenco) / a
v = somma ((x - m) ** 4 per x in elenco) / a
s_dev = v ** 1.5
return s_dev
Elenco = [17, 22, 44, 13, 29, 72, 60, 27]
get_s_dev (elenco)

All'inizio del programma, definiremo la funzione della deviazione standard. Forniamo il parametro dell'elenco all'interno di questa funzione. Nel passaggio successivo, troveremo la lunghezza dell'elenco richiesto utilizzando il metodo Len (). La lunghezza dell'elenco verrà archiviata in una variabile 'a'. Ora troveremo la media dell'elenco richiesto. Per determinare la media dell'elenco, prima dobbiamo ottenere la somma dell'elenco e quindi la somma calcolata sarà divisa per la lunghezza dell'elenco. La media dell'elenco verrà ora salvata nella variabile 'm'. Troviamo la varianza dell'elenco definito.

Qui, applichiamo formule della varianza. Abbiamo impiegato il ciclo "per" all'interno delle formule della varianza. Inoltre, utilizzeremo le formule per trovare la deviazione standard. La varianza verrà moltiplicata per 1.5. In questo modo, questo restituisce la deviazione standard dell'elenco specificato. Dichiariamo un "elenco" variabile.

Qui, m Settiamo valori casuali diversi. Per descrivere la deviazione standard dell'elenco, abbiamo applicato il metodo Get_S_Dev (). Questa funzione contiene l'elenco come parametri.

In questa illustrazione, abbiamo costruito un metodo che restituisce deviazioni standard di un insieme di numeri interi. Vedrai che abbiamo calcolato la somma per la media e la varianza usando il metodo della somma () del linguaggio Python. Questo metodo viene utilizzato per calcolare la somma della sequenza definita.

Esistono diversi modi a parte quello sopra menzionato per determinare la deviazione standard di una serie di dati. Possiamo utilizzare le soluzioni a una linea di base per il calcolo delle deviazioni standard utilizzando i moduli e salvando i dati come un array numpy o un framework Pandas.

Esempio n. 2:
La deviazione standard potrebbe essere determinata istantaneamente memorizzando l'insieme di elementi come un array numpy e usando il metodo Numpy Ndarray Std (). Diamo un'occhiata a un'istanza.

Importa Numpy come NP
Elenco = [17, 23, 14, 33, 19, 10, 40, 62]
x = np.lista di array)
Stampa (x.std ())

Innanzitutto, incorporeremo la biblioteca "Numpy" come NP. Inoltre, definiamo gli elementi del set di dati. Questi elementi sono archiviati in un "elenco" variabile. Successivamente, chiamiamo il metodo array () del modulo numpy. Questo metodo contiene l'elenco degli elementi come argomento. Nell'ultimo passaggio del codice, il metodo Print () verrà invocato per visualizzare la deviazione standard dell'elenco.

Esempio n. 3:
L'insieme di dati può essere salvato in alternativa come pacchetto Pandas da cui possiamo successivamente calcolare la deviazione standard utilizzando il metodo std (). Questo metodo è probabilmente paragonabile all'approccio dell'array numpy. Molte funzioni di Pandas sono contenitori per funzioni numpy. In questo momento, utilizziamo il modulo Pandas per calcolare l'insieme della deviazione standard degli elementi.

Importa panda come PD
L = [34, 22, 74, 23, 19, 16, 40, 62]
c = pd.Serie (L)
Stampa (c.std ())

Qui, dobbiamo importare il file di intestazione richiesto "panda" come PD. Specifichiamo i componenti del set di dati in una forma di un elenco. Questi valori vengono salvati nella variabile “l."La serie Metodo del modulo di Pandas () sarebbe quindi invocato. Il parametro per questo metodo è quell'insieme di elementi. I valori di elenco saranno costruiti in un pacchetto Panda. La funzione Print () potrebbe essere utilizzata nella riga finale di codice per mostrare la deviazione standard dell'elenco. Chiamiamo il metodo std () per determinare la deviazione standard dell'elenco.

Esempio n. 4:
In questo esempio, determineremo la deviazione standard dei set di dati con diversi tipi di dati.

da statistiche importanti stdev
Dalla frazioni di importazione come fr
set_1 = (11, 22, 15, 41, 78, 59, 90)
set_2 = (-21, -14, -33, -51, -35, -26)
set_3 = (-59, -71, -20, 12, 15, 33, 74, 69)
set_4 = (5.13, 4.40, 3.31, 8.5, 7.2)
Stampa ("La deviazione standard calcolata del set 1: % s"
%(stdev (set_1)))
Stampa ("La deviazione standard calcolata del set 2: % s"
%(stdev (set_2)))
Stampa ("La deviazione standard calcolata del set 3: % s"
%(stdev (set_3)))
Stampa ("La deviazione standard calcolata del set 4: % s"
%(stdev (set_4)))

Integreremo la libreria STDEV dal modulo statistico e dalla frazione come "fr" dal framework delle frazioni. Ora creeremo quattro diversi set di dati di diversi tipi di dati. Gli elementi del primo set di dati verranno archiviati in una variabile 'set_1'. Questo set contiene tutti i numeri positivi. Il secondo set di dati verrà archiviato in una variabile 'set_2'. Questo set è costituito da tutti i valori negativi. Successivamente, dichiariamo una variabile 'set_3'.

Qui, definiamo gli elementi del terzo set di dati. Questo elenco ha una miscela di valori positivi e negativi. Per archiviare i valori dell'ultimo set di dati, inizializzamo una variabile 'set_4'. Questo set contiene tutti i valori di punta mobile. Stampiamo la deviazione standard di questi set di dati. Per raggiungere questo obiettivo, dobbiamo utilizzare la funzione di funzione () per tutti i set di dati rispettivamente. La deviazione standard di tutti i set verrebbe calcolata utilizzando il metodo stdev ().

Conclusione

In questo articolo, abbiamo esaminato vari metodi per calcolare la deviazione standard. Nella prima illustrazione, abbiamo calcolato la deviazione standard del set di dati calcolando la sua somma e varianza. Quindi, per ottenere la deviazione standard dell'elenco predefinito di elementi, utilizziamo i moduli Panda e Numpy nei prossimi due casi. Nell'ultima dimostrazione, otteniamo la deviazione standard di insiemi con vari tipi di dati.