Funzioni delle statistiche di Scipy

Funzioni delle statistiche di Scipy

In Python, c'è un pacchetto per le funzioni statistiche nella biblioteca Scipy. Il sotto-package di Scipy si chiama Scipy.statistiche. È principalmente impiegato per procedure statistiche e distribuzioni probabilistiche. I tipi di funzioni di probabilità sono numerosi. La natura open source della biblioteca consente l'espansione della sua capacità statistica. Possiamo lavorare con una varietà di distribuzioni tra cui distribuzioni binomiali, uniformi e continue. Abbiamo funzioni per variabili sia continue che discrete. Inoltre, possiamo eseguire il test t e calcolare il punteggio T. Con numerosi esempi, sappiamo di più sulle funzioni delle statistiche di Scipy.

SCIPY Statists Spiegazione

Numerose distribuzioni di probabilità, statistiche di frequenza e riepilogo, funzioni di correlazione e test statistici, stima della densità del kernel, statistiche mascherate, funzionalità Carlo quasi-monte e altre funzionalità sono incluse in questo modulo.

Ci sono molte aree nel vasto campo di statistiche che vanno al di fuori dell'ambito di Scipy e sono gestite da altri pacchetti. Tra i più significativi ci sono:

  • Statsmodels
  • Panda
  • PYMC
  • Scikit-learn

Il Scipy.Il sotto-package delle statistiche contiene tutte le routine statistiche e la funzione Info (Stats) restituisce un elenco piuttosto completo di queste funzioni. I pacchetti di sotto-dottorato statistici contengono inoltre un elenco delle variabili casuali disponibili. Questo modulo include una raccolta considerevole di distribuzioni di probabilità oltre a una raccolta in espansione di funzioni statistiche.

Cos'è la normale distribuzione casuale continua in Scipy?

Per comprendere variabili casuali sia discrete che continue, vengono sviluppate due classi di distribuzione generali. La normale distribuzione casuale continua è uno dei tipi di cui discuteremo qui.

La variabile può avere qualsiasi valore in questo tipo di distribuzione di probabilità. Ecco perché è noto come una variabile casuale continua.

Esempio 1:

Il primo esempio qui mostra come i concetti discussi nelle sezioni precedenti. Importiamo la funzione Norm, che deriva dalla classe RV_Continue, in questo codice di esempio. Le funzioni contengono approcci e informazioni per affrontare una particolare distribuzione continua.

Per calcolare il CDF su un array, utilizziamo la funzione Norm. Facciamo uno sforzo per comprendere la riga di codice per riga.

Nella prima riga del codice, importa la norma dal Scipy.Biblioteca delle statistiche. Successivamente, la libreria Numpy viene importata per l'esecuzione del programma. Successivamente viene creata una variabile denominata "check". Infine, viene utilizzata l'istruzione di stampa in cui la norma.La funzione cdf () viene eseguita sull'array specificato. Eseguiamo il codice e vediamo quale risultato produce.

da Scipy.Statistiche Importa Norm
importa numpy
check = numpy.Array ([4, -2,3,2,5,0])
Stampa (norma.CDF (check))

Qui, puoi vedere il risultato generato dal codice precedentemente scritto.

Un'altra cosa che possiamo fare è usare la funzione percentuale per determinare la mediana della distribuzione. L'inverso di CDF è PPF, che è abbreviato come PPF.

Qui, puoi vedere la mediana dei valori CDF generati nel codice precedente.

Come generare una distribuzione uniforme in Scipy

In poche parole, una distribuzione uniforme indica una probabilità piatta e costante che un valore rientri in un certo intervallo. È possibile creare una distribuzione uniforme. Dopo aver importato la funzione uniforme, dobbiamo creare il CDF dell'array.

Le parole chiave Scale e Loc ci consentono di espandere la funzionalità. La parola chiave LOC definisce il valore medio, mentre la parola chiave di scala definisce la deviazione standard. Ecco il codice:

Innanzitutto, importa il modulo numpy e uniforme. Successivamente, creiamo la variabile in cui archiviamo l'array numpy creato. Infine, l'istruzione di stampa può essere vista in cui l'uniforme.Viene utilizzata la funzione CDF.

importa numpy
da Scipy.Statistiche Importa uniforme
check_res = numpy.Array ([7,4,9,5,4])
Stampa (uniforme.CDF (check_res, loc = 5, scala = 3))

Allegato è l'output per il tuo aiuto.

Come generare una distribuzione binomiale in Scipy

Inoltre, importando binom, l'istanza della classe discreta del camper, possiamo produrre una distribuzione binomiale. È costituito da informazioni e metodi di classe. Il codice è uguale al codice precedente, tranne per il fatto che utilizziamo il bunom.funzione cdf () qui che include tre parametri che puoi vedere nell'ultima riga del codice.

importa numpy
da Scipy.statistiche importano binom
output = numpy.Array ([7,4,5,5,4])
Stampa (binom.CDF (output, n = 1, p = 3))

Ecco il risultato:

Quali sono le statistiche descrittive?

I risultati di statistiche fondamentali come min, max, media e varianza vengono restituiti usando l'array numpy come input. La tabella seguente elenca una manciata delle operazioni statistiche fondamentali incluse nel Scipy.pacchetto statistiche.

Nome funzione Descrizione
descrivere() Le statistiche descrittive dell'array fornite vengono calcolate tramite questa opzione.
gmean () La media geometrica dell'asse specificato viene calcolata con questa opzione.
hmean () Lungo l'asse scelto, la media armonica viene calcolata dalla funzione hmean ().
kurtosi () Questa funzione calcola la kurtosi.
modalità() Questo metodo restituisce il valore modale.
storto() Il metodo di Skew () testa l'inclinizzazione dei dati specificati.
f_oneway () Questo metodo esegue un ANOVA a 1 via.
iqr () Determina l'intervallo interquartile dei dati lungo l'asse scelto.
ZScore () Calcola il punteggio z di ciascun valore del campione. È relativo alla media del campione e alla deviazione standard.
sem () Determina i numeri nell'errore standard dell'array di input della media.

Cos'è un test t?

Il test t è uno dei modi migliori per valutare se due medie sono diverse l'una dall'altra o no. Il test t è anche un importante argomento di discussione in termini di differenze di gruppo.

T-Score

Il punteggio T misura il rapporto tra due gruppi e la varianza all'interno dei raggruppamenti. Il punteggio T riflette quanto siano simili o diversi i gruppi; Più piccolo è il punteggio T, più significativo è il punteggio T e maggiore è la differenza tra i gruppi.

Qui, ci vengono forniti due campioni che possono provenire dalla stessa distribuzione o due distribuzioni diverse. E vogliamo determinare se condividono le stesse caratteristiche statistiche. Vedi il seguente codice che è allegato qui:

dalle statistiche di importazione di Scipy
RVS_RES = STATS.norma.RVS (loc = 4, scala = 8, dimensione = (30,4))
stampa ("Ecco il risultato del confronto dei due campioni:")
Stampa (statistiche.ttest_1samp (rvs_res, 4.0))

Allegato è l'output:

Un valore p nell'output precedente rappresenta la probabilità che i risultati dei dati di esempio siano avvenuti per incidente. L'intervallo di valori p è dallo 0% al 100%.

Conclusione

Le funzioni delle statistiche di Scipy erano l'argomento di questo articolo. Il modulo delle statistiche di Scipy è un componente cruciale. È utile ottenere le distribuzioni probabilistiche. Usando le statistiche di Scipy, è possibile produrre numeri casuali discreti o continui. Include anche altre funzioni aggiuntive che forniscono valori statistici descrittivi. Abbiamo discusso delle variabili casuali, continue e casuali in questo post. Vengono discusse le funzioni per l'interazione con vari tipi di distribuzione. Inoltre, abbiamo descritto come è possibile analizzare i dati utilizzando il test t per determinare il valore medio.