Statistiche di Scipy in forma

Statistiche di Scipy in forma
Python è un linguaggio di programmazione software orientato agli oggetti e di alto livello che fornisce un ampio elenco di pacchetti che aiuta il suo utente a eseguire programmi software in modo più efficiente. Questa lingua ha la sua applicazione in quasi tutti i campi della vita ovunque sia richiesta l'automazione attraverso il software. Ciò è dovuto ai suoi poteri matematici e computazionali che rendono più facile l'implementazione di concetti diversi per i programmatori. Scipy contribuisce al pacchetto di biblioteche che Python offre. Questo pacchetto di biblioteche offre i suoi servizi fornendo varie funzioni integrate nel campo dell'apprendimento automatico, delle ottimizzazioni e dell'analisi dei dati. Scipy Stat Fit è la funzione di Scipy che utilizza l'attributo statistico o il modulo dalla libreria Scipy e aiuta a trovare la soluzione migliore per i set di dati. Il miglior adattamento qui specifica la distribuzione dei dati su un limite di decisione specifico.

Procedura

Con l'aiuto di Scipy Stat Fit, scopriremo come implementare la funzione Statists Fit () per trovare la linea di adattamento migliore o la distribuzione per i set di dati richiesti. La sintassi di questa funzione verrà visualizzata e quindi sarà spiegata con l'aiuto dei parametri richiesti da questa funzione.

Sintassi

$ statistiche. norma.Fit (dati)

La linea sopra menzionata è la sintassi per il fit stat (). Questa funzione utilizza il modulo "Norm" dal modulo STATS di Scipy. La norma è la lunghezza di qualsiasi vettore o la distanza del vettore che parla della misura in cui il vettore è diffuso nello spazio. Il "dati" è il parametro di input della funzione che si riferisce ai dati la cui distribuzione o adattamento vogliamo calcolare.

Esempio # 01

La funzione statistica fit () calcola la distribuzione o afferma il tipo di distribuzione per un set di dati basato sulla natura dei suoi elementi. In altre parole, le statistiche si adattano () trovano la soluzione migliore per i dati per i diversi tipi di variabili casuali. Per quelle variabili che sono indipendenti e casuali, ci viene data la "distribuzione gaussiana" che è nota per essere la distribuzione naturale o normale per le variabili nel set di dati. Questo esempio calcolerà la distribuzione gaussiana per le variabili nel set di dati.

Per qualsiasi tipo di distribuzione, dobbiamo vedere i quattro parametri necessari come: il parametro di posizione, la forma della distribuzione, la scala e l'ultima è la soglia. Tutti questi parametri contribuiscono a un tipo di distribuzione. La distribuzione gaussiana ha la maggior parte delle sue osservazioni sul suo picco che è attorno alla media. Per implementare questo, utilizzeremo "Google Collab" che è un ambiente open source e pubblico che offre di eseguire i programmi Python con l'installazione precedente di tutti i suoi pacchetti. La libreria richiesta o il pacchetto per questo esempio saranno le statistiche dal Scipy. Quindi, in primo luogo, scriveremo il comando "da Scipy Import Statists".

Il prossimo passo sarà quello di generare nuovi dati per creare le variabili casuali con l'aiuto della norma dal modulo STAT come “Data = STATS. norma. RVS (a, b, size = 400, random_state = 140) ", questa funzione assume i due parametri" A "e la" B "per le normali variabili indipendenti e la" dimensione "per distribuire queste variabili nei numeri è selezionata come "400". Ora useremo i risultati di questa funzione e lo passeremo al parametro delle "statistiche. fit () "per trovare la distribuzione migliore per questi dati generati in modo casuale.

Nell'output della funzione, vorremmo visualizzare il "parametro di posizione" che dice dove si trovano i dati sull'asse x e sul "parametro di scala" che indica quanta dispersione esiste nei dati. Il codice per questo esempio è allegato di seguito.

dalle statistiche di importazione di Scipy
a = 1
B = 1
data = statistiche.norma.RVS (A, B, Size = 400, Random_State = 140)
posizione, scala = statistiche.norma.Fit (dati)
Stampa (posizione)
Stampa (scala)

L'output ha visualizzato la posizione e il parametro di scala per la distribuzione come 1.08 e 0.949 rispettivamente.

Esempio # 02

Ora useremo la funzione stat fide () per implementare un altro tipo di distribuzione per il set di dati con variabili casuali continue in esso. Per tale tipo di dati con variabili distorte positivamente, utilizziamo la "distribuzione gamma". L'asimmetria rappresenta quanto la distribuzione ha asimmetria in essa. La distribuzione gamma ha tre parametri comuni come la distribuzione normale E.G., scala, soglia e forma. Implementiamo questa distribuzione. Innanzitutto, importeremo le "statistiche" del modulo da The Library Scipy. Questa libreria viene importata in modo da poter utilizzare la funzione "norma" dal modulo STATS per generare i dati casuali per la distribuzione gamma. Quindi, importa questa libreria scrivendo il seguente comando "da Scipy Import Statists".

Il modulo STAT aiuterà anche a chiamare la funzione fit () per trovare la distribuzione per i dati che genereremo. Ora, dopo l'importazione delle statistiche, genera le variabili casuali continue fino alla dimensione 400 con il parametro "A" e passano alla funzione norma. gamma. RVS (una dimensione = 400, random_state = 140) ". Fino a questo passaggio, abbiamo creato i dati che vogliamo inserire nella distribuzione gamma poiché tutte le variabili in questi dati sono variabili casuali continue e possono adattarsi solo alla distribuzione gamma. Quindi, adatta a questi dati nella distribuzione gamma passando questi dati al parametro di input della funzione ”Statistiche. norma. adattamento (dati) ". Da questa distribuzione, scopriremo e visualizzeremo i parametri di scala, soglia e forma come output.

dalle statistiche di importazione di Scipy
a = 1.
random_data = Stats.gamma.RVS (a, size = 400, random_state = 140)
forma, scala, soglia = statistiche.gamma.Fit (random_data)
stampa (forma)
Stampa (scala)
Stampa (soglia)

Conclusione

L'articolo discute il concetto di trovare le distribuzioni migliori o più adatte per i dati o variabili generate in modo casuale o continue o indipendenti. Inoltre, l'articolo discute i parametri richiesti per la distribuzione e dimostra l'implementazione di due tipi di distribuzioni su due dati diversi con l'aiuto di esempi.