Modulo statistico
Il modulo Statistics fornisce semplici funzioni per il calcolo delle statistiche di un set di dati. Sostengono di non competere con Numpy, Scipy o altri software come SPSS, SAS e MATLAB. E in effetti, è un modulo molto semplice. Non fornisce test parametrici o addirittura non parametrici. Invece, può essere usato per fare alcuni semplici calcoli (anche se penso che anche Excel possa fare lo stesso). Sostengono inoltre di sostenere int, galleggianti, decimali e frazioni.
Il modulo statistico può misurare (1) medie e misure della posizione centrale, (2) misure di diffusione e (3) statistiche per le relazioni tra due input.
Statistiche.Significare()
Il modulo statistico contiene un gran numero di funzioni. Non ci copriremo ognuno, ma piuttosto alcuni di essi. In questo caso, il set di dati viene inserito in un elenco. L'elenco viene quindi passato alla funzione.
Per numeri interi:
principale.Statistiche di importazione PYQuando esegui quest'ultimo, ottieni:
principale.Py 3.5Per le frazioni, la terminologia è leggermente diversa. Dovrai importare il modulo chiamato frazioni. Inoltre, devi posizionare la frazione tra parentesi e scrivere una capitale F di fronte. Così 0.5 sarebbe uguale a F (1,2). Questo non è possibile per set di dati di grandi dimensioni!
principale.Statistiche di importazione PYQuando esegui quest'ultimo, ottieni:
principale.PY 617/840Nella maggior parte dei lavori di ricerca, il tipo di numero più comune che si incontra è il valore decimale, ed è molto più difficile da realizzare con il modulo statistico. Devi prima importare il modulo decimale e quindi mettere ogni valore decimale nella citazione (che è assurdo e poco pratico se si dispone di grandi set di dati).
principale.Statistiche di importazione PYQuando esegui quest'ultimo, ottieni:
principale.Py 2.81333333333333333333333333333Il modulo statistico offre anche la media FMEAN, la media geometrica e la media armonica. Statistiche.median () e statistiche.La modalità () è simile alle statistiche.Significare().
Statistiche.varianza () e statistiche.stdev ()
Nella ricerca, molto, molto raramente la dimensione del campione è così grande da essere uguale o approssimativamente uguale alla dimensione della popolazione. Quindi, esamineremo la varianza del campione e la deviazione standard del campione. Tuttavia, offrono anche una varianza della popolazione e una deviazione standard della popolazione.
Ancora una volta, se si desidera utilizzare i decimali, devi importare il modulo Decimals e se si desidera utilizzare le frazioni, è necessario importare il modulo Frazioni. Questo, in termini di analisi statistica, è piuttosto assurdo e molto poco pratico.
principale.Statistiche di importazione PYQuando esegui quest'ultimo, ottieni:
principale.Py 7.144266666666666666666666667In alternativa, la deviazione standard può essere calcolata facendo:
principale.Statistiche di importazione PYQuando esegui quest'ultimo, ottieni:
principale.Py 2.672876103875124748889421932Correlazione di Pearson
Per qualche ragione, sebbene gli autori del modulo statistico abbiano ignorato i test ANOVA, i test t, ecc ... includevano la correlazione e la semplice regressione lineare. Intendiamoci, la correlazione di Pearson è un tipo specifico di correlazione utilizzata solo se i dati sono normali; è quindi un test parametrico. C'è un altro test chiamato correlazione Spearman che può essere utilizzato anche se i dati non sono normali (che tende ad essere il caso).
principale.Statistiche di importazione PYQuando esegui quest'ultimo, ottieni:
principale.Py 0.9960181677345038Regressione lineare
Quando viene eseguita una semplice regressione lineare, emette una formula:
y = pendenza * x + intercettaExcel fa anche questo. Ma il massimo che questo modulo può fare è stampare il valore della pendenza e l'intercetta da cui è possibile ricreare la linea. Excel e SPSS offrono grafici per andare con l'equazione, ma nulla di tutto ciò con il modulo statistico.
principale.Statistiche di importazione PYQuando esegui quest'ultimo, ottieni:
principale.py il pendio è 0.9111784209749394Covarianza
Inoltre, il modulo statistico può misurare la covarianza.
principale.Statistiche di importazione PYQuando esegui quest'ultimo, ottieni:
principale.Py 4.279719999999999Sebbene Python offra un modulo chiamato Modulo statistico, non è per le statistiche avanzate! Intendiamoci, se vuoi effettivamente analizzare il tuo set di dati, allora vai con qualsiasi modulo diverso dal modulo statistico! Non solo è troppo semplice, ma anche tutte le funzionalità che offre possono essere facilmente trovate anche in Excel. Inoltre, ci sono solo due test - la correlazione di Pearson e la semplice regressione lineare - che questo modulo offre in termini di test. Non ci sono ANOVA, nessun test t, nessun chi-quadrato o simile! E per di più, se hai bisogno di usare i decimali, devi invocare il modulo decimale, che può essere frustrante per set di dati grandi e molto grandi. Non catturerai nessuno che abbia bisogno di un vero lavoro statistico svolto usando questo modulo (vai con SPSS se hai bisogno di cose avanzate), ma se è semplice divertimento che stai cercando, allora questo modulo è per te.
Codice felice!