Prima di costruire eventuali algoritmi di apprendimento automatico su un set di dati, l'analisi statistica inferenziale è essenziale. Ottenere inferenze statistiche dai dati fa anche parte di questo processo. In statistiche, alcuni concetti chiave descrivono la variabilità di una variabile numerica. Questi termini sono IQR, quartili, quantili, media e mediana. Aiutano a identificare eventuali anomalie nella colonna e nella distribuzione della colonna. Questo post è per determinare il quantile della colonna. La variabilità dei dati viene misurata utilizzando le funzioni quantili. Dopo aver ordinato i dati, è possibile utilizzare quantili per dividere i numeri in una data distribuzione in sottogruppi uguali. Possiamo facilmente calcolare quantili in R usando la funzione quantile, che restituisce tutti i quantili dello 0%, 25%, 50%, 75%e 100%.
Quantili nel linguaggio di programmazione r in Ubuntu 20.04
Quantile è una funzione generica che genera quantili di campioni per probabilità specificate. Una probabilità di 0 corrisponde all'osservazione più piccola, mentre una probabilità di 1 corrisponde alla più grande. Lì, abbiamo la sintassi per i quantili utilizzati in un linguaggio di programmazione R.
1 | quantile (x, probs = seq (0, 1, 1/4), Na.rm = false, nomi = true, type = 5, cifre = 5,…) |
Quanto segue è una descrizione dell'argomento precedente passato all'interno della funzione quantile:
X: Un elemento di una categoria per la quale è stata specificata una funzione o un vettore numerico in cui sono richiesti quantili di campioni. A meno che NA.RM è "vero", i valori NA e NAN non possono essere utilizzati nei vettori numerici.
problemi: La probabilità con valori in un vettore numerico; I valori al di fuori di tale intervallo fino a "2e-14" sono riconosciuti e trasferiti al seguente endpoint più vicino.
n / a.Rm: Se vero, vengono eliminati i valori Na e NAN in X prima che vengano valutati i quantili.
Nomi: Quando è vero, la funzione include un attributo Nome. Impostare su "falso" per ridurre il tempo necessario per risolvere un problema con un gran numero di variabili.
Cifre: Quando è vero, implementa la precisione per utilizzare le percentuali di formattazione. Internamente, nelle versioni R prima di 4.0.X, questo è stato impostato su Max (2, getOption ("cifre").
Questo articolo ti insegnerà quali sono i quantili e come calcolarli in R (quartili, ombili, decili e percentili). Per ottenere quantili di esempio per un set di dati, utilizzare l'utilità quantile () in R.
Esempio 1: usando una semplice funzione quantile per i vettori di pendolarismo in R in Ubuntu 20.04
Diamo un'occhiata a come funziona la funzione quantile in r con un semplice esempio che genera i quantili per l'input dei dati. Dobbiamo creare dati per applicare le funzioni quantili. Qui, abbiamo definito i dati variabili all'interno, che contiene i dati del vettore. Quindi, viene utilizzata la funzione quantile in cui abbiamo superato i dati precedentemente specificati insieme alla sequenza dichiarata. Quando abbiamo eseguito questo comando di funzione quantile, abbiamo ottenuto i quantili dei vettori come mostrato nel seguente prompt R:
Nel seguente prompt R, abbiamo nuovamente utilizzato la funzione quantile per calcolare i decili. Per questo, abbiamo superato la sequenza 0, 1 e ¼.
Qui, abbiamo valutato l'interesse per i quantili casuali. Abbiamo impostato i dati all'interno dell'argomento Probs, mostrando contemporaneamente l'output dei percentili. Si noti che la funzione quantile ha diviso i dati in porzioni uguali, con la mediana che funge da centro, la metà inferiore rimanente fungendo da quartile inferiore e la metà più alta che funge da quartile superiore.
Esempio 2: Utilizzo della funzione Quantiles per calcolare la colonna in un frame di dati in R in Ubuntu 20.04
Possiamo anche trovare il quantile della colonna data dal frame dati. Abbiamo definito i dati all'interno della funzione del frame dati nel seguente script r. Abbiamo generato elenchi con i nomi "List1", "List2" ed "List3" con valori numerici casuali.
Successivamente, chiama la funzione quantile e inserisci il nome della colonna con il simbolo "$" come il modo in cui abbiamo specificato "$ list3" per quantile. Come puoi vedere, la funzione quantile mette i valori di input in ordine crescente prima di restituire i percentili necessari.
Possiamo usare la funzione sapply () come mostrato all'interno del prompt se vogliamo valutare contemporaneamente i quantili di numerose colonne. Abbiamo superato l'opzione funzione (x) all'interno della funzione sapply insieme alla funzione quantile, che ha i parametri x e i probs. L'output da questa funzione visualizza tutti i quantili delle colonne contemporaneamente.
Esempio 3: utilizzando la funzione Quantiles e gestisce l'errore NAN in R in Ubuntu 20.04
I NANS possono essere trovati in quasi ogni situazione. Questi NAN, noti anche come valori mancanti, stanno diventando più comuni nel mondo digitale basato sui dati di oggi. Se i dati contengono questi numeri mancanti, l'output può contenere NANS o errori. Abbiamo anche dati vettoriali che includono alcuni valori NA chiamati dati vettoriali nella funzione quantile. L'eccezione viene lanciata dal compilatore R mostrato di seguito:
Possiamo rimuovere questo errore utilizzando il parametro quantile NA.Rm. Dobbiamo impostare il NA.Valore RM a "vero", che ci aiuta a eliminare questa eccezione NANS. Come puoi vedere nell'output, abbiamo ottenuto i valori percentili e rimosso correttamente i valori NA.
Esempio 4: usando la funzione quantile con parametro ProBS in R in Ubuntu 20.04
C'è anche l'opzione "Probs", che consente di specificare i percentili richiesti. L'argomento Probs, noto anche come argomento "probabilità", dovrebbe essere tra 0 e 1. All'interno del seguente script r, abbiamo utilizzato l'opzione Probs con i valori 33 e 66 all'interno della funzione quantile. L'output ha un messaggio di errore che i problemi sono al di fuori dell'intervallo.
Quando si imposta l'opzione Probs all'interno dell'intervallo di 0 e 1, mostra i valori dei percentili piuttosto che i valori falsi.
Conclusione
Abbiamo cercato di fare del nostro meglio per descrivere ed esplorare la funzione r quantile () in diverse dimensioni usando vari esempi. La forma quantile è la funzione più preziosa nell'analisi dei dati poiché mostra in modo efficiente dati aggiuntivi su informazioni specifiche. Abbiamo illustrato alcuni esempi che mostrano chiaramente il funzionamento della funzione quantile. Spero che ora capisca la funzione quantile () di R.