La funzione per percentile_disc approssimativa RedShift esegue il suo calcolo in base all'algoritmo di riepilogo quantile. Approssimerà il percentile delle espressioni di input fornite in ordinato da parametro. Un algoritmo di riepilogo quantile è ampiamente utilizzato per gestire grandi set di dati. Restituisce il valore delle righe che hanno un piccolo valore distributivo cumulativo uguale o maggiore del valore percentuale fornito.
La funzione percentuale_disc approssimativa in redshift è una delle funzioni del nodo solo calcolato in Redshift. Pertanto, la query per il percentile approssimativo restituisce l'errore se la query non si riferisce alla tabella definita dall'utente o alle tabelle definite dal sistema Redshift AWS.
Il parametro distinto non è supportato nella funzione percentuale_disc approssimativa e la funzione si applica sempre a tutti i valori passati alla funzione anche se ci sono valori ripetuti. Inoltre, i valori null vengono ignorati durante il calcolo.
Sintassi per utilizzare la funzione percentuale approssimativa
La sintassi per utilizzare la funzione percentuale approssimativa di redshift è la seguente:
Percentuale approssimativo_disc (Percentile
IL percentile Il parametro nella query sopra è il valore percentuale che desideri trovare. Dovrebbe essere costante numerico e varia da 0 a 1. Pertanto, se vuoi trovare il 50 ° percentile, metterai 0.5.
Ordine per espressione
IL Ordine per espressione viene utilizzato per fornire l'ordine in cui si desidera ordinare i valori e quindi calcolare il percentile.
Esempi per utilizzare la funzione percentuale approssimativa
Ora in questa sezione, prendiamo alcuni esempi per comprendere appieno come la funzione percentile_disc approssimativa in Redshift funziona.
Nel primo esempio, applicheremo la funzione percentuale approssimativa di una tabella denominata approssimazione come mostrato di seguito. La seguente tabella RedShift contiene l'ID utente e i marchi ottenuti dall'utente.
ID | Segni |
0 | 10 |
1 | 10 |
2 | 90 |
3 | 40 |
4 | 40 |
5 | 10 |
6 | 20 |
7 | 30 |
8 | 20 |
9 | 25 |
Applicare il 25 ° percentile sulla colonna segni del approssimazione Tabella che verrà ordinata per ID.
Seleziona Marks, approssimativo percentuale_disc (0.25)Il 25 ° percentile del segni colonna del approssimazione La tabella sarà la seguente:
Segni | PROPRITALILE_DISC |
10 | 0 |
90 | 2 |
40 | 3 |
20 | 6 |
25 | 9 |
30 | 10 |
Ora applichiamo il 50 ° percentile alla tabella sopra. Per questo, usa la seguente query:
Seleziona Marks, approssimativo percentuale_disc (0.5)Il 50 ° percentile del segni colonna del approssimazione La tabella sarà la seguente:
Segni | PROPRITALILE_DISC |
10 | 1 |
90 | 2 |
40 | 3 |
20 | 6 |
25 | 9 |
30 | 10 |
Ora, proviamo a richiedere il 90 ° percentile sullo stesso set di dati. Per questo, usa la seguente query:
Seleziona Marks, approssimativo percentuale_disc (0.9)Il 90 ° percentile del segni colonna del approssimazione La tabella sarà la seguente:
Segni | PROPRITALILE_DISC |
10 | 7 |
90 | 2 |
40 | 4 |
20 | 8 |
25 | 9 |
30 | 10 |
La costante numerica del parametro percentile non può superare 1. Ora, proviamo a superare il suo valore e impostalo su 2 per vedere come la funzione approssimativa percentuale_disc tratta questa costante. Usa la seguente domanda:
Seleziona segni, approssimativo percentuale_disc (2)Questa query lancerà il seguente errore che mostra che la costante numerica percentuale varia solo da 0 a 1.
Applicazione della funzione percentuale_disc approssimativa sui valori null
In questo esempio, applicheremo la funzione percentuale_disc approssimativa su una tabella denominata approssimazione che include i valori null come mostrato di seguito:
Alfa | beta |
0 | 0 |
0 | 10 |
1 | 20 |
1 | 90 |
1 | 40 |
2 | 10 |
2 | 20 |
2 | 75 |
2 | 20 |
3 | 25 |
NULLO | 40 |
Ora, richiediamo il 25 ° percentile su questa tabella. Per questo, usa la seguente query:
Seleziona Alpha, approssimativo percentuale_disc (0.25)Il 25 ° percentile del alfa colonna del approssimazione La tabella sarà la seguente:
Alfa | PROPRITALILE_DISC |
0 | 0 |
1 | 20 |
2 | 10 |
3 | 25 |
4 |
Conclusione
In questo articolo, abbiamo studiato come utilizzare la funzione percentile_disc approssimativa nel redshift per calcolare qualsiasi percentuale di una colonna. Abbiamo imparato l'uso della funzione percentuale_disc approssimativa su diversi set di dati con costanti numeriche percentuali diverse. Abbiamo imparato come utilizzare parametri diversi durante l'utilizzo della funzione percentuale_disc approssimativa e come questa funzione tratta quando viene passata una costante percentuale di più di 1.