Funzione percentile_disc approssimativa

Funzione percentile_disc approssimativa
La funzione percentile_disc approssimativa di RedShift è una delle funzioni aggregate fornite da Redshift per calcolare il percentile dell'espressione data in base al modello di distribuzione discreta. L'approssimazione è un metodo molto più veloce e ha un errore relativo basso di circa 0.5.

La funzione per percentile_disc approssimativa RedShift esegue il suo calcolo in base all'algoritmo di riepilogo quantile. Approssimerà il percentile delle espressioni di input fornite in ordinato da parametro. Un algoritmo di riepilogo quantile è ampiamente utilizzato per gestire grandi set di dati. Restituisce il valore delle righe che hanno un piccolo valore distributivo cumulativo uguale o maggiore del valore percentuale fornito.

La funzione percentuale_disc approssimativa in redshift è una delle funzioni del nodo solo calcolato in Redshift. Pertanto, la query per il percentile approssimativo restituisce l'errore se la query non si riferisce alla tabella definita dall'utente o alle tabelle definite dal sistema Redshift AWS.

Il parametro distinto non è supportato nella funzione percentuale_disc approssimativa e la funzione si applica sempre a tutti i valori passati alla funzione anche se ci sono valori ripetuti. Inoltre, i valori null vengono ignorati durante il calcolo.

Sintassi per utilizzare la funzione percentuale approssimativa

La sintassi per utilizzare la funzione percentuale approssimativa di redshift è la seguente:

Percentuale approssimativo_disc ( )
All'interno di gruppo ()
Da table_name

Percentile

IL percentile Il parametro nella query sopra è il valore percentuale che desideri trovare. Dovrebbe essere costante numerico e varia da 0 a 1. Pertanto, se vuoi trovare il 50 ° percentile, metterai 0.5.

Ordine per espressione

IL Ordine per espressione viene utilizzato per fornire l'ordine in cui si desidera ordinare i valori e quindi calcolare il percentile.

Esempi per utilizzare la funzione percentuale approssimativa

Ora in questa sezione, prendiamo alcuni esempi per comprendere appieno come la funzione percentile_disc approssimativa in Redshift funziona.

Nel primo esempio, applicheremo la funzione percentuale approssimativa di una tabella denominata approssimazione come mostrato di seguito. La seguente tabella RedShift contiene l'ID utente e i marchi ottenuti dall'utente.

ID Segni
0 10
1 10
2 90
3 40
4 40
5 10
6 20
7 30
8 20
9 25

Applicare il 25 ° percentile sulla colonna segni del approssimazione Tabella che verrà ordinata per ID.

Seleziona Marks, approssimativo percentuale_disc (0.25)
all'interno del gruppo (ordine per ID)
dall'approssimazione
gruppo per marchi

Il 25 ° percentile del segni colonna del approssimazione La tabella sarà la seguente:

Segni PROPRITALILE_DISC
10 0
90 2
40 3
20 6
25 9
30 10

Ora applichiamo il 50 ° percentile alla tabella sopra. Per questo, usa la seguente query:

Seleziona Marks, approssimativo percentuale_disc (0.5)
all'interno del gruppo (ordine per ID)
dall'approssimazione
gruppo per marchi

Il 50 ° percentile del segni colonna del approssimazione La tabella sarà la seguente:

Segni PROPRITALILE_DISC
10 1
90 2
40 3
20 6
25 9
30 10

Ora, proviamo a richiedere il 90 ° percentile sullo stesso set di dati. Per questo, usa la seguente query:

Seleziona Marks, approssimativo percentuale_disc (0.9)
all'interno del gruppo (ordine per ID)
dall'approssimazione
gruppo per marchi

Il 90 ° percentile del segni colonna del approssimazione La tabella sarà la seguente:

Segni PROPRITALILE_DISC
10 7
90 2
40 4
20 8
25 9
30 10

La costante numerica del parametro percentile non può superare 1. Ora, proviamo a superare il suo valore e impostalo su 2 per vedere come la funzione approssimativa percentuale_disc tratta questa costante. Usa la seguente domanda:

Seleziona segni, approssimativo percentuale_disc (2)
all'interno del gruppo (ordine per ID)
dall'approssimazione
gruppo per marchi

Questa query lancerà il seguente errore che mostra che la costante numerica percentuale varia solo da 0 a 1.

Applicazione della funzione percentuale_disc approssimativa sui valori null

In questo esempio, applicheremo la funzione percentuale_disc approssimativa su una tabella denominata approssimazione che include i valori null come mostrato di seguito:

Alfa beta
0 0
0 10
1 20
1 90
1 40
2 10
2 20
2 75
2 20
3 25
NULLO 40

Ora, richiediamo il 25 ° percentile su questa tabella. Per questo, usa la seguente query:

Seleziona Alpha, approssimativo percentuale_disc (0.25)
All'interno di gruppo (Ordine di Beta)
dall'approssimazione
Gruppo di Alpha
Ordine di Alpha;

Il 25 ° percentile del alfa colonna del approssimazione La tabella sarà la seguente:

Alfa PROPRITALILE_DISC
0 0
1 20
2 10
3 25
4

Conclusione

In questo articolo, abbiamo studiato come utilizzare la funzione percentile_disc approssimativa nel redshift per calcolare qualsiasi percentuale di una colonna. Abbiamo imparato l'uso della funzione percentuale_disc approssimativa su diversi set di dati con costanti numeriche percentuali diverse. Abbiamo imparato come utilizzare parametri diversi durante l'utilizzo della funzione percentuale_disc approssimativa e come questa funzione tratta quando viene passata una costante percentuale di più di 1.