Funzione Pyspark Signum

Funzione Pyspark Signum
Il vantaggio principale della funzione Signum è fornire un segno ai valori indicati. In PysPark DataFrame con le colonne numeriche, se il valore è inferiore a 0, il Signum restituisce -1. Se il valore è uguale a 0, il Signum restituisce 0. Altrimenti, restituisce 1.

funzione Signum ()

La funzione Signum () è una funzione matematica utilizzata in pyspark. È disponibile nel pyspark.SQL.modulo funzioni.

Può essere utilizzato con il metodo Select perché select () visualizza i valori del SIGNUM nel frame dati PysPark.

Sintassi:
dataframe_obj.Select (Signum (DataFrame_Obj.colonna))

Parametro:
Ci vuole il nome della colonna come parametro per restituire i valori del Signum per quella colonna.

Ora vedremo alcuni esempi per capire meglio questa funzione.

Esempio 1
Creiamo un frame dati pyspark con 3 righe e 4 colonne, oltre a tutti i tipi numerici e restituisce i valori del Signum.

importare pyspark
Importa matematica
da pyspark.SQL Importazione di importazione
da pyspark.SQL.Funzioni Importa Signum
Spark_app = SparkSession.costruttore.nome dell'applicazione('_').getOrCreate ()
#Crea valori matematici
valori = [(matematica.PI, 0,7.8.120),
(matematica.PI/2,1,0.5.180),
(matematica.pi/3, -5, -12.9.360)
"
#Assign Colonne creando il frame dati pyspark
DataFrame_obj = Spark_app.creatotaframe (valori, ['value1', 'value2', 'value3', 'value4'])
dataframe_obj.spettacolo()
#get i valori del SIGNUM della colonna Value1
dataframe_obj.Select (Signum (DataFrame_Obj.valore1)).spettacolo()

Produzione:

Quindi, per il valore della colonna1, abbiamo restituito i valori del Signum.
3.141592653589793 è maggiore di 0. Quindi, il Signor è 1.
1.5707963267948966 è maggiore di 0. Quindi, il Signor è 1.
1.0471975511965976 è maggiore di 0. Quindi, il Signor è 1.

Esempio 2
Ora restituiremo i valori del Signum per le colonne Value2 e Value3.

importare pyspark
Importa matematica
da pyspark.SQL Importazione di importazione
da pyspark.SQL.Funzioni Importa Signum
Spark_app = SparkSession.costruttore.nome dell'applicazione('_').getOrCreate ()
#Crea valori matematici
valori = [(matematica.PI, 0,7.8.120),
(matematica.PI/2,1,0.5.180),
(matematica.pi/3, -5, -12.9.360)
"
#Assign Colonne creando il frame dati pyspark
DataFrame_obj = Spark_app.creatotaframe (valori, ['value1', 'value2', 'value3', 'value4'])
dataframe_obj.spettacolo()
#get i valori di Signum di Value2 e Value3 colonna
dataframe_obj.Select (Signum (DataFrame_Obj.value2), Signum (dataframe_obj.valore3)).spettacolo()

Produzione:

Colonna - Valore2:

0 è 0. Quindi, il Signor è 0.
1 è maggiore di 0. Quindi, il Signor è 1.
-5 è inferiore a 0. Quindi, il Signor è -1.

Colonna - Valore3:

7.8 è maggiore di 0. Quindi, il Signor è 1.
0.5 è maggiore di 0. Quindi, il Signor è 1.
-12.9 è inferiore a 0. Quindi, il Signor è -1.

Nota: La funzione Signum () restituirà null se la si applicano nei valori della stringa. Funziona solo su dati numerici.

Conclusione

In questo tutorial Pyspark, abbiamo discusso della funzione Signorum (). Signum () è una funzione matematica che può essere utilizzata in pyspark. È disponibile nel pyspark.SQL.modulo funzioni. In una colonna DataFrame, se il valore è inferiore a 0, il Signum restituisce -1. Se il valore è uguale a 0, il Signum restituisce 0. Altrimenti, restituisce 1.