Pyspark - La serie Pandas rappresenta la serie Pandas, ma contiene la colonna Pyspark internamente.
Struttura dei dati della serie di supporto Panda e Panda viene importato dal modulo Pyspark.
Prima di allora, devi installare il modulo PysPark."
Comando
PIP Installa PysparkSintassi all'importazione
da Pyspark Import PandaSuccessivamente, possiamo creare o utilizzare la serie dal modulo Pandas.
Sintassi per creare serie Pandas
pyspark.panda.Serie()Possiamo passare un elenco o un elenco di elenchi con valori.
Creiamo una serie Pandas tramite Pyspark che ha cinque valori numerici.
#import panda dal modulo pysparkProduzione
Ora andremo nel nostro tutorial.
Le operazioni cumulative vengono utilizzate per restituire i risultati cumulativi attraverso i valori nella serie Pyspark Pandas.
Vediamoli uno per uno.
pyspark.panda.Serie.cumsum ()
cumsum () restituirà la somma cumulativa della serie per ciascun elemento. Può essere applicato a tutta la serie Pyspark Pandas.
Sintassi
pyspark_series.cumsum ()Dove pyspark_series è la serie Pyspark Pandas
Esempio
In questo esempio, eseguiremo un'operazione di somma cumulativa sulla serie.
Produzione
Lavorando:pyspark.panda.Serie.cumprod ()
CumProd () restituirà il prodotto cumulativo della serie per ogni elemento. Può essere applicato a tutta la serie Pyspark Pandas.
Sintassi
pyspark_series.cumprod ()Dove pyspark_series è la serie Pyspark Pandas
Esempio
In questo esempio, eseguiremo un'operazione cumulativa del prodotto sulla serie.
Produzione
Lavorando:pyspark.panda.Serie.cummin ()
cummin () restituirà il valore minimo cumulativo della serie per ciascun elemento. Può essere applicato a tutta la serie Pyspark Pandas.
Sintassi
pyspark_series.cummin ()Dove pyspark_series è la serie Pyspark Pandas
Esempio
In questo esempio, eseguiremo un'operazione cumulativa Min sulla serie.
Produzione
Lavorando:pyspark.panda.Serie.cummin ()
cummin () restituirà il valore minimo cumulativo della serie per ciascun elemento. Può essere applicato a tutta la serie Pyspark Pandas.
Sintassi
pyspark_series.cummax ()Dove pyspark_series è la serie Pyspark Pandas
Esempio
In questo esempio, eseguiremo un'operazione cumulativa massima sulla serie.
Produzione
Lavorando:Conclusione
In questo tutorial di Pyspark Pandas, abbiamo discusso delle operazioni cumulative eseguite nella serie Pyspark Panda. cumsum () viene utilizzato per restituire la somma cumulativa, cumprod () viene utilizzato per restituire il prodotto cumulativo, cummin () viene utilizzato per restituire il valore minimo cumulativo e cummax () viene utilizzato per restituire il valore cumulativo massimo.