Pyspark - La serie Pandas rappresenta la serie Pandas, ma contiene la colonna Pyspark internamente.
Struttura dei dati della serie di supporto Panda e Panda viene importato dal modulo Pyspark.
Prima di allora, devi installare il modulo PysPark."
Comando
PIP Installa PysparkSintassi all'importazione
da Pyspark Import PandaSuccessivamente, possiamo creare o utilizzare la serie dal modulo Pandas.
Sintassi per creare serie Pandas
pyspark.panda.Serie()Possiamo passare un elenco o un elenco di elenchi con valori.
Creiamo una serie Pandas tramite Pyspark che ha cinque valori numerici.
#import panda dal modulo pysparkProduzione
Ora andremo nel nostro tutorial.
Le funzioni aggregate vengono utilizzate per eseguire operazioni di aggregazione come Sum (), Min (), Media () e Max ().Queste operazioni funzionano solo su dati numerici come interi, doppio, ecc
Vediamoli uno per uno.
pyspark.panda.Serie.somma()
Sum () nella serie PysPark Pandas viene utilizzato per restituire la somma totale.
Sintassi
pyspark_series.somma()Dove pyspark_series è la serie Pyspark Pandas.
Esempio
Somma di ritorno della Serie Pandas Pyspark sopra.
Produzione:
278pyspark.panda.Serie.Significare()
Media () nella serie Pyspark Pandas viene utilizzata per restituire la media totale.
Sintassi
pyspark_series.Significare()Dove pyspark_series è la serie Pyspark Pandas.
Esempio
Return Media della Serie Pandas Pyspark sopra.
Produzione
55.6pyspark.panda.Serie.min ()
Min () nella serie Pyspark Pandas viene utilizzato per restituire il valore minimo.
Sintassi
pyspark_series.min ()Dove pyspark_series è la serie Pyspark Pandas.
Esempio
Restituisci il valore minimo dalla serie Pyspark Pandas sopra.
Produzione
0pyspark.panda.Serie.max ()
max () nella serie Pyspark Pandas viene utilizzato per restituire il valore massimo.
Sintassi
pyspark_series.max ()Dove pyspark_series è la serie Pyspark Pandas.
Esempio
Restituisci il valore massimo dalla serie Pyspark Pandas sopra.
Produzione
90Conclusione
In questo tutorial sulla serie Pyspark Pandas, abbiamo visto quattro diverse funzioni di aggregazione eseguite nella serie. Sum () restituirà la somma totale, avg () viene utilizzato per restituire la media totale, min () viene utilizzato per restituire il valore minimo e max () restituirà il valore massimo.