Pyspark - La serie Pandas rappresenta la serie Pandas, ma contiene la colonna Pyspark internamente.
Struttura dei dati della serie di supporto Panda e Panda viene importato dal modulo Pyspark.
Prima di allora, devi installare il modulo PysPark."
Comando
PIP Installa PysparkSintassi all'importazione
da Pyspark Import PandaSuccessivamente, possiamo creare o utilizzare la serie dal modulo Pandas.
Sintassi per creare serie Pandas
pyspark.panda.Serie()Possiamo passare un elenco o un elenco di elenchi con valori.
Creiamo una serie Pandas tramite Pyspark che ha cinque valori numerici.
#import panda dal modulo pysparkProduzione
Ora andremo nel nostro tutorial.
Le operazioni aritmetiche vengono utilizzate per eseguire operazioni come aggiunta, sottrazione, moltiplicazione, divisione e modulo. La serie PysPark Pandas supporta le funzioni integrate che vengono utilizzate per eseguire queste operazioni.
Vediamoli uno per uno.
pyspark.panda.Serie.aggiungere()
ADD () nella serie Pyspark Pandas viene utilizzata per aggiungere elementi nell'intera serie con un valore.
Prende il valore come parametro.
Sintassi
pyspark_series.aggiungere valore)Dove,
Esempio
In questo esempio, aggiungeremo 5 alla serie.
Produzione
Possiamo vedere che 10 viene aggiunto a ciascun elemento della serie.
pyspark.panda.Serie.sub()
Il sub () nella serie Pyspark Pandas viene utilizzato per sottrarre elementi nell'intera serie con un valore.
Prende il valore come parametro.
Sintassi
pyspark_series.sub (valore)Dove,
Esempio
In questo esempio, sottrarremo 10 dalla serie.
Produzione
Possiamo vedere che 10 viene sottratto da ogni elemento della serie.
pyspark.panda.Serie.mul ()
MUL () nella serie Pyspark Pandas viene utilizzato per moltiplicare elementi nell'intera serie con un valore.
Prende il valore come parametro.
Sintassi
pyspark_series.MUL (valore)Dove,
Esempio
In questo esempio, moltiplicheremo 10 con la serie.
Produzione
Possiamo vedere che 10 viene moltiplicato per ogni elemento della serie.
pyspark.panda.Serie.div ()
Div () nella serie Pyspark Pandas viene utilizzato per dividere gli elementi dell'intera serie per un valore. Restituisce un quoziente.
Prende il valore come parametro.
Sintassi
pyspark_series.div (valore)Dove,
Esempio
In questo esempio, divideremo la serie per 10.
Produzione
Possiamo vedere ogni elemento della serie è diviso per 10 e restituito quoziente.
pyspark.panda.Serie.mod ()
Div () nella serie Pyspark Pandas viene utilizzato per dividere gli elementi dell'intera serie per un valore. Restituisce il resto.
Prende il valore come parametro.
Sintassi
pyspark_series.mod (valore)Dove,
Esempio
In questo esempio, divideremo la serie per 10.
Produzione
Possiamo vedere ogni elemento della serie è diviso per 10 e restituito il resto.
Conclusione
In questo tutorial Pyspark Panda, abbiamo discusso delle operazioni aritmetiche eseguite nella serie Pyspark Panda. ADD () viene utilizzato per aggiungere tutti i valori nell'intera serie e il sub () viene utilizzato per sottrarre i valori dell'intera serie Pyspark Pandas. MUL () viene utilizzato per moltiplicare tutti i valori dell'intera serie con un valore e div () viene utilizzato per dividere tutti i valori per un valore nella serie Pyspark Pandas e restituire il quoziente. Mod () viene utilizzato per dividere tutti i valori per un valore nella serie Pyspark Pandas e restituire il resto. La differenza tra mod () e div () è mod () restituisce il resto ma div () restituisce quoziente.