Pyspark - Operazioni aritmetiche della serie Pandas

Pyspark - Operazioni aritmetiche della serie Pandas
“In Python, Pyspark è un modulo Spark utilizzato per fornire un tipo di elaborazione simile come Spark Using Series, che memorizzerà i dati dati in un array (colonna in Pyspark internamente).

Pyspark - La serie Pandas rappresenta la serie Pandas, ma contiene la colonna Pyspark internamente.

Struttura dei dati della serie di supporto Panda e Panda viene importato dal modulo Pyspark.

Prima di allora, devi installare il modulo PysPark."

Comando

PIP Installa Pyspark

Sintassi all'importazione

da Pyspark Import Panda

Successivamente, possiamo creare o utilizzare la serie dal modulo Pandas.

Sintassi per creare serie Pandas

pyspark.panda.Serie()

Possiamo passare un elenco o un elenco di elenchi con valori.

Creiamo una serie Pandas tramite Pyspark che ha cinque valori numerici.

#import panda dal modulo pyspark
da Pyspark Import Panda
#create serie con 5 elementi
pyspark_series = panda.Serie ([90,56,78,54,0])
Stampa (pyspark_series)

Produzione

Ora andremo nel nostro tutorial.

Le operazioni aritmetiche vengono utilizzate per eseguire operazioni come aggiunta, sottrazione, moltiplicazione, divisione e modulo. La serie PysPark Pandas supporta le funzioni integrate che vengono utilizzate per eseguire queste operazioni.

Vediamoli uno per uno.

pyspark.panda.Serie.aggiungere()

ADD () nella serie Pyspark Pandas viene utilizzata per aggiungere elementi nell'intera serie con un valore.

Prende il valore come parametro.

Sintassi

pyspark_series.aggiungere valore)

Dove,

  1. pyspark_series è la serie Pyspark Pandas
  2. Il valore richiede il valore numerico da aggiungere a pyspark_series.

Esempio
In questo esempio, aggiungeremo 5 alla serie.

#import panda dal modulo pyspark
da Pyspark Import Panda
#create serie con 5 elementi
pyspark_series = panda.Serie ([90,56,78,54,0])
#ADD 10 a ogni elemento I serie
Stampa (pyspark_series.Aggiungi (10))

Produzione

Possiamo vedere che 10 viene aggiunto a ciascun elemento della serie.

pyspark.panda.Serie.sub()

Il sub () nella serie Pyspark Pandas viene utilizzato per sottrarre elementi nell'intera serie con un valore.

Prende il valore come parametro.

Sintassi

pyspark_series.sub (valore)

Dove,

  1. pyspark_series è la serie Pyspark Pandas
  2. Il valore richiede il valore numerico per essere sottratto da pyspark_series.

Esempio
In questo esempio, sottrarremo 10 dalla serie.

#import panda dal modulo pyspark
da Pyspark Import Panda
#create serie con 5 elementi
pyspark_series = panda.Serie ([90,56,78,54,0])
#subtract 10 da ogni elemento in serie
Stampa (pyspark_series.sub (10))

Produzione

Possiamo vedere che 10 viene sottratto da ogni elemento della serie.

pyspark.panda.Serie.mul ()

MUL () nella serie Pyspark Pandas viene utilizzato per moltiplicare elementi nell'intera serie con un valore.

Prende il valore come parametro.

Sintassi

pyspark_series.MUL (valore)

Dove,

  1. pyspark_series è la serie Pyspark Pandas
  2. Il valore richiede il valore numerico da moltiplicare con Pyspark_Series.

Esempio
In questo esempio, moltiplicheremo 10 con la serie.

#import panda dal modulo pyspark
da Pyspark Import Panda
#create serie con 5 elementi
pyspark_series = panda.Serie ([90,56,78,54,0])
#multiply 10 a ciascun elemento in serie
Stampa (pyspark_series.MUL (10))

Produzione

Possiamo vedere che 10 viene moltiplicato per ogni elemento della serie.

pyspark.panda.Serie.div ()

Div () nella serie Pyspark Pandas viene utilizzato per dividere gli elementi dell'intera serie per un valore. Restituisce un quoziente.

Prende il valore come parametro.

Sintassi

pyspark_series.div (valore)

Dove,

  1. pyspark_series è la serie Pyspark Pandas
  2. Il valore richiede il valore numerico da moltiplicare con Pyspark_Series.

Esempio
In questo esempio, divideremo la serie per 10.

#import panda dal modulo pyspark
da Pyspark Import Panda
#create serie con 5 elementi
pyspark_series = panda.Serie ([90,56,78,54,0])
#Divide Series di 10
Stampa (pyspark_series.Div (10))

Produzione

Possiamo vedere ogni elemento della serie è diviso per 10 e restituito quoziente.

pyspark.panda.Serie.mod ()

Div () nella serie Pyspark Pandas viene utilizzato per dividere gli elementi dell'intera serie per un valore. Restituisce il resto.

Prende il valore come parametro.

Sintassi

pyspark_series.mod (valore)

Dove,

  1. pyspark_series è la serie Pyspark Pandas
  2. Il valore richiede il valore numerico da moltiplicare con Pyspark_Series.

Esempio
In questo esempio, divideremo la serie per 10.

#import panda dal modulo pyspark
da Pyspark Import Panda
#create serie con 5 elementi
pyspark_series = panda.Serie ([90,56,78,54,0])
#Divide Series di 10
Stampa (pyspark_series.mod (10))

Produzione

Possiamo vedere ogni elemento della serie è diviso per 10 e restituito il resto.

Conclusione

In questo tutorial Pyspark Panda, abbiamo discusso delle operazioni aritmetiche eseguite nella serie Pyspark Panda. ADD () viene utilizzato per aggiungere tutti i valori nell'intera serie e il sub () viene utilizzato per sottrarre i valori dell'intera serie Pyspark Pandas. MUL () viene utilizzato per moltiplicare tutti i valori dell'intera serie con un valore e div () viene utilizzato per dividere tutti i valori per un valore nella serie Pyspark Pandas e restituire il quoziente. Mod () viene utilizzato per dividere tutti i valori per un valore nella serie Pyspark Pandas e restituire il resto. La differenza tra mod () e div () è mod () restituisce il resto ma div () restituisce quoziente.