PysPark - Pandas DataFrame rappresenta il Frame Data Pandas, ma contiene il Frame dati PysPark internamente.
Panda Support DataFrame Data Structure e Panda viene importato dal modulo PysPark.
Prima di allora, devi installare il modulo PysPark."
Comando
PIP Installa PysparkSintassi all'importazione
da Pyspark Import PandaSuccessivamente, possiamo creare o utilizzare il frame dati dal modulo Pandas.
Sintassi per creare Pandas DataFrame
pyspark.panda.DataFrame ()Possiamo passare un dizionario o un elenco di elenchi con valori.
Creiamo un frame dati Pandas tramite Pyspark che ha tre colonne e cinque righe.
#import panda dal modulo pysparkProduzione
Ora andremo nel nostro tutorial.
Le operazioni aritmetiche vengono utilizzate per eseguire operazioni come aggiunta, sottrazione, moltiplicazione, divisione e modulo. Pyspark Pandas DataFrame supporta le funzioni integrate che vengono utilizzate per eseguire queste operazioni.
Vediamo uno per uno.
pyspark.panda.DataFrame.aggiungere()
ADD () in PysPark Pandas DataFrame viene utilizzato per aggiungere elementi nell'intero frame dati con un valore.
È anche possibile aggiungere un valore in una singola colonna. Prende il valore come parametro.
Sintassi
Per l'intero Frame di dati Pyspark Pandas
pyspark_pandas.aggiungere valore)Per una colonna particolare
pyspark_pandas.aggiungere valore)Dove,
Esempio 1
In questo esempio, aggiungeremo 5 alla colonna Mark1.
Produzione
Possiamo vedere che 5 viene aggiunto a ciascun valore nella colonna Mark1.
Esempio 2
In questo esempio, aggiungeremo 5 all'intero Frame di dati Pyspark Pandas.
Produzione
Possiamo vedere che 5 viene aggiunto all'intero Frame di dati Pyspark Pandas.
pyspark.panda.DataFrame.sub()
Sub () in Pyspark Pandas DataFrame viene utilizzato per sottrarre gli elementi dall'intero frame dati con un valore.
È anche possibile sottrarre da una singola colonna. Prende il valore come parametro.
Sintassi
Per l'intero Frame di dati Pyspark Pandas
pyspark_pandas.sub (valore)Per una colonna particolare
Dove,
Esempio 1
In questo esempio, sottrarremo 5 dalla colonna Mark1.
Produzione
Possiamo vedere che 5 viene sottratto da ciascun valore nella colonna Mark1.
Esempio 2
In questo esempio, sottrarremo 5 da tutto il frame dati Pyspark Pandas.
Produzione
Possiamo vedere che 5 viene sottratto dall'intero Frame di dati Pyspark Pandas.
pyspark.panda.DataFrame.mul ()
MUL () nel Pyspark Pandas DataFrame viene utilizzato per moltiplicare gli elementi nell'intero frame di dati con un valore.
È anche possibile moltiplicare un valore in una singola colonna. Prende il valore come parametro.
Sintassi
Per l'intero Frame di dati Pyspark Pandas
pyspark_pandas.MUL (valore)Per una colonna particolare
pyspark_pandas.MUL (valore)Dove,
Esempio 1
In questo esempio, moltiplicheremo tutti i valori nella colonna Mark1 con 5.
Produzione
Possiamo vedere che 5 viene moltiplicato con ogni valore nella colonna Mark1.
Esempio 2
In questo esempio, moltiplicheremo l'intero Frame di dati di Pyspark Pandas per 5.
Produzione
Possiamo vedere che l'intero Frame di dati Pyspark Pandas viene moltiplicato per 5.
pyspark.panda.DataFrame.div ()
Div () in PysPark Pandas DataFrame viene utilizzato per dividere gli elementi nell'intero frame dati con un valore.
È anche possibile dividere per valore in una singola colonna. Prende il valore come parametro. Restituisce un quoziente.
Sintassi
Per l'intero Frame di dati Pyspark Pandas
pyspark_pandas.div (valore)Per una colonna particolare
pyspark_pandas.div (valore)Dove,
Esempio 1
In questo esempio, divideremo tutti i valori nella colonna Mark1 per 5.
Produzione
Possiamo vedere che ogni valore nella colonna Mark1 è diviso per 5.
Esempio 2
In questo esempio, divideremo l'intero Frame Data Pandas Pyspark per 5.
Produzione
Possiamo vedere che l'intero Frame di dati Pyspark Pandas è diviso per 5.
pyspark.panda.DataFrame.mod ()
Mod () in Pyspark Pandas DataFrame viene utilizzato per dividere gli elementi nell'intero frame dati con un valore. Restituirà il resto.
È anche possibile dividere per valore in una singola colonna. Prende il valore come parametro.
Sintassi
Per l'intero Frame di dati Pyspark Pandas
pyspark_pandas.mod (valore)Per una colonna particolare
pyspark_pandas.mod (valore)Dove,
Esempio 1
In questo esempio, divideremo tutti i valori nella colonna Mark1 per 5.
Produzione
Possiamo vedere che ogni valore nella colonna Mark1 è diviso per 5 e restituito il resto.
Esempio 2
In questo esempio, divideremo l'intero Frame Data Pandas Pyspark per 5.
Produzione
Possiamo vedere che l'intero Frame di dati Pyspark Pandas è diviso per 5 e restituito il resto.
Conclusione
In questo tutorial Pyspark Pandas, abbiamo discusso delle operazioni aritmetiche eseguite sul Frame dati Pyspark Panda. ADD () viene utilizzato per aggiungere tutti i valori nell'intero frame dati con 5 e il sub () viene utilizzato per sottrarre i valori dall'intero Frame Data Pandas PysPark. MUL () viene utilizzato per moltiplicare tutti i valori nell'intero frame dati con un valore e div () viene utilizzato per dividere tutti i valori per un valore nel frame dati PysPark Panda e restituire il quoziente. Mod () viene utilizzato per dividere tutti i valori per un valore nel Frame di dati Pyspark Pandas e restituire il resto. La differenza tra mod () e div () è mod () restituisce il resto ma div () restituisce quoziente.