PysPark - Pandas DataFrame rappresenta il Frame Data Pandas, ma contiene il Frame dati PysPark internamente.
Panda Support DataFrame Data Structure e Panda vengono importati dal modulo PysPark.
Prima di allora, devi installare il modulo PysPark."
Comando
PIP Installa PysparkSintassi all'importazione:
da Pyspark Import PandaSuccessivamente, possiamo creare o utilizzare il frame dati dal modulo Pandas.
Sintassi per creare Pandas DataFrame:
pyspark.panda.DataFrame ()Possiamo passare un dizionario o un elenco di elenchi con valori.
Creiamo un frame dati Pandas tramite Pyspark che ha quattro colonne e cinque righe.
#import panda dal modulo pysparkProduzione:
Ora andremo nel nostro tutorial.
Esistono diversi modi per restituire la top e le ultime righe dal Pyspark Pandas DataFrame.
Vediamoli uno per uno.
pyspark.panda.DataFrame.Testa
head () restituirà le migliori righe dalla parte superiore del Pyspark Pandas DataFrame. Ci vuole n come parametro che specifica il numero di righe visualizzate dall'alto. Per impostazione predefinita, restituirà le prime 5 file.
Sintassi:
pyspark_pandas.Testa (N)Dove pyspark_pandas è il frame dati Pyspark Pandas.
Parametro:
n Specifica un valore intero che visualizza il numero di righe dalla parte superiore del Frame di dati Pyspark Pandas.
Possiamo anche usare la funzione head () per visualizzare la colonna specifica.
Sintassi:
pyspark_pandas.colonna.Testa (N)Esempio 1
In questo esempio, restituiremo le prime 2 e 4 righe nella colonna Mark1.
#import panda dal modulo pysparkProduzione:
0 90Possiamo vedere che le prime 2 e 4 righe sono state selezionate dalla colonna Marks1.
Esempio 2
In questo esempio, restituiremo le prime 2 e 4 righe nella colonna Student_LastName.
#import panda dal modulo pysparkProduzione:
0 ManasaPossiamo vedere che le prime 2 e 4 righe sono state selezionate da Student_LastName colonna.
Esempio 3
In questo esempio, restituiremo le prime 2 righe dall'intero frame dati.
#import panda dal modulo pysparkProduzione:
Student_LastName Mark1 Mark2 Mark3Possiamo vedere che l'intero telaio di dati viene restituito con le prime 2 e 4 righe.
pyspark.panda.DataFrame.coda
Tail () restituirà le righe dall'ultima nel Frame dati Pyspark Pandas. Ci vuole n come parametro che specifica il numero di righe visualizzate dall'ultima.
Sintassi:
pyspark_pandas.Tail (N)Dove pyspark_pandas è il frame dati Pyspark Pandas.
Parametro:
n Specifica un valore intero che visualizza il numero di righe dall'ultimo Pyspark Panda DataFrame. Per impostazione predefinita, restituirà le ultime 5 righe.
Possiamo anche usare la funzione Tail () per visualizzare colonne specifiche.
Sintassi:
pyspark_pandas.colonna.Tail (N)Esempio 1
In questo esempio, restituiremo le ultime 2 e 4 righe nella colonna Mark1.
#import panda dal modulo pysparkProduzione:
3 54Possiamo vedere che le ultime 2 e 4 righe sono state selezionate dalla colonna Marks1.
Esempio 2
In questo esempio, restituiremo le ultime 2 e 4 righe nella colonna Student_LastName.
#import panda dal modulo pysparkProduzione:
3 KapilaPossiamo vedere che le ultime 2 e 4 righe sono state selezionate da Student_LastName colonna.
Esempio 3
In questo esempio, restituiremo le ultime 2 righe dall'intero frame dati.
#import panda dal modulo pysparkProduzione:
Student_LastName Mark1 Mark2 Mark3Possiamo vedere che l'intero telaio di dati viene restituito con le ultime 2 e 4 righe.
Conclusione
Abbiamo visto come visualizzare le funzioni di dati di Pyspark Pandas Pyspark Panda utilizzando le funzioni. Per impostazione predefinita, restituiscono 5 file.Le funzioni head () e tail () vengono anche utilizzate per ottenere le righe superiori e ultime con colonne specifiche.