Pyspark - Mostra metodo

Pyspark - Mostra metodo
In Python, Pyspark è un modulo Spark utilizzato per fornire un tipo di elaborazione simile come Spark utilizzando DataFrame. Fornisce il metodo show (), che visualizza il frame dati in un formato tabulare.

Sintassi:

DataFrame.spettacolo (n, verticale, troncato)

Dove il frame dati è il frame dati di input pyspark

Parametri:

1. n è il primo parametro opzionale che rappresenta il valore intero per ottenere le righe superiori nel frame dati e n rappresenta il numero di righe superiori da visualizzare. Per impostazione predefinita, visualizzerà tutte le righe dal frame dati

2. Il parametro verticale prende i valori booleani, che vengono utilizzati per visualizzare il frame dati nel parametro verticale quando è impostato su true. e visualizzare il frame dati in formato orizzontale quando è impostato su false. Per impostazione predefinita, verrà visualizzato in formato orizzontale

3. Il troncato viene utilizzato per ottenere il numero di caratteri da ciascun valore nel frame dati. Ci vorrà un numero intero come alcuni personaggi da visualizzare. Per impostazione predefinita, visualizzerà tutti i caratteri.

Esempio 1:

In questo esempio, creeremo un Frame dati PysPark con 5 righe e 6 colonne e visualizzeremo il frame dati utilizzando il metodo show () senza alcun parametro.

Quindi questo si traduce in un telaio tabulare visualizzando tutti i valori nel frame dati

#IMPORT Il modulo PYSPRK
importare pyspark
#IMPORT SPARKSESSION per la creazione di una sessione
da pyspark.SQL Importazione di importazione
#Crea un'app chiamata LinuxHint
Spark_app = SparkSession.costruttore.appname ('LinuxHint').getOrCreate ()
# Crea dati studenteschi con 5 righe e 6 attributi
Students = ['rollno': '001', 'name': 'sravan', 'age': 23, 'altezza': 5.79, "peso": 67, "indirizzo": "guntur",
'rollno': '002', 'name': 'ojaswi', 'age': 16, 'altezza': 3.79, 'peso': 34, 'indirizzo': 'hyd',
'rollno': '003', 'name': 'gnanesh chowdary', 'age': 7, 'altezza': 2.79, 'peso': 17, 'indirizzo': 'patna',
'rollno': '004', 'name': 'rohith', 'age': 9, 'altezza': 3.69, 'peso': 28, 'indirizzo': 'hyd',
'rollno': '005', 'name': 'sridevi', 'age': 37, 'altezza': 5.59, 'peso': 54, 'indirizzo': 'hyd']
# Crea il frame dati
df = spark_app.CreatedataFrame (Students)
# DataFrame
df.spettacolo()

Produzione:

Esempio 2:

In questo esempio, creeremo un frame dati pyspark con 5 righe e 6 colonne e visualizzeremo il frame dati utilizzando il metodo show () con il parametro N. Impostiamo il valore N su 4 per visualizzare le 4 file migliori dal frame dati.

Quindi questo si traduce in un telaio tabulare visualizzando 4 valori nel frame dati.

#IMPORT Il modulo PYSPRK
importare pyspark
#IMPORT SPARKSESSION per la creazione di una sessione
da pyspark.SQL Importazione di importazione
#Crea un'app chiamata LinuxHint
Spark_app = SparkSession.costruttore.appname ('LinuxHint').getOrCreate ()
# Crea dati studenteschi con 5 righe e 6 attributi
Students = ['rollno': '001', 'name': 'sravan', 'age': 23, 'altezza': 5.79, "peso": 67, "indirizzo": "guntur",
'rollno': '002', 'name': 'ojaswi', 'age': 16, 'altezza': 3.79, 'peso': 34, 'indirizzo': 'hyd',
'rollno': '003', 'name': 'gnanesh chowdary', 'age': 7, 'altezza': 2.79, 'peso': 17, 'indirizzo': 'patna',
'rollno': '004', 'name': 'rohith', 'age': 9, 'altezza': 3.69, 'peso': 28, 'indirizzo': 'hyd',
'rollno': '005', 'name': 'sridevi', 'age': 37, 'altezza': 5.59, 'peso': 54, 'indirizzo': 'hyd']
# Crea il frame dati
df = spark_app.CreatedataFrame (Students)
# Ottieni le migliori 4 righe nel frame dati
df.mostra (4)

Produzione:

Esempio 3:

In questo esempio, creeremo un frame dati pyspark con 5 righe e 6 colonne e visualizzeremo il frame dati utilizzando il metodo show () con un parametro verticale. Sempiamo verticale su false per visualizzare il telaio dati in vista orizzontale.

Quindi questo si traduce in un telaio tabulare visualizzando tutti i valori nella vista orizzontale.

#IMPORT Il modulo PYSPRK
importare pyspark
#IMPORT SPARKSESSION per la creazione di una sessione
da pyspark.SQL Importazione di importazione
#Crea un'app chiamata LinuxHint
Spark_app = SparkSession.costruttore.appname ('LinuxHint').getOrCreate ()
# Crea dati studenteschi con 5 righe e 6 attributi
Students = ['rollno': '001', 'name': 'sravan', 'age': 23, 'altezza': 5.79, "peso": 67, "indirizzo": "guntur",
'rollno': '002', 'name': 'ojaswi', 'age': 16, 'altezza': 3.79, 'peso': 34, 'indirizzo': 'hyd',
'rollno': '003', 'name': 'gnanesh chowdary', 'age': 7, 'altezza': 2.79, 'peso': 17, 'indirizzo': 'patna',
'rollno': '004', 'name': 'rohith', 'age': 9, 'altezza': 3.69, 'peso': 28, 'indirizzo': 'hyd',
'rollno': '005', 'name': 'sridevi', 'age': 37, 'altezza': 5.59, 'peso': 54, 'indirizzo': 'hyd']
# Crea il frame dati
df = spark_app.CreatedataFrame (Students)
# Ottieni il frame dati in modo orizzontale
df.show (vertical = false)

Produzione:

Esempio 4:

In questo esempio, creeremo un frame dati pyspark con 5 righe e 6 colonne e visualizzeremo il frame dati utilizzando il metodo show () con un parametro verticale. Impostamo verticale su True per visualizzare il frame dati nella vista verticale.

Quindi questo si traduce in un telaio tabulare visualizzando tutti i valori nella vista verticale.

#IMPORT Il modulo PYSPRK
importare pyspark
#IMPORT SPARKSESSION per la creazione di una sessione
da pyspark.SQL Importazione di importazione
#Crea un'app chiamata LinuxHint
Spark_app = SparkSession.costruttore.appname ('LinuxHint').getOrCreate ()
# Crea dati studenteschi con 5 righe e 6 attributi
Students = ['rollno': '001', 'name': 'sravan', 'age': 23, 'altezza': 5.79, "peso": 67, "indirizzo": "guntur",
'rollno': '002', 'name': 'ojaswi', 'age': 16, 'altezza': 3.79, 'peso': 34, 'indirizzo': 'hyd',
'rollno': '003', 'name': 'gnanesh chowdary', 'age': 7, 'altezza': 2.79, 'peso': 17, 'indirizzo': 'patna',
'rollno': '004', 'name': 'rohith', 'age': 9, 'altezza': 3.69, 'peso': 28, 'indirizzo': 'hyd',
'rollno': '005', 'name': 'sridevi', 'age': 37, 'altezza': 5.59, 'peso': 54, 'indirizzo': 'hyd']
# Crea il frame dati
df = spark_app.CreatedataFrame (Students)
# Ottieni il frame dati in modo verticale
df.show (vertical = true)

Produzione:

Esempio 5:

In questo esempio, creeremo un Frame dati PysPark con 5 righe e 6 colonne e visualizzeremo il frame dati utilizzando il metodo show () con parametro Truncate. Impostiamo il valore del troncato su 1 per visualizzare il primo carattere in ogni riga del frame dati.

Quindi questo si traduce in un telaio tabulare visualizzando il primo carattere in vista orizzontale.

#IMPORT Il modulo PYSPRK
importare pyspark
#IMPORT SPARKSESSION per la creazione di una sessione
da pyspark.SQL Importazione di importazione
#Crea un'app chiamata LinuxHint
Spark_app = SparkSession.costruttore.appname ('LinuxHint').getOrCreate ()
# Crea dati studenteschi con 5 righe e 6 attributi
Students = ['rollno': '001', 'name': 'sravan', 'age': 23, 'altezza': 5.79, "peso": 67, "indirizzo": "guntur",
'rollno': '002', 'name': 'ojaswi', 'age': 16, 'altezza': 3.79, 'peso': 34, 'indirizzo': 'hyd',
'rollno': '003', 'name': 'gnanesh chowdary', 'age': 7, 'altezza': 2.79, 'peso': 17, 'indirizzo': 'patna',
'rollno': '004', 'name': 'rohith', 'age': 9, 'altezza': 3.69, 'peso': 28, 'indirizzo': 'hyd',
'rollno': '005', 'name': 'sridevi', 'age': 37, 'altezza': 5.59, 'peso': 54, 'indirizzo': 'hyd']
# Crea il frame dati
df = spark_app.CreatedataFrame (Students)
# Ottieni il frame dati ottenendo solo il primo carattere in ogni riga
df.Show (truncate = 1)

Produzione:

Conclusione

Questo articolo ha discusso del metodo Show () in Pyspark e della sua funzionalità. Abbiamo considerato tutti i parametri con valori per il frame dati per visualizzare il frame dati in formato tabulare.