I panda sono tra gli strumenti più popolari usati oggi dai data scientist per analizzare i dati tabulari. Per gestire i contenuti tabulari, offre un'API più rapida ed efficace. Ogni volta che visualizziamo i telai dei dati durante l'analisi, Pandas imposta automaticamente vari comportamenti di visualizzazione su valori predefiniti. Questi comportamenti di visualizzazione includono quante righe e colonne da mostrare, l'accuratezza dei galleggianti in ciascun frame di dati, dimensioni delle colonne, ecc. A seconda dei requisiti, potremmo occasionalmente dover modificare questi impostazioni predefinite. I panda hanno una varietà di approcci per alterare il comportamento predefinito. Sfruttare l'attributo "Opzioni" dei panda ci ha permesso di cambiare questo comportamento.
I panda visualizzano le righe massime
Ogni volta che si tenta di stampare un enorme frame di dati che contiene più righe e colonne rispetto alla soglia predefinita, l'uscita verrà tagliata. Per mostrare tutte le righe nel frame dati, imparerai come modificare le opzioni di visualizzazione di Pandas in questo tutorial. I panda per impostazione predefinita impongono un limite al numero di colonne e righe che mostra. Mentre questo potrebbe essere utile per la lettura dei contenuti, provoca spesso frustrazione se le informazioni che è necessario visualizzare non vengono visualizzate. Qui, useremo i metodi indicati di seguito con la loro sintassi per visualizzare tutte le colonne del frame dati.
accordare()
set_option ()
option_context ()
Impareremo l'utilizzo di tutti questi metodi con implementazione pratica per visualizzare le righe massime nel frame dati fornito.
Esempio n. 1: utilizzo del metodo Pandas To_string ()
Questa dimostrazione ci insegnerà a visualizzare le righe massime in un telaio sul terminale utilizzando il metodo Panda "To_string ()".
Per la compilazione e l'esecuzione dei programmi di esempio, abbiamo scelto lo strumento "Spyder". In questa guida, useremo questo strumento per l'esecuzione di tutti i nostri esempi. Abbiamo lanciato lo strumento "Spyder" per iniziare a scrivere lo script Python. A partire dal codice, dobbiamo prima caricare le librerie necessarie nel nostro file Python in modo da poter usare le sue funzionalità. La libreria del modulo di cui abbiamo bisogno qui sono i "panda". Quindi, l'abbiamo importato nel nostro file Python e l'abbiamo alias in "PD".
Poiché l'operazione principale di questo articolo è visualizzare le righe massime di un telaio di dati, abbiamo prima bisogno di un frame dati. Ora dipende se preferisci generare un telaio di dati o importare un file CSV. Abbiamo importato un file CSV di esempio. Per leggere un file CSV nel programma Python, abbiamo utilizzato il PDAS “PD.funzione read_csv () ”. Tra le parentesi di questa funzione, abbiamo fornito il file CSV che vogliamo leggere il display, che è “Industria.CSV ". Abbiamo costruito una "df" variabile per archiviare l'output generato dalla lettura del file CSV fornito. Quindi, abbiamo invocato il metodo "print ()" per visualizzare il frame dati.
Quando eseguiamo questo programma Python toccando l'opzione "Esegui file", un frame dati viene mostrato sulla console. Puoi osservare che ci sono 43 righe nel risultato sottostante, ma vengono visualizzate solo dieci. Questo perché il valore predefinito della libreria Pandas è solo 10 righe.
Useremo il metodo Pandas "To_string" per visualizzare tutte le righe qui. Il modo più semplice per mostrare le righe massime da una cornice di dati è con questa tecnica. Tuttavia, poiché trasforma il frame di dati completo in una singola stringa, non è consigliato per set di dati molto grandi (in milioni). Tuttavia, questo funziona efficacemente per i set di dati che hanno una lunghezza di migliaia.
Abbiamo seguito la sintassi fornita sopra per la funzione "to_string ()". Abbiamo semplicemente invocato il metodo "to_string ()" con il nome del nostro frame dati. Quindi abbiamo inserito questo metodo nella funzione "print ()" per visualizzarlo quando viene chiamato.
L'istantanea di output ci mostra un telaio di dati con tutte le righe visualizzate sul terminale.
Esempio n. 2: utilizzo del metodo PANDAS set_option
Il secondo metodo che praticheremo in questa guida è il Pandas "set_option ()" per visualizzare le righe massime del telaio dati fornito.
Nel file Python, abbiamo importato la libreria Pandas per accedere alla funzione sopra menzionata. Abbiamo usato il pds “PD.read_csv () ”per leggere il file CSV fornito. Abbiamo invocato il "PD.funzione read_csv () "con il nome del file CSV che vogliamo usare tra le sue parentesi che è" Sampledata.CSV ". Quando si importano il file CSV, tieni a mente l'attuale directory di lavoro del programma Python. Il tuo file CSV deve essere inserito nella stessa directory; Altrimenti, riceverai un messaggio di errore "File non trovato". Abbiamo creato un "campione" variabile per archiviare il frame dati dal file CSV. Abbiamo chiamato il metodo "Print ()" per mostrare questo frame dati.
Qui, abbiamo il nostro output in cui vengono visualizzate solo dieci righe. Il numero massimo di righe indicate è 99. Tutte le altre file tra le prime 5 e le ultime cinque righe sono troncate.
Per visualizzare le righe massime che sono 99 per questo frame dati, utilizzeremo la funzione "set_option ()" del modulo PANDAS. I panda sono dotati di un sistema operativo che consente di modificare il comportamento e visualizzare. Questo metodo ci consente di impostare il display per mostrare un frame di dati completo anziché uno troncato. I panda forniscono la funzione "set_ opzione ()" per visualizzare tutte le righe del frame di dati.
Abbiamo invocato il "PD.set_option () ". Questa funzione ha i parametri “Visualizza.max_rows ". Il display.max_rows "specifica il numero massimo di righe che verranno esibite durante la visualizzazione di un telaio di dati. Il valore di "max_rows" è impostato su 10 per impostazione predefinita. Se è selezionato "nessuno", significa tutte le righe nel frame di dati. Dato che vogliamo visualizzare tutte le righe, quindi lo impostiamo su "Nessuno". Infine, abbiamo utilizzato la funzione "print ()" per visualizzare il frame dati con righe massime.
Ciò produce il risultato fornito nell'istantanea seguente.
Esempio n. 3: utilizzando Pandas option_context ()
L'ultimo metodo di cui stiamo discutendo qui è "option_context ()" per visualizzare tutte le righe di DataFrame. Per questo, abbiamo importato il pacchetto Pandas nel file Python e abbiamo iniziato a scrivere il codice. Abbiamo usato il "PD.funzione read_csv () ”per leggere il file CSV che abbiamo specificato. Abbiamo creato una variabile "Dalta" per archiviare il frame dati dal file CSV specificato. Quindi, abbiamo semplicemente stampato il frame dati con il metodo "print ()".
Il risultato che abbiamo ottenuto dall'esecuzione del codice sopra mostra un telaio con righe troncate.
Ora applicheremo il PDAS “PD.option_context () "su questo frame dati. Questa funzione è identica a "set_option ()". L'unica differenza tra i due approcci è che "set_option ()" modifica le impostazioni in modo permanente, mentre "opzione _context ()" le ha appena cambiate all'interno del suo ambito. Questo metodo prende anche la visualizzazione.Righe massime come parametro, che abbiamo impostato su "Nessuno" per rendere tutte le righe del frame di dati. Dopo aver invocato questa funzione, l'abbiamo appena visualizzata tramite il metodo "Print ()".
Qui, possiamo visualizzare il frame dati completo con le sue righe massime che sono 2747.
Conclusione
Questo articolo si concentra sulle opzioni di visualizzazione dei panda. A volte potremmo aver bisogno di visualizzare l'intero telaio sul terminale. I panda ci danno una varietà di opzioni a tale scopo. In questa guida, abbiamo usato tre di queste strategie. Il primo esempio era basato sull'uso del metodo "To_string ()". La nostra seconda istanza ci insegna ad implementare il metodo "set_option ()" mentre l'ultima illustrazione esegue il metodo "option_context ()". Sono dimostrate tutte queste tecniche per farti familiarità con i modi alternativi che i Panda ci forniscono per ottenere il risultato richiesto.