Esercizi di Panda per l'apprendimento

Esercizi di Panda per l'apprendimento
Il modulo "Panda" è lo strumento più significativo disponibile per gli analisti e i ricercatori di Python Data al giorno d'oggi. La libreria di analisi dei dati Python Panda si concentra principalmente sui dati tabulari. È una biblioteca gratuita e open source distribuita con la licenza BSD. I panda hanno così tante applicazioni che può essere più facile elencare ciò che non possono realizzare di ciò che possono.

Ha principalmente due forme: serie e dati di dati. La "serie" contiene dati relativi a una singola variabile e può essere visualizzato come un vettore con informazioni indicizzate, mentre "DataFrame" è una struttura di dati tabulare.

In questo tutorial, cammineremo brevemente attraverso alcuni degli esercizi di panda utilizzati più frequentemente per principianti. Ti verrà fornito un'istantanea dello script Python con l'output corrispondente per ogni esercizio.

Biblioteca di importazione

Per iniziare a lavorare sugli esercizi di Panda, dobbiamo prima caricare la libreria "Panda" nel nostro file di progetto. Lo strumento che stiamo usando per l'implementazione degli esercizi di Panda è "Spyder". Abbiamo lanciato lo strumento e caricato la libreria Pandas nel file Python scrivendo lo script "Import Panda come PD". Abbiamo panda alias come "PD". Ora, "PD" può essere usato al posto di "panda" durante il programma.

Esercizio n. 1: convertire un elenco in serie

Il primo esercizio che abbiamo scelto di insegnare è generare serie Pandas da un elenco.

Abbiamo creato una variabile "Dummy" e gli abbiamo assegnato un elenco di valori come "1", "2", "3", "4", "5", "6" e "7". Abbiamo invocato il "PD.Serie () "e ha superato l'elenco" fittizio "come parametro ad esso. La serie risultante verrà memorizzata nella variabile "Converti". Per esibire il contenuto sullo schermo, Pandas ci fornisce un metodo di "Print ()". Abbiamo visualizzato la serie "Convert" utilizzando la funzione "Print ()".

L'istantanea di output corrispondente mostra che una serie è stata generata con indici predefiniti.

Esercizio n. 2: conversione di un elenco in una serie utilizzando indici specificati

Il primo esercizio ha dimostrato con precisione la conversione di un elenco in una serie Pandas. Abbiamo visto nell'immagine di output che l'elenco è stato presentato con l'elenco predefinito di indici. Se non vuoi che le tue serie vengano visualizzate con questi indici, è possibile modificarle fornendo indici specificati.

Abbiamo usato l'elenco dall'istanza sopra. Per convertire l'elenco in serie e definire gli indici, abbiamo chiamato "PD.Serie () "funzione". Due parametri sono stati passati a questa funzione: list_name e indice. Viene fornito il nome dell'elenco "Dummy". L'argomento "indice" viene utilizzato per modificare l'elenco dell'indice predefinito con quello fornito dall'utente. Abbiamo personalizzato l'elenco degli indici con i valori "A", "B", "C", "D", "E", "F" e "G". La serie con un elenco di indici aggiornato è memorizzata nella variabile "converti" e quindi esibita tramite la funzione "print ()".

Nell'immagine risultante, gli indici predefiniti sono stati sostituiti dall'elenco degli indici forniti dall'utente.

Esercizio n. 3: convertire gli elenchi in un frame dati

Nel primo esercizio, abbiamo imparato a convertire un elenco in una serie Pandas. Ora vedremo come convertire gli elenchi in un frame dati Panda.

Nello script sono stati generati tre elenchi. Questi elenchi hanno valori "[" Harry ", 25," Ingegnere "]", "[" Roma ", 32," Doctor "]" e "[" Elizia ", 22," Artist "" rispettivamente. Abbiamo archiviato questi elenchi in un oggetto elenco 2D "L1". Ora, per convertire "L1" in un frame dati Panda, abbiamo una funzione Panda "PD.DataFrame () ". Questa funzione è stata invocata e l'elenco 2D è fornito come parametro insieme a un altro parametro "colonne". DataFrame mostra i dati sotto forma di tabelle con righe e colonne, quindi il parametro "colonne" metterà le etichette sulle colonne del frame dati. Ogni elenco ha 3 valori, il che significa che avremo 3 colonne nel frame dati. Abbiamo specificato le etichette come "nome", "età" e "professione". Il frame dati viene archiviato nell'oggetto DataFrame "Demo".

L'esecuzione del programma ci fornisce un frame dati con 3 colonne con le etichette e i valori specificati che sono stati generati dall'elenco 2D fornito.

Esercizio n. 4: conversione di un dizionario in dati di dati

Un dizionario Panda è una raccolta di elenchi. Per apprendere la conversione di un detto in un telaio di dati, dobbiamo prima creare un dizionario. È stato creato un dizionario "sample_dict" con 3 elenchi di valori. Il primo elenco "Col1" ha valori "Harry", "Roma" e "Elizia". L'elenco "Col2" memorizza i dati "25", "32" e "22". L'elenco "Col3" ha voci "ingegnere", "medico" e "artista". Per costruire un telaio di dati dal dict "sample_dict", abbiamo invocato il "PD.DataFrame () "Metodo e ha superato il dizionario come parametro. Quando il "PD.Metodo DataFrame () ”, prenderà il contenuto del dizionario e lo modificherà in DataFrame. Il frame dati convertito viene archiviato nell'oggetto dati "Modifica" e viene visualizzato sulla console utilizzando il metodo "Print ()".

Questo programma quando eseguito, ci fornisce l'output mostrato nell'istantanea seguente.

Esercizio n. 5: specificando l'indice in DataFrame

Quando mostriamo il frame dati o una serie sul terminale, è principalmente dotato dell'elenco di indici predefiniti che inizia da "0" fino alla lunghezza del set di dati. Abbiamo imparato a cambiarlo nella serie e puoi modificarlo anche nel frame dati.

Abbiamo usato il telaio di dati generato nell'esercizio sopra. Puoi vedere che il frame dati ha un indice di "0", "1" e "2". Modificheremo questo comportamento predefinito fornendo il nostro elenco di indici. Tra le parentesi graffe del "PD.Viene fornito il metodo DataFrame () ", il nome del dizionario" Sample_dict "e" Index ". Gli indici sono stati specificati come "X", "Y" e "Z".

Il frame dati con l'elenco dell'indice aggiornato viene visualizzato sullo schermo.

Esercizio n. 6: estrazione della colonna specificata in un frame dati

Per selezionare una colonna particolare in un telaio di dati, utilizzeremo il frame dati precedente con gli indici predefiniti. Dopo aver stampato il frame dati iniziale, abbiamo utilizzato il "DF.Metodo loc [indice, colonna] ". Dato che vogliamo selezionare una colonna, abbiamo lasciato il luogo "indice" fornendo ":" in essa e abbiamo fornito il nome della colonna "Col2" tra le sue parentesi. La colonna selezionata viene conservata nella variabile "selezionare" e presentata con l'aiuto della funzione "print ()".

Questo è il risultato della sceneggiatura sopra:

Esercizio n. 7: estrazione di righe particolari in un telaio di dati

Alcune righe possono anche essere selezionate in un frame dati seguendo la stessa tecnica che abbiamo fatto per la selezione delle colonne con una sola eccezione. Per la selezione delle righe dobbiamo fornire l'indice nel "PD.loc [] "e mettere il colon": "nel luogo della colonna. Le righe che abbiamo selezionato sono "1" e "2".

Sono state esposte le due righe selezionate.

Esercizio n. 8: riempire i valori mancanti in un telaio di dati

Abbiamo creato un frame dati con alcuni valori mancanti e stampati sullo schermo. Per riempire questi valori, abbiamo invocato il "DF.FILLNA () "Metodo. Il valore che vogliamo essere sostituiti con le voci nulli è "0". Quindi, l'abbiamo messo nel "DF.FILLNA () "BRETTERS DI FUNZIONE. Il "riempimento" variabile sta memorizzando il risultato e il metodo "print ()" lo visualizzerà.

Qui puoi vedere che i valori null sono ora sostituiti con 0.

Conclusione

I panda ci forniscono una vasta varietà di scelte per risolvere i problemi di analisi dei dati della vita reale. Funziona principalmente con i gesti di dati e le serie. Alcuni esercizi più comuni sono stati discussi in questo articolo in merito alle funzioni della serie dei panda e alle funzioni di dati dei panda. Abbiamo elaborato 8 tecniche di apprendimento di base dei panda. I concetti sono compresi attraverso la dimostrazione pratica della sceneggiatura di Python sullo strumento Spyder. Tutti questi esercizi sono la migliore guida per principianti per iniziare con Python Pandas DataFrames and Series.