I panda lasciano cadere tutte le colonne tranne

I panda lasciano cadere tutte le colonne tranne
I dati devono essere purificati, strutturati e riordinati prima di iniziare qualsiasi analisi. Per ottenere la selezione ottimale di dati per una particolare valutazione o presentazione, a volte è necessario modificare un telaio di dati Panda per eliminare le colonne non necessarie o per ottimizzare il set di dati per la creazione del modello. In Panda, la modifica della colonna può verificarsi in una varietà di tecniche. A volte è difficile capire come rimuovere le colonne da un telaio di dati. Il comando "DATAFRAME Drop" è la chiave. Usando il "DF.Funzione Drop () ", le colonne specificate possono essere scartate. In questa guida, capiremo come escludere le colonne in un telaio di dati di Pandas ad eccezione di quelli specificati.

Metodo Pandas drop ()

Il metodo Pandas “Drop ()” ci aiuta a scartare le colonne specificate dal telaio di dati fornito mantenendo quelle selezionate nel frame dati risultante. Questo può essere fatto usando la seguente sintassi:

Vedremo la sua dimostrazione pratica con i programmi Python in questo articolo.

Esempio 1: utilizzo della funzione panda () per eliminare tutte le colonne tranne la colonna singola specificata, nel frame dati effettivo

Questo esempio ti farà comprendere l'esecuzione pratica del metodo "Drop ()" Panda per eliminare tutte le colonne in un telaio di dati ad eccezione di alcune certe che sceglieremo di essere visualizzate.

Avremmo bisogno di software o strumento per compilare il programma che genereremo per l'esempio. Tra le scelte, quello che abbiamo trovato lo strumento più adatto per le nostre dimostrazioni è lo strumento "Spyder". Un nuovo file di progetto viene aperto nello strumento e quindi iniziamo lo script. Abbiamo caricato il modulo necessario che è panda qui. La libreria Pandas è stata importata nel file Python ed è alias come "PD".

Dobbiamo quindi creare un telaio di dati utilizzando il metodo di questo strumento Pandas. Pandas ha un metodo molto semplice “PD.DataFrame () "per costruire un dataframe. Qui "PD" è l'alias per i panda mentre il "Frame dati", come rappresenta il nome, è la parola chiave che invoca il processo di creazione di dati di dati. Abbiamo chiamato questo metodo e lo abbiamo incaricato di creare un telaio di dati con 5 colonne. Abbiamo specificato le etichette per le colonne e fornito la stessa lunghezza dei valori per ciascuna colonna.

Le etichette che abbiamo definito per le colonne sono "gennaio", "febbraio", "marzo", "aprile" e "maggio". I valori che abbiamo archiviato nella colonna "gennaio" sono "1", "2", "3", "4", "3" e "5". La colonna "febbraio" ha valori "7", "8", "9", "10", "11" e "12". La "marcia" tiene voci come "13", "14", "15", "16", "17" e '18 ". Abbiamo fornito valori alla colonna "April" come "19", "20", "21", "22", "23" e "24". L'ultima colonna nel frame dati "May" sta portando questi valori "25", "26", "27", "28", "29" e "30". Abbiamo fornito la stessa dimensione della colonna per ogni colonna nel frame dati.

Come puoi osservare, ogni colonna ha 6 valori. Se si cambia la lunghezza di qualsiasi colonna all'interno di un particolare telaio di dati, ti darà un errore di lunghezza della colonna ineguale. Quando il "PD.La funzione DataFrame () "è invocata con le colonne fornite, genererà un Frame Data. Ora richiede un oggetto o una variabile in cui può posizionare questo frame dati, quindi non si perderà questo frame dati. Inoltre, ogni volta che dobbiamo lavorare con quel particolare telaio di dati possiamo accedervi tramite l'oggetto che abbiamo fornito per la memorizzazione del frame dati. L'oggetto DataFrame che abbiamo creato qui è chiamato "mesi". Lo abbiamo assegnato il risultato del "PD.Metodo DataFrame () ".

La funzione "Print ()" stampa tutto ciò che ti trasmetterai. Lo abbiamo fornito con il nostro oggetto DataFrame "mesi" per visualizzare il contenuto che ha conservato.

L'esecuzione dello script Python sopra elaborato semplicemente colpendo il tasto "Esegui file" mette un frame dati con 5 colonne specificate sulla console Python per visualizzare.

Ora vedremo come utilizzare il metodo "Drop ()" per eliminare tutte le colonne del frame dati tranne una determinata colonna che conserveremo nel frame dati.

Abbiamo invocato il "DF.Metodo drop () "fornendo il" DF.colonne.Metodo Difference () "insieme ad altri due parametri" Asse "e" Inplace ". IL ".Il metodo Diffrence () ”ci fornisce il complemento dei dati che inseriremo come parametro. In questo caso, abbiamo fornito la colonna "March". Quando il metodo "Drop ()" viene invocato per scartare le colonne nel frame dati "mesi", manterrà i valori della colonna "March".

Il parametro "Asse" è impostato su "1" che si riferisce alle colonne. E il "inplace" è valutato come "vero" che eseguirà tutte le alterazioni nel frame dati originale senza non farne copia. Dopo aver chiamato questa funzione, dobbiamo visualizzare il frame dati aggiornato. Abbiamo utilizzato il metodo "Print ()" per visualizzare il telaio di dati effettivo con contenuto modificato sullo schermo.

Questo è l'aspetto del nostro vero e proprio telaio. Abbiamo lasciato cadere tutte le colonne ma abbiamo mantenuto la colonna "March" nel frame dati aggiornato.

Esempio 2: utilizzo della funzione Drop () Drop () per eliminare tutte le colonne ad eccezione di più colonne nella copia del frame dati

Per questa dimostrazione, vedremo come abbandonare tutte le colonne tranne le colonne più selezionate e apportare le modifiche nella copia del frame dati anziché il tetto dati effettivo.

In questo esempio, utilizzeremo il frame dati che abbiamo costruito nell'istanza sopra. Dopo aver visualizzato DataFrame, abbiamo invocato il metodo "Drop ()". Tra le parentesi del "df.Funzione drop () ", abbiamo chiamato" DF.Differenza () "e abbiamo fornito due colonne" gennaio "e" marzo ". Quindi, queste due colonne saranno conservate nel frame dati e tutte le colonne rimanenti verranno eliminate nel frame dati "mesi". Il parametro "Axis" è valutato a "1". Questo dirà a Python di applicare la funzione in termini di riga.

Qui, il terzo parametro "Inplace" è impostato su "False". Mantenere questo "falso" significa che la funzione apporterà le modifiche alla copia del telaio di dati anziché al teatro di dati effettivi. Per archiviare questa copia modificata di DataFrame "mesi", abbiamo creato una variabile "copia". Questa variabile terrà il telaio dati aggiornato dopo aver lasciato cadere tutte le colonne tranne le due che abbiamo specificato che sono "gennaio" e "marzo". Infine, abbiamo impiegato il metodo "Print ()" per mostrare il risultato del "DF.Metodo drop () "sul terminale passandolo dalla variabile" copia ".

Il metodo "Print ()" ci presenta due frame dati quando eseguiamo lo script Python sopra scritto. Qui, il primo telaio di dati visualizzato è il telaio dati effettivo senza alcuna modifica mentre il secondo frame dati è la copia del telaio dati effettivo dopo aver lasciato cadere tutte le colonne tranne le due specificate da visualizzare.

Conclusione

Decidere quali dati mantenere e quali omettere durante l'analisi dei set di dati è un concetto molto essenziale per imparare. In questo articolo, abbiamo elaborato il "DF.Funzione drop () "con la sua sintassi. Abbiamo implementato questo metodo sullo strumento Spyder. Il primo esempio insegna a modificare il telaio di dati effettivi mentre il secondo frame dati spiega come fare una copia del telaio di dati per mantenere le modifiche.