Rimuovere le colonne in r

Rimuovere le colonne in r
“Un frame di dati conterrà spesso colonne che non sono rilevanti per la tua indagine. Per semplificare enfatizzare le colonne rimanenti, tali colonne devono essere rimosse dal set di dati. Fornendo nomi di etichette e assi correlati o definendo direttamente i nomi dell'indice o delle colonne, le colonne possono essere eliminate. Le etichette su più fasi possono essere rimosse utilizzando un multi-indice designando il livello.

In r, potrebbe occasionalmente essere necessario eliminare una o più colonne specificate da un frame di dati. Fortunatamente, esiste un metodo integrato dal modulo R che rende semplice. La caduta delle colonne da un set di dati è semplicemente un metodo per rimuovere colonne non necessarie dal frame dati. In questo post, esamineremo vari metodi distinti per la rimozione di colonne per titolo da un set di dati in R."

Come rimuovere le colonne dai frame di dati in R in Ubuntu 20.04?

Il meccanismo di caduta della colonna in R consente di rimuovere le colonne non necessarie da una cornice di dati. In r, puoi abbandonare una colonna con il suo nome in vari modi. Questo articolo mostra come rimuovere una colonna da una cornice di dati attraverso diversi casi in molti metodi diversi.

Esempio n. 1: utilizzando il metodo del sottoinsieme per rimuovere le colonne in R in Ubuntu 20.04

L'uso del metodo sottoinsieme () con il simbolo “-”, che indica la caduta delle variabili, è uno dei modi più semplici per abbandonare le colonne. Questa funzione nel linguaggio di programmazione R viene utilizzata per creare sottoinsiemi di una cornice di dati e per rimuovere le colonne da una cornice di dati. La sintassi del sottoinsieme in R è così: sottoinsieme (df, expr). Dove df è il frame di dati e l'EXPR è indicato come espressione per il sottoinsieme.

Nello script di esempio, abbiamo creato il frame di dati "data1" che contiene quattro colonne x1, x2, x3 e x4. Il record viene inserito all'interno di queste colonne. Durante l'esecuzione del comando data1, viene stampato il frame dati, mostrando i nomi delle colonne con le voci che hanno. Successivamente, abbiamo creato una variabile data2 e chiamato il metodo del sottoinsieme al suo interno. Il metodo del sottoinsieme prende i dati1 come input e la condizione di selezione per eliminare le colonne x1 e x3.

Quando viene eseguito i dati2, genera il nuovo frame di dati, che ha tutte le colonne tranne x1 e x3, poiché queste colonne vengono rimosse con il metodo del sottoinsieme.

Esempio n. 2: utilizzando il metodo Nome per rimuovere le colonne in R in Ubuntu 20.04

Questa tecnica crea un vettore del personaggio di caduta in cui sono archiviati i nomi delle colonne. Più tardi, istruiamo R di scegliere tutte le variabili tranne quelle indicate nella caduta della colonna. La negazione è indicata dal "!"Simbolo. Il metodo nomi () in r viene utilizzato per recuperare o modificare il nome dell'oggetto. Questo metodo accetta l'oggetto come parametro, che può essere una matrice, un vettore o un frame di dati, nonché il valore che verrà utilizzato per nominare l'oggetto. La lunghezza del vettore del valore fornito deve corrispondere esattamente alla lunghezza dell'oggetto da nominare e restituisce tutti i nomi delle colonne.

Nello script R sopra, abbiamo stabilito il frame di dati all'interno della variabile “DF."La cornice di dati è stampata sullo schermo e, come puoi vedere, questo frame di dati ha quattro campi con voci distinte. Quindi, abbiamo incluso il comando drop e specificato i nomi della colonna all'interno del vettore. La nuova variabile viene creata come "new_df", in cui viene invocato il metodo del nome e con il metodo Nome (), abbiamo superato il nostro frame di dati "DF."Si noti che abbiamo utilizzato l'operatore % in % dopo il metodo del nome e il comando drop a destra dell'operatore % in %.

L'esecuzione del codice sopra genera il seguente frame di dati in cui sono state rimosse le colonne Y2 e Y3.

Esempio n. 3: utilizzando il metodo Seleziona per rimuovere le colonne in R in Ubuntu 20.04

Useremo Select () in questo metodo importando il pacchetto DPHYR in R e specificando l'argomento per omettere le colonne del set di dati. In sostanza, questa funzione salva semplicemente le variabili specificate.

Abbiamo incluso il pacchetto Dplyr per accedere al metodo Seleziona. Inoltre, abbiamo costruito il frame di dati da cui possiamo rimuovere le colonne. Il frame di dati viene generato in forma tabulare al momento dell'esecuzione del comando mydata poiché il frame di dati viene memorizzato all'interno di questa variabile. Successivamente, nella prossima immagine prompt, abbiamo distribuito il metodo seleziona in cui viene specificato il frame di dati come argomento e anche il nome della colonna A1 con il segno meno è fornito.

Il prompt R interpreta questo comando Seleziona Metodo ed emette il frame di dati, che ha la colonna A1 eliminata.

Esempio # 4: utilizzando il metodo Seleziona per rimuovere le colonne per posizioni della colonna in R in Ubuntu 20.04

Passeremo la posizione dell'indice della colonna come vettore al metodo Seleziona con un segno negativo per rimuovere la posizione colonna per colonna, come mostrato di seguito.

Qui, abbiamo incluso prima il modulo Dplyr. E poi, abbiamo inserito il frame di dati integrato R “Iris."Viene visualizzato il frame di dati IRIS e ha diverse colonne, come mostrato nel prompt R. Possiamo rimuovere una qualsiasi delle colonne all'interno del frame dati IRIS specificando l'indice della colonna. Per questo, abbiamo il metodo Select () a cui abbiamo superato il frame di dati e il valore dell'indice al vettore. La colonna 3,4 e 5 viene rimossa dal frame di dati Iris, che viene visualizzato di seguito.

Esempio # 5: utilizzando il metodo Seleziona per rimuovere le colonne per il carattere iniziale e finale della colonna in R in Ubuntu 20.04

Possiamo anche scegliere colonne a seconda dei loro personaggi iniziali e finali qui. La funzione avvia_with () restituisce la colonna che inizia con il carattere fornito. Per utilizzare il metodo start_with (), dobbiamo seguire la sintassi fornita dalla lingua R, che è selezionata (dataframe, -Starts_with ("substring")). Dove il frame dati indica l'origine, i dati e la sottostringa indicano il carattere o la stringa che lo precede.

In questo esempio abbiamo selezionato la crescita del telaio dei dati in quanto ha tre colonne stampate sullo schermo. Ora, nel passaggio successivo, abbiamo un metodo start_with () all'interno del comando seleziona. Il metodo start_with () con un segno meno prende il nome della colonna che inizia con la "dose" nella cornice dei dati della crescita dei denti. Ha rimosso la colonna "dose" dalla cornice dei dati quando è stato eseguito questo comando selezionato.

Ends_with () è una funzione che restituisce la colonna che contiene il carattere dato alla fine. La sintassi che utilizziamo per il metodo end_with () è questa: select (dataframe, -ends_with ("substring")). Dove il frame dati si riferisce al frame dati di input e la sottostring si riferisce al carattere o alla stringa che lo segue.

Come il metodo sopravvieto di parte. Questo metodo ha anche rimosso la colonna che termina_ con "Supp."

Conclusione

Il linguaggio di programmazione R è stato utilizzato per dimostrare l'approccio della rimozione di colonne da un frame di dati. Abbiamo visto il sottoinsieme e il metodo del nome incorporato della R, che ha rimosso le colonne. In R, è possibile eliminare una colonna utilizzando l'operatore MINUS prima del metodo di selezione. Inoltre, il metodo Select () nel modulo DPHYR in R viene utilizzato per scegliere o rimuovere le colonne in base alle condizioni come iniziano con, le estremità con le colonne in base alla posizione sono presentate con esempi.