Quando non sono disponibili dati con uno o più moduli o per un'intera unità, viene riconosciuto come dati persi. Negli ambienti quotidiani, i valori mancanti sono un problema principale. Le voci NA (non disponibili) vengono utilizzate per rappresentare i record mancanti in R. Molti set di dati sono disponibili in dati di dati con valori mancanti perché esistono ma non sono stati acquisiti o perché non sono mai esistiti."
Come sbarazzarsi dei valori NA nel linguaggio di programmazione R in Ubuntu 20.04?
Il simbolo NA viene utilizzato in R per indicare valori mancanti (non disponibili). Na può indicare valori vuoti nelle colonne di dati di dati in linguaggio di programmazione r. Vedremo come sbarazzarci delle righe NA in una colonna in questo articolo.
Esempio n. 1: usare IS.Metodo NA per rimuovere Na in R in Ubuntu 20.04
Possiamo usare è.Na per eliminare tali valori di Na dal vettore. I valori NA sono ottenuti usando è.Na () e l'indice vettoriale. Tutti i valori tranne NA verranno restituiti da IS.n / a().
Nell'esempio sopra, abbiamo una rappresentazione vettoriale in cui sono inclusi alcuni numeri casuali insieme ai valori NA. L'output ha anche generato il valore NA. Quindi, vogliamo rimuoverli. Per questo, abbiamo chiamato V1 all'interno della funzione è.Na, che eliminerà tutta l'esistenza di valori di Na nei vettori. L'output da questa funzione visualizza solo il numero.
Esempio n. 2: usando il NA.Metodo RM per rimuovere Na in R in Ubuntu 20.04
Valutando la somma, la media e la varianza, possiamo anche rimuovere i valori di Na. Poi un.RM è un metodo che viene utilizzato per sbarazzarsi di NA. Se Na.rm = true, na è ignorato; Se Na.rm = false, NA viene considerato.
Quindi, a partire dalla creazione della raccolta vettoriale, che ha alcuni numeri e valori NA. Questa raccolta vettoriale è memorizzata all'interno del VEC variabile. Quindi, questi valori NA vengono prima rimossi valutando la varianza rappresentata come var. Quindi, abbiamo valutato la somma e il significato sul VEC per eliminare i valori NA. Nota che abbiamo Na.RM impostato su true, che eviterà Na nel vettore.
Esempio n. 3: usando il metodo omet per rimuovere Na in R in Ubuntu 20.04
Il metodo omet () elimina direttamente i valori di NA, restituendo valori non na e scartati I valori di NA di conseguenza. Questa è la scelta più semplice. Poi un.Il metodo omit () restituisce il risultato senza alcun valori di Na in nessuna delle righe. Nel linguaggio R, questa è la tecnica più rapida per eliminare le file di Na.
Qui, abbiamo inizializzato i numeri interi variabili con i vettori. Quindi, con il comando di stampa, abbiamo generato l'output dei vettori. Quindi, nell'output, abbiamo visto alcuni valori di NA. Per rimuovere questi NA dal vettore, abbiamo il NA.omettere la funzione, che prende la variabile interi come input per la rimozione dei valori NA. Successivamente, abbiamo verificato tramite l'istruzione di stampa se i valori NA vengono rimossi dai vettori. Quando viene generato l'ID output, non mostra valori NA nei numeri interi.
Esempio n. 4: usando il completo.Metodo dei casi per rimuovere Na in R in Ubuntu 20.04
Per vari tipi di analisi dei dati nel linguaggio del computer R, è richiesto un frame di dati dettagliato senza valori mancanti. Il completo.Il metodo dei casi otterrà questo. Questa funzione R esamina un frame di dati e restituisce un vettore di risultato di valori mancanti nelle righe.
Come nell'esempio precedente, abbiamo rappresentazioni vettoriali. Ora stiamo eliminando i valori di NA dai telai dei dati. Per questo, abbiamo creato la cornice di dati all'interno del quale, per ogni colonna, abbiamo inserito alcuni valori NA. Quindi, abbiamo chiamato il completo.Funzione del caso che prende il frame di dati come opzione di input. Il data2 contiene questa operazione che viene stampata e mostra che i valori NA vengono rimossi.
Esempio # 5: usando il metodo rowsum per rimuovere Na in R in Ubuntu 20.04
R ha il metodo integrato rowsums, che genera le somme per ogni riga nella raccolta dei dati nel formato dei rowsum (x). Possono essere specificati parametri aggiuntivi, il più significativo dei quali è l'argomento booleano di NA.RM, che istruisce la funzione se saltare i valori di Na.
Dopo aver creato il frame di dati all'interno dei dati variabili, abbiamo applicato il metodo rowsums. All'interno del rowsum, abbiamo lo è.Metodo NA e metodo NCOL. Si noti che rimuove solo i valori NA di terza fila. Poiché le altre righe contengono anche i valori NA.
Esempio # 6: utilizzando il metodo Filtro per rimuovere Na in R in Ubuntu 20.04
Possiamo anche usare il pacchetto Dplyr Tidyvers per scendere solo righe dove mancano tutti i valori. Quindi possiamo utilizzare una combinazione della funzione del filtro del pacchetto Dplyr e la base R è.funzione na. Ti mostreremo come eliminare solo le righe in cui tutte le voci di dati sono NA.
Utilizzando il pacchetto DPLER per la funzione Filtro, abbiamo creato il frame di dati. Quindi, abbiamo applicato la funzione di filtro di questo frame di dati e visualizzare l'uscita, che ha rimosso i valori NA dalla terza riga.
Conclusione
Abbiamo imparato a rimuovere il NA dal linguaggio R che appare single o più volte nei vettori o nella cornice di dati in questa fase della sessione. Abbiamo coperto sei metodi che ci aiutano a rimuovere il NA dai dati indicati. Questi metodi sono abbastanza facili da implementare nel linguaggio di script R, che può rimuovere anche i valori di Na dalle righe e nelle colonne. Inoltre, alcuni metodi hanno richiesto il pacchetto r dplyr per eliminare il NA.