Qual è il file CSV nel linguaggio di programmazione R in Ubuntu 20.04?
Il formato di file CSV (valori separati da virgola) è un modo comune per salvare i dati tabulari in fogli di calcolo e database. Un file CSV è un documento di testo semplice che contiene dati tabulari (intero e testo). La rispettiva riga nel file si riferisce a un record di dati. La virgola viene utilizzata come separatore di campo, che dà il nome a questo formato di file. Nel linguaggio di programmazione R, esiste un modulo intrinseco chiamato CSV che consente di operare con i file CSV. La funzione per leggere un file CSV nel linguaggio di programmazione R ha la seguente sintassi.
Leggere.CSV ("file_name")La lettura.csv () è un metodo wrapper per leggere.Tabella () che utilizza una virgola come separatore. La prima riga del file di input come intestazione per i nomi della colonna della tabella data. Come effetto, è una scelta eccezionale per la lettura di file CSV.
Come leggere il file CSV in un linguaggio di programmazione R in Ubuntu 20.04?
In molti casi, la lettura dei dati da un file CSV è essenziale quando si esegue l'analisi utilizzando R. Quando si tratta di leggere i file CSV, R è estremamente affidabile. Per questo, abbiamo bisogno di alcuni dati per leggere, scrivere o modificare i dati in R. Qui, abbiamo alcune illustrazioni su come creare un file CSV e leggerlo. Inoltre, abbiamo eseguito le varie operazioni sul file CSV che leggevano quei dati specifici dal file CSV nel linguaggio di script R.
Esempio 1: creazione del file CSV in R in Ubuntu 20.04
Abbiamo impostato il frame di dati dei record dei dipendenti con i dettagli di alcuni dipendenti. Quindi, salvalo nell'EMP.File CSV.
Esempio 2: leggi dal file CSV in R in Ubuntu 20.04
La lettura.La funzione CSV () in R può leggere il testo completo di un file CSV come frame di dati. Il file CSV da leggere deve essere nella directory di lavoro o la directory deve essere stabilita in modo appropriato in R utilizzando la funzione setwd (). La lettura.La funzione CSV () può anche leggere un file CSV tramite un URL.
Come sopra, abbiamo definito la variabile come EMP_DATA. L'EMP_DATA è assegnato con la lettura.funzione CSV in cui viene fornito il nome del file. Come abbiamo file EMP.CSV presente nella nostra directory attuale, R può facilmente interpretare questo file. Una volta, il comando di stampa è riportato nel prompt R. Visualizza il contenuto del file CSV in forma tabulare.
Esempio 3: valutato il file CSV in R in Ubuntu 20.04
La lettura.La funzione csv () produce un frame di dati come output predefinito. Ecco un approccio rapido per verificarlo. È inoltre possibile controllare la frequenza delle colonne e delle righe del frame dati dei file CSV.
All'interno del comando di stampa, abbiamo chiamato una funzione NCOL per le colonne e NROW per le righe. Queste funzioni vengono quindi passate con la variabile EMP_DATA dall'esempio sopra che ha un contenuto di file CSV intero. L'output ha generato il numero di colonne e righe all'interno dell'EMP.File CSV. Nella funzione, l'intestazione è prima impostata su true per impostazione predefinita. Questo perché il numero di righe non include la testa; Questo CSV ha cinque colonne e otto righe.
Esempio 4: leggi il valore min dal file CSV in R in Ubuntu 20.04
I dati CSV possono essere utilizzati per applicare le funzioni di aggregatore (.). Il segno $ viene utilizzato per applicare la funzione min () alla colonna.
Per i dati variabili, abbiamo letto prima il file CSV. Quindi, abbiamo una funzione min () applicata alla colonna EMP_DATA. L'EMP_DATA ha restituito il finanziamento del valore minimo dal file CSV. Lì abbiamo una seconda query che otterrà il valore massimo dalla colonna specifica dal file CSV EMP_DATA.
Stiamo leggendo il valore massimo dall'EMP.File CSV utilizzando la funzione MAX sulla colonna EMP_SALARY. Questa funzione genererà il massimo stipendio dall'EMP.Tabella CSV.
Esempio 5: leggi il file CSV e crea il file CSV sottoinsieme in R in Ubuntu 20.04
La funzione sottoinsieme () in R può essere utilizzata per estrarre il risultato corrispondente dalle query SQL sul contenuto di CSV. Queri diverse possono essere eseguite attraverso la funzione contemporaneamente, ciascuna separata da un operatore logico. In R, il risultato viene salvato come frame di dati.
Dalla lettura.funzione CSV che viene memorizzata all'interno dei dati variabili, abbiamo letto l'EMP.Informazioni sul CSV. La variabile new_csv è stabilita dove abbiamo chiamato la funzione del sottoinsieme e alla funzione del sottoinsieme, abbiamo applicato la condizione. Il sottoinsieme prodotto di dati viene salvato come un frame di dati che soddisfa le condizioni indicate negli argomenti della funzione. Nel frame di dati risultante, i numeri di riga vengono conservati.
Conclusione
Questo articolo spiega come leggere dai file CSV. Le funzioni in r sono estese. La lettura.La funzione CSV () in R ci fornisce di leggere un file CSV attualmente nella nostra directory di lavoro. La lettura.La funzione csv () prende un nome file come argomento e restituisce tutti i record contenuti al suo interno. Con le operazioni CSV, abbiamo visto come creare e leggere dai file CSV in R. Le query SQL sono anche applicate al file CSV che leggono le colonne specifiche su condizioni soddisfacenti.