Un frame di dati deve soddisfare alcune caratteristiche che abbiamo menzionato in questo paragrafo. Le colonne nel frame dati devono essere denominate e non lasciate vuote. Ogni riga nel telaio di dati deve essere denominata in modo univoco.
Creazione di dati di dati in r
La programmazione R fornisce vari metodi per creare un frame dati. Possiamo costruire un frame dati utilizzando i vettori da un altro frame di dati e importando un file. In questo articolo, discuteremo di queste tecniche che ti aiuteranno ad apprendere il concetto di creazione di un frame di dati in R.
Utilizzo dei vettori per creare un telaio di dati in R
La programmazione R consente di creare un telaio di dati utilizzando vettori di dimensioni uguali. A tale scopo, R fornisce una funzione integrata "Dati.telaio()".Questa funzione può catturare tutti i vettori che desideriamo.
Di seguito è la sintassi per chiamare questa funzione:
df <- data.frame(v1, v2, v3, v4)In qualsiasi frame dati, Una colonna è rappresentata da ciascun vettore e il numero di righe sarà determinato dalla lunghezza di qualsiasi vettore.
Esistono 2 modi per generare un telaio di dati utilizzando i vettori, uno creando i vettori richiesti e quindi passandoli ai "dati.Funzione frame () ". E l'ulteriore sostituto è fornire direttamente i vettori ai "dati.Funzionamento di frame () "e assegnare loro i valori all'interno delle parentesi.
Ti aiuteremo a comprendere entrambi i metodi dimostrando esempi pratici in RStudio in Ubuntu 20.04.
Faremo un esempio per fare un telaio di dati dai vettori. Prima creeremo vettori e poi li passeremo come un parametro dei "dati.telaio()".
Nel programma abbiamo dimostrato nell'immagine sopra, abbiamo usato quattro vettori. Tutti i vettori vengono creati utilizzando la funzione "C ()". Il primo vettore che abbiamo generato è "nome", che memorizzerà i nomi di 3 persone con valori di tipo di carattere. Il secondo vettore è "lingua" e memorizza i nomi di 3 linguaggi di programmazione. Memorizza anche i tipi di dati dei caratteri. Il nostro terzo vettore è "età", che memorizza i tipi di dati numerici. L'ultimo vettore, "Gender", memorizza anche 3 valori del tipo di dati dei caratteri. Tutti e 4 i vettori vengono passati ai "dati. Funzione () "Funzione come parametro. Il frame dati "DF" ha archiviato l'output dei "dati.Funzione frame () "in esso. Nell'ultimo passaggio del codice, abbiamo utilizzato l'istruzione "Print ()" per visualizzare l'output.
Il frame dati risultante ha 4 colonne, ciascuna con le stesse dimensioni dei vettori.
L'altro metodo alternativo per generare un telaio di dati in R utilizzando i vettori è che è possibile fornire ai vettori valori all'interno dei "dati.Funzione frame () ".
Questo frammento di codice ha semplicemente creato vettori e ha assegnato loro i valori all'interno del corpo dei "dati.Funzione di frame () "e archiviato questa funzione in dati" DF."" Print () "ha visualizzato l'uscita.
La tabella risultante produce la stessa uscita, che può essere vista nell'immagine seguente.
Vale la pena ripeterlo per generare un telaio di dati da un elenco di vettori, ogni vettore nell'elenco deve avere la stessa quantità di elementi; altro, lo script segnalerà un errore.
Utilizzo di altri frame dati per creare un frame dati
La creazione di un telaio di dati utilizzando due o più frame dati è un'altra tecnica applicata nella programmazione R. Possiamo fare per il raggruppamento di colonne di un frame di dati a un altro e per unire le righe.
Eseguiremo due programmi qui, uno per il raggruppamento orizzontale e l'altro per il raggruppamento verticale.
Per le colonne, la funzione che useremo è “cbind ()."Creiamo prima 2 frame dati e poi combiniamoli usando la funzione" cbind () ".
Nel primo pezzo del codice, verranno costruite 2 colonne e i valori vengono archiviati nel frame dati "DF1".
La tabella risultante produce la stessa uscita, che può essere vista nell'immagine seguente.
Un altro frame di dati, "DF2", viene generato con 2 colonne, "età" e "genere."
La tabella risultante produce la stessa uscita, che può essere vista nell'immagine seguente.
È costruito un frame dati "df3" e utilizza la funzione "cbind ()" per combinare "df1" e "df2".
L'output finale mostra una tabella generata dalla fusione dei 2 telai di dati.
Allo stesso modo, per creare le righe di dati, possiamo utilizzare la funzione "rbind ()". All'interno della funzione "rbind ()", passeremo i 2 frame dati come parametri. Questa funzione concatenerà i 2 frame di dati verticali più piccoli in un'intera tabella. Tieni presente che il numero di righe deve essere lo stesso per tutti i gesti di dati che creerai.
Leggendo un file in un frame dati
Oltre a generare un telaio di dati, ci sono alcune altre cose che puoi fare. Possiamo importare un set di dati tabulare e salvarlo come telaio. È il metodo più frequente per la costruzione di un frame di dati nella programmazione R.
Abbiamo creato un file CSV, i valori memorizzati in formato tabulare e lo hanno chiamato "Tabella.CSV."Abbiamo salvato questo file nella nostra cartella" documenti ". In RStudio, lo leggeremo usando "Leggi.csv () "funzione come un nuovo frame di dati denominato" Tabella."
Per leggere un file CSV in RStudio, la prima cosa che devi fare è impostare la directory di lavoro corrente. Usando la funzione "getwd ()", è possibile individuare la tua directory di lavoro corrente. Nel passaggio successivo, devi impostare la tua directory su dove hai salvato il ".File CSV ". Se non consideri questi passaggi, riceverai un errore mentre farai fatica a leggere il file.
Dopo aver impostato correttamente il percorso della directory di lavoro corrente nella directory in cui hai memorizzato il tuo file CSV, ora utilizzerai "Leggi.funzione csv () ". Scrivi la ".Nome file CSV "con un marchio di citazione (" ") all'interno del" Leggi.csv () ”e usa un frame dati con qualsiasi nome che desideri archiviare i suoi valori.
I dati che abbiamo archiviato nel nostro file CSV vengono visualizzati qui.
Conclusione
Nell'argomento di oggi, abbiamo esplorato la creazione di dati di dati. I frame dati sono le strutture necessarie della programmazione R. Abbiamo discusso di diversi modi per costruire i tuoi telai di dati in RStudio in Ubuntu 20.04 ambiente elaborando ciascuno con un esempio utile. Mettere la pratica pratica a questi codici di esempio non solo ti introdurrà la necessità di utilizzare i gesti di dati, ma anche i modi alternativi per costruirli.