Combina le colonne in R

Combina le colonne in R
“Esiste una diversità di scenari in cui i set di dati sono divisi in numerose tabelle e una serie di ragioni per cui questo potrebbe essere il caso. A volte è più semplice raccogliere informazioni in blocchi più piccoli, mentre in alcune situazioni, è meglio ridurre al minimo le dimensioni del file. Indipendentemente dal motivo per cui gli insiemi di dati sono frammentati in tabelle separate, devono essere strutturati in modo che ci dovrebbe essere un minimo di una colonna simile tra le due tabelle, consentendo loro di essere combinati se necessario.Esistono tre principali strategie che esamineremo per ridurre il carico di lavoro e garantire che ogni colonna e parametro importanti dai diversi set di dati siano integrati in modo appropriato.Dopo aver attraversato tutte le tecniche e i loro corrispondenti codici pratici di esempio, sarai in grado di prendere una forte presa sul concetto di combinare colonne in r."

Combinando colonne in r

R ci fornisce diversi modi per combinare colonne di un telaio di dati. In questo articolo, ti faremo familiarità con 3 di loro; Usando la funzione "Paste ()", usando la funzione "Unite ()" e usando la funzione "str_c ()".

Combina le colonne per funzione "Paste ()"

Uno dei metodi per combinare le colonne di un telaio di dati in R è utilizzare la funzione "pasta ()". Questa funzione funziona combinando colonne da due diversi dati di dati e all'interno dello stesso frame dati.

Prima di concentrarci sulla sua implementazione, in primo luogo, dobbiamo comprendere la sintassi per la funzione "Paste ()".

# Pasta (dati $ c1, dati $ c2, sep = "")

La sintassi per la funzione "pasta ()" ha 3 parametri. "Data" è il nome del telaio dati che si inserisce e "C1" è il nome della colonna di quel frame dati. "C2" si riferisce a un altro nome di colonna nel frame dati che è necessario combinare con il primo. Mentre "sep" indica un separatore che separa due colonne e ("") si riferisce a tutto ciò che un separatore deve aggiungere tra le 2 colonne. Qui viene utilizzato per aggiungere spazio tra le due colonne mentre si uniscono a loro.

Abbiamo creato un frame dati con 3 colonne; "FirstName", "LastName" e "Age."Utilizzando la funzione" c () ", assegnare valori a tutte le colonne. Il "firstname" e "LastName" hanno valori del tipo di dati dei caratteri, mentre la colonna "Age" ha memorizzato i valori del tipo di dati numerici. Abbiamo creato un telaio di dati denominato "informazioni" e memorizzato i valori dei "dati.Funzione frame () "in esso. L'istruzione "Print ()" visualizzerà il frame dati che abbiamo appena creato.

Nella schermata di output, è possibile vedere una tabella con 3 colonne.

Ora utilizzeremo la funzione "Paste ()". Innanzitutto, scrivi il nome del frame dati in cui hai memorizzato i valori; Come l'abbiamo chiamato "Info", quindi aggiungi un operatore "$" accanto ad esso, che usiamo per scegliere una colonna o per assegnare un nuovo valore a una colonna. Procedendo ulteriormente creando una nuova colonna con il nome "fullname", a cui assegneremo i valori combinati delle 2 colonne diverse. All'interno della funzione "PASTE ()", menziona il nome del frame dati con un operatore "$" e la colonna che si desidera selezionare. Dopo aver messo una virgola, scrivi il nome del frame dati, l'operatore "$" e la seconda colonna che si desidera unire. "(Sep =" ")" aggiungerà spazio tra le due colonne mentre le combinerà.

L'immagine sotto mostra entrambe le tabelle; Il primo con il telaio dati iniziale e l'altro con una colonna combinata “FullName."

È possibile rimuovere il frame dati precedente eliminando la prima istruzione "print ()".

L'output è disponibile nell'immagine qui sotto.

Combina le colonne per funzione "unite ()"

Un altro metodo per unire le colonne nella programmazione R è usando la funzione "Unite ()". Dobbiamo caricare il pacchetto che contiene questa funzione che è il pacchetto "tidyr".

Per usare la funzione "Unite ()", la sintassi che seguiremo è:

# Unite (Nome DataFrame, nome della colonna combinata, C (colonna1, colonna2))

Dove "DataFrame Nome" è il frame dati che inserisce. "Nome colonna combinato" è il nome della colonna in cui si desidera archiviare i dati uniti. E all'interno della funzione "c ()" sono "column1" e "column2", le colonne che devi combinare.

Nell'esempio in mano, abbiamo prima installato il pacchetto "Tidyr" dalla libreria R. Creato un frame dati allo stesso modo in cui l'abbiamo creato nell'esempio sopra. Vogliamo combinare 2 colonne; "nome e cognome."All'interno della funzione" Unite () ", scriveremo il nome di dati dati, che è" info."Quindi il nome della colonna in cui i valori della colonna combinati verranno archiviati come" fullname."Usando la funzione" C () "per chiamare le 2 colonne da combinare. Infine, l'istruzione "Print ()" visualizzerà l'output.

Una nuova colonna con il nome "FullName" che memorizza i valori di fusione delle colonne "FirstName" e "LastName".

Combinando le colonne per funzione "str_c ()"

Ora stiamo unendo più colonne con il metodo str_c (). Per questo, inizialmente, dobbiamo installare il pacchetto “Stringr."

La funzione "str_c ()" funziona con questa sintassi:
STR_C (DataFrame $ column1, "", DataFrame $ column2)

"DataFrame" è il frame dati che abbiamo creato. "Column1" e "Column2" sono le 2 colonne che vogliamo concaterare. Se l'hai notato, c'è spazio ("") tra i nomi delle colonne. Se non aggiungiamo questo spazio aggiuntivo, questo unirà entrambe le colonne senza spazio.

Ecco un esempio di ciò che abbiamo fatto.

All'inizio, abbiamo caricato un pacchetto "Stringr" che ci consentirà di utilizzare la funzione "str_c ()". Abbiamo usato il frame dati creato negli esempi sopra e, con gli stessi passaggi menzionati in precedenza, abbiamo memorizzato i suoi valori in un nuovo frame di dati denominato "Info."

All'interno della funzione "str_c ()", abbiamo preso i nomi di entrambe le colonne come "info $ firstname" e "info $ lastname" e hanno aggiunto spazio tra loro in modo che non si mescoino quando concatenarono.

Puoi vedere la colonna combinata risultante dell'esempio dimostrato sopra.

Conclusione

La combinazione di colonne nella programmazione R è un concetto super facile e utile. Questo può essere fatto con diverse tecniche usando RStudio in Ubuntu 20.04. Abbiamo fatto uno sforzo per presentarti ai metodi e alle tecniche che possono essere utilizzate per la concatenazione di colonne in R. Dimostrando codici di esempio ed elaborando ogni piccolo dettaglio al riguardo, il nostro obiettivo e lo scopo intenzionali è guidarti in modo più semplice e affidabile per imparare e goderti la combinazione di colonne nella programmazione R.