Unire il metodo di colonna multipla ()
Esistono varie tecniche per gestire i set di dati. Il metodo di unione è uno di questi. Più colonne di due o più due frame di dati possono essere unite per mantenere i dati in modo positivo. Ogni volta che dobbiamo unire due frame di dati Panda su più colonne, utilizziamo i "panda.Metodo Merge () ". È un modo efficiente per lo scienziato dei dati in quanto potrebbe risparmiare il loro tempo per mantenere il database in modo migliore. Per migliorare la fedeltà del codice, dobbiamo unire i nostri temi di dati in Panda perché due frame di dati possono avere diversi tipi di informazioni sullo stesso elemento e possono avere importanti segmenti uguali.
Nel nostro articolo, esamineremo come possiamo unire le molteplici colonne di dati di dati utilizzando il "panda.Metodo Merge () ". Se vogliamo unire i set di dati di dati senza alcuna colonna chiave, unisce tutte le colonne comuni nel frame dati. Ma sostituisce ogni colonna comune con una singola colonna da entrambi i set di dati.
Sintassi:
Esempio 1: visualizzazione del metodo Merge () su più colonne con una colonna simile in panda di due frame dati
Qui, guardiamo la fusione di più colonne nei gesti di dati. Raramente utilizziamo la tecnica "unisci" per combinare due frame di dati. Ora creiamo i nostri due telai di dati. Innanzitutto, importiamo i panda open source come "KD". Quindi, creiamo il nostro primo frame dati utilizzando il "KD.DataFrame "e denominato" CD1 "che dichiara le tre variabili che sono" M "," K "e" A ".
Fondamentalmente "M", "K" e "A" sono le tre colonne del frame dati "CD1". I valori assegnati alla variabile della colonna "M" sono "10", "10", "20", "20" e "30". I valori assegnati a "k" sono "10", "10", "20", "20" e "20". I valori assegnati alla variabile "A" sono "130", "90", "120", "50" e "50". Qui, viene creato il nostro primo frame dati "CD1". Ora, vieni al secondo frame dati che si chiama "CD2" che ha tre colonne dichiarando tre variabili "M", "K" e "N". I valori assegnati a "M" sono "10", "20", "20", "20" e "30". I valori assegnati alla variabile "k" sono "10", "10", "10" "20" e "20". E i valori assegnati di "N" sono "150", "160", "170", "180" e "130". Qui, il nostro frame dati "CD2" è creato.
Ora arriviamo alla nostra funzione principale “KD.Merge () "che abbiamo applicato per unire le più colonne del nostro telaio di dati. Qui, applichiamo il parametro "Left" alle nostre colonne "M" e "K" in quanto sono simili in entrambi i frame dati. Successivamente, applichiamo semplicemente la nostra funzione "print ()" per visualizzare la "unione" di due colonne. In questo esempio, discutiamo della "unione" di due colonne nei frame di dati "CD1" e "CD2" con colonne simili che sono "M" e "K". Unisce semplicemente entrambe le colonne simili dei diversi telai di dati.
Ora discutiamo dell'output del nostro codice. La prima colonna che inizia da "0" a "4" sono i numeri dell'indice. Poiché la colonna "M" è simile in entrambi i frame dati, viene unita e visualizzata una volta con valori che sono "10", "10", "20", "20" e "30". Successivamente, la colonna successiva visualizzata è "k" che è anche una colonna simile. Viene anche unito e mostrato solo una volta insieme ai dati di "10", "10", "20", "20" e "20". Le diverse colonne di entrambi i frame dati sono "A" e "N" che vengono visualizzate lungo di esse. I valori di questa colonna simile "A" visualizzati sono "130", "90", "120", "50" e "50". L'ultima colonna visualizzata nell'output è "N" insieme ai dati che sono "150", "150", "180", "180" e "130".
Colonne simili vengono unite sul lato sinistro a causa dell'applicazione del metodo "a sinistra". Il resto delle colonne non comuni viene visualizzato a destra per impostazione predefinita. Poiché le colonne "M" e "K" erano simili in entrambi i frame dati, possono essere visualizzate una volta nell'output dopo l'implementazione del "panda.Metodo Merge () "insieme alle restanti colonne" A "e" N ".
Esempio 2: Visualizzazione di un Merge () su più colonne con nomi distinti in due frame dati
Ora, discutiamo dell'iscrizione a più colonne che hanno nomi di colonne diversi in questo esempio. In questo caso, importiamo la biblioteca di Panda come "FB". Prima di tutto, creiamo i nostri frame di dati come "PK1" e "PK2". Il frame dati "PK1" dichiara con tre nomi variabili che sono "soggetti", "cariche" e "time_period" che fungono da colonne. I valori che sono archiviati in "soggetti" sono "web", "grammatica", "sociale", "elettronico" e "ICT". I valori dei dati memorizzati nella colonna "Cariche" sono "10000", "20000", "30000", "40000" e "50000". L'ultima colonna del frame dati "PK1" è "time_period" che memorizza i valori di "4hrs", "5hrs", "6hrs", "5.5 ore "e" 5 ore ".
Il secondo frame di dati denominato "PK2" ha tre colonne che sono "soggetti", "addebiti" e "percentile". Il valore che assegniamo a "soggetti" sono "ICT", "Grammar", "Social", "Electronic" e "Database". Nella seconda colonna "Cariche" del frame dati, assegniamo i valori di "10000", "20000", "30000", "40000" e "50000". L'ultima colonna "percentile" memorizza i valori che sono "5%", "10%", "20%", "10%" e "5%". Dopo aver creato i dati dei dati, li visualizziamo semplicemente utilizzando la funzione "Print ()".
Quando vengono creati i nostri frame dati, applichiamo l'implementazione del "panda.Funzione Merge () ". Uschiamo il primo frame dati "PK1" insieme al secondo frame dati "PK2". Qui, vogliamo unire le diverse colonne di dati di dati, quindi utilizziamo i parametri di "Left_on" e "Right_on". Usiamo questi parametri sulla colonna di "soggetti" di entrambi i frame dati. Successivamente, entrambi i frame dati vengono uniti e lo visualizziamo semplicemente dalla funzione "print ()".
Ora dai un'occhiata al nostro output del rispettivo codice. Come possiamo vedere nel nostro display di output dal primo indice di "0" a "4", visualizza il nostro primo frame di dati di "PK1" delle prime colonne "Soggetti" che contengono "Web", "Grammar", "Social" , "Elettronico" e "ICT". La seconda colonna "Cariche" contiene i valori numerici di "10000", "20000", "30000", "40000" e "50000. La terza colonna "time_period" contiene i valori "4 ore", "5 ore", "6 ore", "5.5 ore "e" 5 ore ".
Successivamente, visualizza i dati del frame dati "PK2" che contiene anche tre colonne: "soggetti", "cariche" e "percentile". La colonna "Soggetto" visualizza "ICT", "Grammer", "Social", "Electronic" e "Database". La colonna "Cariche" visualizza i suoi valori di "10000", "20000", "30000", "40000" e "50000". La terza colonna "percentile" visualizza i dati di "5%", "10%", "20%", "10%" e "5%".
Finalmente, dopo aver applicato i "panda.Funzione Merge () ", combina i dati di entrambi i frame. Per impostazione predefinita, unisce la colonna "soggetto" di entrambi i frame dati con valori simili e li visualizza insieme alle diverse colonne diverse di entrambi i frame dati. Dopo l'accusa di entrambi i frame dati, visualizziamo le cinque diverse colonne unite che sono "soggetti", "cariche_x", "time_period", "carre_y" e "percentile" insieme a tutti i dati che assegniamo.
Conclusione
Abbiamo descritto come combinare le più colonne in questo articolo. Ne abbiamo discusso utilizzando gli esempi di unendo due frame di dati che contengono colonne sia simili che diverse. Per unire le colonne simili, usiamo solo il semplice "KD.funzione Merge () "e unisce la colonna simile per impostazione predefinita dalla funzione. Per unire le diverse colonne multiple, utilizziamo "FB.Merge () "insieme ai parametri" Left_on "e" Right_on ".