Pandas Cross si unisce

Pandas Cross si unisce
Python è un linguaggio ben costruito per l'analisi dei dati, principalmente a causa del forte ecosistema di strumenti Python incentrati sui dati. Pandas ha attributi per eseguire un join sinistro, destro, interno o esterno e unire su due frame di dati o serie. Inoltre, attualmente non esiste una tecnica per fare un join incrociato per la fusione o la combinazione di due operazioni con l'argomento come = "cross". Lo faremo utilizzando il metodo "Merge ()" di Pandas in questo articolo con due esempi.

Metodo Pandas Merge ()

Il "PD.Merge () "può essere utilizzato dalla seguente sintassi:

Qui, alcuni parametri necessari sono "a sinistra", il che significa Due gesti di dati., e il "left_on" e "destro_on" che aiutano a specificare la colonna sinistra o destra per l'adesione.

Eseguiremo alcuni esempi pratici per implementare questo metodo in questo apprendimento per trovare un join incrociato tra due frame dati.

Esempio 1: Utilizzo di Pandas PD.Metodo Merge () per ottenere un join incrociato tra due temi di dati con una singola colonna

A partire dalla prima illustrazione per l'implementazione pratica del codice Python per eseguire un join incrociato su Pandas DataFrames, dobbiamo cercare uno strumento o un software in grado di eseguire i nostri codici Python. Molti strumenti supportano la lingua Python. Tra queste diverse scelte, selezioniamo lo strumento "Spyder". Dobbiamo prima installare la configurazione dello strumento "Spyder". Una volta fatto, lanciamo lo strumento. Apri un nuovo file facendo clic sul pulsante "File", premendo il simbolo del file o premendo i tasti "Ctrl+N".

Il nostro nuovo file con il ".L'estensione Py "che si riferisce a" Python "è pronta per iniziare a lavorare. Concentriamoci ora sul codice. Potresti osservare che la prima parola del titolo del nostro articolo è "panda", il che significa che qualcosa verrà fatto utilizzando la biblioteca "Panda". Comprendiamo che il nostro prerequisito per l'implementazione di questo codice è importare la libreria Pandas nel file Python. Abbiamo scritto una riga di codice "Importa panda come PD". Questo importa tutte le caratteristiche della Biblioteca Pandas. Inoltre, abbiamo usato il "AS PD", il che significa che ovunque dobbiamo accedere a qualsiasi metodo Panda in questo codice, dobbiamo scrivere "PD" invece di scrivere la forma completa "Panda".

Mentre eseguiamo la croce join, dobbiamo avere due frame di dati Panda in cui esercitiamo questo metodo. Imparerai qui come costruire un telaio di dati definito dall'utente. Per creare un telaio di dati, Pandas ci dà un "PD.Funzione DataFrame () "in cui" PD "è il" panda ". Quindi, accediamo a un metodo Pandas. Il "DataFrame ()" è la parola chiave di questa funzione che, se invocata, genera un data frame. Facciamo un frame dati utilizzando questo "PD.Metodo DataFrame () "e inizializzalo con una singola colonna" NUM ". Questa colonna contiene due valori che sono "4" e "5". Chiamare il "PD.Il metodo DataFrame () ”genera un Frame Data con questi valori forniti.

Ora, per archiviare questo Frame Data, creiamo un oggetto DataFrame "V1". Il nuovo telaio di dati è ora accessibile da questa variabile "V1". Per vedere questo frame dati sul terminale, utilizziamo il metodo "Print ()". Quindi, creiamo il nostro secondo frame dati seguendo gli stessi passaggi menzionati durante la creazione del primo frame di dati "V1". Invocare il "PD.DataFrame () "per creare un Frame Data che è stato inizializzato da una colonna con tre valori" R "," S "e" T ". Per archiviare questo frame dati, creiamo una variabile "V2". Per visualizzare il telaio dati "V2", utilizziamo nuovamente il metodo "Print ()".

Se sei nuovo nello strumento "Spyder", potresti chiederti come eseguirai il codice. Per eseguire questo file Python, fare clic sul pulsante "Esegui file" o premere i tasti "Shift+Enter". Ora puoi vedere due telai dati che abbiamo appena creato che vengono visualizzati sul terminale dello strumento "Spyder".

L'attività principale inizia da qui. Ora dobbiamo applicare il cross join su entrambi questi gesti di dati. Per eseguire un join incrociato su due frame dati, ci deve essere una colonna "chiave" presente in entrambi i frame dati per creare un collegamento tra loro in modo da poterli unirsi utilizzandolo utilizzandolo. Come possiamo vedere, non ce n'è nulla, quindi ora ne aggiungiamo uno nei frame dati "V1" e "V2" che è una colonna comune. Aggiungiamo la stessa colonna "Chiave" a entrambi i frame di dati come "V1 ['chiave] = 0" e "V2 [' chiave '] = 0". Ora possiamo unire su questa colonna "chiave".

Per fonderli, utilizziamo il "PD.Metodo Merge () ". Tra le sue parentesi, forniamo entrambi i frame dati "V1" e "V2". Il parametro "on" ci chiede di dare il nome di colonna comune in base al quale possiamo unirli. Quindi, sembra "on =" key "". Con questa funzione, usiamo il ".Metodo Drop () "per eliminare la colonna" chiave "una volta eseguita l'iscrizione. La funzione "Drop ()" ha due parametri: il nome della colonna "Chiave" e "Axis = 1", il che significa che la goccia è a livello di colonna. Creiamo una "archiviazione" variabile per trattenere l'output del "PD.Funzione Merge () ". Chiamiamo il metodo "Print ()" per vedere l'output.

L'esecuzione del programma dato ci fornisce un telaio di dati che ha tutte le possibili combinazioni di righe dal telaio di dati fornito.

Esempio 2: Utilizzo di Pandas PD.Metodo Merge () per ottenere un join incrociato tra due frame dati con più colonne

Eseguimo un altro esempio qui sullo stesso argomento, il join Cross Pandas. Per questo, lanciamo il nostro strumento "Spyder" e apriamo un nuovo file premendo "Ctrl+N". Il requisito più importante del codice è importare le librerie necessarie. Utilizziamo un metodo Pandas, quindi importa la libreria Pandas come PD. Ora costruiamo il nostro primo frame dati utilizzando il "PD.Metodo DataFrame () ".

Inizializziamo questo frame dati con due colonne: "colore" e "num". La colonna "Colore" contiene tre valori che sono "rossi", "verde" e "blu". Mentre la colonna "num" ha la stessa lunghezza dei valori che sono "101", "110" e "100". Creiamo una variabile "P1" per archiviare l'output di chiamare il "PD.Metodo DataFrame () ". Ora possiamo ottenere il frame dati utilizzando questa variabile. Utilizziamo la funzione "Print ()" per visualizzare il primo frame dati sul terminale.

Il nostro primo frame dati viene creato correttamente. Generiamo ora il secondo frame dati. Ancora una volta, utilizziamo il "PD.DataFrame () "Metodo e crea una colonna all'interno delle sue parentesi. Questa colonna "seriale" memorizza quattro valori. Questi valori sono "C1", "C2", "C3" e "C4". Per archiviare questo frame dati, creiamo una variabile "P2". Quindi, invochiamo la funzione "print ()" per visualizzare il frame dati "P2".

L'esecuzione del codice Python precedente ci offre il seguente output che visualizza 2 frame dati:

Generiamo una colonna "chiave" in ogni frame di dati in cui possiamo unirli. Qui, utilizziamo il valore "2" per entrambe le colonne "P1 ['Key']” e “P2 ['Key']”. Infine, invochiamo il "PD.Funzione Merge () "per unire i frame dati sulle basi della colonna" chiave ". e il ".Metodo drop () "per rimuovere la colonna" chiave "dopo aver unito entrambi i frame dati. Creiamo una variabile "di verniciatura" per archiviare il telaio unita. La "print ()" viene utilizzata per visualizzare il frame dati incrociato finale memorizzato in "Paint".

Questo ci porta al seguente frame di dati incrociati visualizzati singoli generati dalla fusione di due frame dati.

Conclusione

Uscire due frame di dati in un singolo frame di dati incrociato è una tecnica molto semplice e importante per imparare. Questo articolo ha sottolineato e spiegato il concetto di un join incrociata su Pandas DataFrame. Abbiamo elaborato ogni dettaglio minore dal download dello strumento richiesto al raggiungimento dell'output desiderato. Attraverso esempi pratici di codici Python implementati ed eseguiti sullo strumento "Spyder", abbiamo fatto uno sforzo intenzionale per offrirti un fettuto apprendimento e un concetto di facile comprensione dei panda di Python.