"Pandas" è uno strumento ad alte prestazioni per l'ambiente Python. È un codice sorgente "aperto" per l'analisi dei dati. Il join Panda e il metodo di unione Pandas vengono utilizzati per l'adesione dei due frame di dati insieme in un singolo frame dati. In entrambi i metodi di Panda, la differenza è che la funzione di "join" di Pandas si unisce al frame dati utilizzando un indice. Mentre la funzione di "unione" Pandas si unisce al frame dati utilizzando l'indice e il metodo della colonna in cui possiamo selezionare la colonna desiderata. Il metodo di unione dei panda viene utilizzato principalmente rispetto al metodo di join di panda. Il software che utilizzeremo per l'implementazione è il software "Spyder", che si trova nell'ambiente Python che ci fornirà vantaggi per l'implementazione del codice del metodo di join Pandas () e la funzione metodo Pandas Merge ().
Sintassi del metodo Pandas join ()
“DF1.join (df2) "Il "DF" nella sintassi sopra è l'abbreviazione del "Frame dati". Ci sono due frame dati nella sintassi con la funzione "join dot", che è per chiamare il metodo. È il metodo Pandas per unirsi a due frame di dati. Funziona utilizzando l'indice per combinare i dati dei dati in un solo.
Sintassi del metodo Pandas Merge ()
“DF1.Merge (df2, on = 'column_name') "La sintassi del metodo di unione Pandas ha due frame dati come "DF1" e "DF2". La funzione "DOT Merge" sta chiamando il metodo di unire entrambi i frame dati con l'aspetto di colonne invertite.
Copreremo i seguenti modi per combinare due frame di dati per utilizzare i metodi di Panda Merge e Panda uni:
Creazione dei frame dati per l'implementazione del metodo di join di Merge e Pandas di Pandas
Innanzitutto, dobbiamo creare un frame di dati. Per questo, useremo lo strumento "Spyder". Dopo averlo aperto, inizia a scrivere il codice. Importa Panda come "PD" per la Panda Library Association. Abbiamo le variabili di dati di dati come "x", "y", "p" e "q corrispondente e" a "con valori" 1 "e" b "con il valore assegnato come" 2 ".
L'output è un "DF" creato con i valori assegnati. Possiamo renderlo grande come i dati.
Creazione di un altro frame di dati
Dobbiamo creare un altro telaio di dati, per comprendere i metodi di unire i panda e i panda che si fondono chiaramente. Qui, abbiamo creato "df" lo stesso di sopra "df", solo i valori sono variabili assegnati sono diverse. Abbiamo "H", "J", "S" e "D", mentre assegniamo i valori "B" con il valore "8" e "Y" con il valore "3".
L'output mostra un semplice "df" creato.
Esempio # 01: Metodo di join Pandas (sovrapposizione)
Ora vedremo come unire due frame di dati con il metodo di join Pandas. Per questo metodo, possiamo scegliere la colonna di vostra scelta su cui vogliamo lavorare da DataFrame. Abbiamo preso l'esempio con la colonna sovrapposta "a sinistra" dal "DF", quindi possiamo risolverlo con il "suffisso" per superare la sovrapposizione di dati. Qui, le variabili utilizzate sono "x", "z", "v", "d". "P", "O", "L" e "Y" con i valori assegnati come "3", "6", "7" e "9". IL ".join "chiama il metodo, con l'allineamento impostato su sinistra unisci con il suffisso" DF "destro. ". Il "suffisso" utilizzato nel codice è perché nel frame dati ci sono due colonne che hanno lo stesso nome che è "chiave" e che non si sovrappongono ai dati.
L'output non visualizza dati sovrapposti con il metodo di unire due "DF" utilizzando il metodo PANDAS.
Esempio # 02: Metodo di join Pandas utilizzando un ripristino dell'indice
In questo esempio, specificheremo separatamente la colonna con il parametro "ON" da utilizzare come "chiave" nel join metodo che aiuta a partecipare ai due frame dati. La cosa combinata è fatta con questo parametro. Inoltre, l'indice di uno dei due "DF" dovrebbe essere simile per unirsi a loro. Tipi simili di dati o dati utilizzati per lo stesso scopo possono essere insieme per l'elaborazione. Questo utilizzerà ancora l'indice, usando da destra. Le variabili sono la "S", "T", "U", "V", "N", 'W "," K "e" Q ". I valori assegnati sono "3", "6", "7" e "9". L '"indice di ripristino DOT" è un metodo di panda per ripristinare l'indice del "DF". L'indice di ripristino imposta tutti gli interi dell'elenco dei dati di dati da 0 fino a quando i dati del frame dati sono allungati.
Ecco l'output che viene visualizzato con il metodo di join "chiave" indice di panda.
Esempio # 03: Metodo di unione Pandas (colonna "sinistra e destra")
Il metodo di unione esegue un'operazione simile al metodo di join Panda. Entrambi i metodi sono per combinare i dati su un frame di dati simile. Il metodo di unione è più versatile che richiede specificare la chiave. Possiamo anche specificarlo sulle colonne sinistro e destro a seconda del lavoro del tuo telaio. Le variabili nel codice sono "S", "D", "G", "F", "K", "J", "B" e "Q". I valori assegnati sono "9", "5", "6" e "7". L'implementazione esterna "join" viene eseguita su entrambi i "df" utilizzando il parametro "come" della funzione del metodo di unione Pandas.
L'output che vediamo mostra i dati uniti dei due frame dati. Il "nan" rappresenta "non un numero", il che significa che dove non esiste un numero assegnato nei dati "nan" mostra lì.
Esempio # 04: il metodo di unione esplicitamente
Qui, in questo esempio, il metodo di unione è la distruzione dell'indice e il valore dell'indice non è assunto sul frame dati. Faremo questo metodo in base al lavoro che è necessario svolgere, laddove l'esplicito specifica è quello di seguire. Unisce i dati in base a un indice sinistro o indice destro con il parametro. Le variabili in questo frame dati sono "t", "r", "i", "u", "h", "o", "e" ed "e". I valori assegnati sono "2", "4", "6" e "4". L'esempio sopra del metodo di unione Panda con la selezione della colonna in base alla necessità è il metodo più presentabile e prezioso per unire i due telai dati. Verificare alla fine della riga di codice sul tasto di unione che è univoco nel set di dati.
Nell'output seguente l'indice non viene mostrato senza l'indice ma la funzione viene eseguita in base all'indice destro e sinistro.
Conclusione
I metodi unione () e il join () sono entrambi metodi molto convenienti ed efficaci. Entrambe queste funzioni vengono utilizzate per unire i due frame di dati separati sullo stesso frame di dati ma hanno un uso diverso a seconda del caso. In questo articolo, abbiamo appreso le differenze chiave tra il metodo di join e unione dei panda. Dopo aver fatto gli esempi e aver compreso il metodo di join Pandas, lo conclueremo con la consapevolezza che, se vogliamo unione in stile più flessibile e di database, è preferibile andare con il metodo di unione Pandas. D'altra parte, se vogliamo eseguire ampiamente il frame dati con l'indice, possiamo andare con la funzione metodo di join ().