Union Pandas

Union Pandas

La funzione del panda "indice.Union () ”viene utilizzato per ottenere l'indice in un ordine sindacale come nel capitolo set di matematica, dove abbiamo usato la funzione sindacale. Possiamo anche trovare l'unione dell'indice utilizzando la funzione "Concat ()", che combina il telaio di dati e imposta l'ordine dell'indice in modo sequenza.

La sintassi per il metodo Concat ()


La sintassi per l'indice.Metodo dell'Unione "


Esempio 1: l'unione di due indici di dati di dati utilizzando il metodo Concat ()

In questo esempio, stiamo usando la funzione "Concat ()" per "unione" gli indici di due frame dati. Concaterare due telai di dati insieme è un processo semplice. Sebbene la funzione "unione" nei panda sia simile a un'unione, elimina anche i duplicati. La funzione concat e i duplicati di caduta nei panda usano entrambi l'Unione. Questa funzione sindacale opera in modo simile a come opera la funzione sindacale nel capitolo matematico "Imposta", combinando tutti i numeri in sequenza; Tuttavia, nei panda, il numero ripetuto viene eliminato.

Stiamo utilizzando lo strumento "Spyder" per implementare il codice nel primo esempio dell'articolo. Il passo iniziale in ogni codice Python Pandas è importare la biblioteca di Panda come "PD".


Ora genereremo un frame dati. Per concatenare i dati dei dati e applicare un sindacato sui loro indici, verranno creati due frame dati. Il primo frame dati che abbiamo è chiamato "Tabella 1". Contiene due colonne, i "corsi" e "tassa", ciascuno ha alcuni valori indicati. Nella prima colonna, elenchiamo i nomi di alcuni corsi di programmazione, tra cui "OOP", "Python", "Java" e "Android Studio". Abbiamo citato le commissioni del corso nella seconda colonna, "Commissione" e sono "30000", "35000", "32000" e "25000". Per generare il nostro primo frame dati "Table1", ora stiamo utilizzando "PD.DataFrame ”, come puoi vedere nella seguente immagine:


La creazione del secondo frame dati "Table2" è la fase seguente. I nomi delle colonne in questo telaio dati sono gli stessi di quelli nel frame dati precedente, ma i loro valori differiscono. Abbiamo "graphic design", "PHP", "SQL" e "Swift" nella colonna "Corsi" e abbiamo "34000", "32000", "22000" e "24000" nella "Commissione" colonna. Per la generazione del secondo frame dati, Tabella 2, stiamo ancora una volta usando "PD.DataFrame "come dimostrato.


Ora, in questa sezione, implementeremo la funzione principale dei nostri esempi, che combina due telai di dati utilizzando la funzione "Concat ()" e applicando la funzione "Union" ai loro indici. Il metodo "Concat ()" concatena gli elementi di Pandas su un determinato asse con logica set opzionale, che può essere un incrocio o unione insieme agli altri assi. Qui, abbiamo usato "PD.CONCAT (Tabella 1, Tabella 2) "per combinare i dati di dati. Abbiamo anche superato il parametro "ignor_index = true" perché non vogliamo che l'indice venga ripetuto. Invece, desideriamo l'indice in forma incrementale quando si combinano i dati dei dati. Infine, abbiamo salvato il risultato nella variabile sindacale e lo abbiamo stampato utilizzando la funzione "Print ()". Di conseguenza, il metodo "Concat ()" utilizzerà essenzialmente l'indice per trovare l'Unione del Frame dati.


Passiamo al suo output, che è mostrato nella seguente immagine. Come possiamo vedere, la combinazione dei nostri frame dati ha funzionato correttamente utilizzando la funzione "Concat ()". Vengono visualizzate le due colonne, "corsi" e "tassa". Poiché il nostro indice non viene ripetuto, viene visualizzato nella schiuma dell'unione, come si può vedere, perché abbiamo superato il parametro della funzione "Concat ()", che è "Ignore_Index = True". La dimensione dell'indice che abbiamo attualmente è "8", il che significa che si estende da "da 0 a 7".

Esempio 2: combinando l'indice usando l'indice.Metodo Union ()

Questo è un esempio semplice e compatto. Prima di fondere i due indici in questo esempio, abbiamo utilizzato il "indice.Metodo Union () ". Come sempre, dobbiamo importare la libreria di Panda come "PD" prima di eseguire questo codice. In questo esempio, stiamo semplicemente costruendo un indice piuttosto che un telaio di dati. Quindi, per creare il "indice1" iniziale, abbiamo usato "PD.indice "con i numeri" 4 "," 5 "," 6 "e" 7 ", e abbiamo seguito la stessa procedura che puoi vedere per" Index2 ". I valori "index2" sono "8", "9", "10" e "11".


Come puoi vedere, stiamo attualmente utilizzando “Index1.Union (Index2) ". Creerà un ordine sindacale combinando entrambi gli indici. Successivamente utilizziamo il metodo "Print ()" per visualizzare il risultato generato.


Il risultato di output mostra che l'indice combinato inizia al numero quattro e si conclude al numero undici. Questa volta viene visualizzata una singola riga dell'indice. Indica anche che il suo tipo di dati è "int64".

Esempio 3: unione di tre indici di dati di dati utilizzando il metodo Concat ()

Questo esempio è simile al primo esempio, ma questo combinerà tre frame di dati e ordinerà i loro indici in sequenza. In generale, l'indice di Python restituisce la posizione dell'elemento fornito in un elenco o i caratteri in una stringa. L'indice definisce essenzialmente la posizione dell'elemento, per dirla semplicemente.

Dobbiamo importare la libreria Pandas come "PD" prima di poter iniziare a scrivere il codice per questo esempio. In questo scenario, dovrebbero essere creati tre frame dati. Il primo frame dati che abbiamo è chiamato "Data1", e ha tre colonne "Student_Name", "Marks" e "Osservazioni". Alcuni valori sono stati aggiunti a queste colonne. Abbiamo "Noah", "Emma", "Enna" e "George" nella prima colonna, "Student_Name" e nella seconda colonna "Marks", abbiamo un elenco dei segni dello studente "450", "490 "," 482 "e" 209 "e la colonna finale contiene le" osservazioni "dello studente o un" pass "o un" fallimento ". Ora creiamo questo frame dati come mostrato utilizzando "PD.DataFrame ".


È tempo di costruire un secondo frame dati con tre colonne, che sarà identico al primo, ma i valori delle colonne vengono modificati. Il frame dati è chiamato "data2". Abbiamo tre colonne "Student_Name", "Marks" e "Osservazioni". Nella prima colonna, "Student_name", abbiamo "Watson", "Henry", "James" e "Oliver" i valori nella seconda colonna, "Marks", abbiamo "499", "390", "290 "E" 400 "e nell'ultima colonna, abbiamo le osservazioni" Pass "o" Fail ". Questo frame dati "data2" è completato, quindi utilizziamo lo stesso "PD.DataFrame "per produrre questo.


È tempo di creare il terzo frame dati "data3", che ha tre colonne con gli stessi nomi dell'ultimo frame dati ma con valori diversi. I valori che abbiamo nella prima colonna sono "Archie", "Ethan", "Michael" e "Samuel". Abbiamo "230", "498", "290" e "403" nella seconda colonna, e nel terzo, abbiamo "Fail", "Pass", "Fail" e "Pass". Per generare il terzo frame dati "Data3", stiamo di nuovo usando "PD.DataFrame ".


Qui, combiniamo i nostri tre frame di dati e assegniamo ai loro indici una sequenza in termini di unione utilizzando la funzione "Concat ()" con il suo parametro. Qui, usiamo "PD.Concat (DF1, DF2, DF3) "viene utilizzato per combinare i frame dati, che sono" Data1 "," Data2 "e" Data3 ". Come puoi vedere, abbiamo utilizzato anche "Ignore_index = true", che ometterà l'indice ripetuto e fornirà loro un nuovo indice accurato e nel giusto ordine perché desideriamo un ordine sindacale per il nostro indice. Imposta l'opzione "ignore_index = true" per istruire la concatenazione di ignorare eventuali indici attualmente utilizzati. Quindi imposterà l'indice a partire da "0" per continuare nei risultati. Per archiviare il risultato prodotto da questa funzione, inizializziamo la variabile "unione". Successivamente, invochiamo la funzione "Print ()" per visualizzare il contenuto che viene archiviato in questa "unione":


I frame dati sono combinati e mostrati come un singolo frame di dati nell'output, come si può vedere. I tre frame dati vengono combinati utilizzando la funzione "Concat ()" e la sua unione dei loro indici utilizzando il parametro "Ignore_Index = true". A causa dello stesso numero di colonne e degli stessi nomi di colonne in ciascuno di questi tre frame di dati, non sono state visualizzate colonne extra nel risultato. "Student_name", "Marks" e "Osservations" sono le tre colonne visualizzate dopo la concatenazione. La rappresentazione dell'Unione dell'indice è visibile; Inizia da "0" e termina a "11", indicando che la dimensione dell'indice è "12".

Conclusione

In questo articolo, abbiamo concatenati il ​​telaio di dati per ottenere l'indice dell'Unione utilizzando la funzione "Concat ()". Utilizziamo inoltre il parametro della funzione Concat "ignor_index = true" perché non vogliamo l'indice ripetuto. Nel secondo esempio dell'articolo, che è breve e semplice, abbiamo usato l'indice.Funzione Union () "per combinare gli indici e visualizzare il tipo di dati dell'indice. Riteniamo che questi metodi semplificheranno il tuo compito.