I panda si uniscono a due frame di dati

I panda si uniscono a due frame di dati

“Panda è uno dei pacchetti del linguaggio Python, rendendo l'analisi dei dati più semplice e flessibile con cui lavorare ed elaborare meglio. Molte volte, nella vita reale, affrontiamo la situazione in cui abbiamo svolto il nostro lavoro in più file diversi e, a volte, dobbiamo vedere tutti i dati insieme in un "telaio di dati" per analizzare i dati invece di avere i dati in diverse posizioni. Quindi, i panda ci forniscono questa cosa possibile facilitandoci. Esistono vari modi per eseguire questo metodo; implementeremo il metodo "join" di panda in tutti i modi diversi possibili. Il metodo join () viene utilizzato principalmente e si unisce ai dati di dati in base a "indice". Useremo lo strumento "Spyder" per l'implementazione dei codici; È un software orientato a Python che ci fornirà vantaggi per l'implementazione del codice del metodo di join Pandas ()."

Sintassi

“DataFrame. giuntura"

La sintassi sopra viene utilizzata per l'adesione ai due dati di dati insieme. Funziona sempre utilizzando l'altro indice per lo scopo. Il frame dati può essere scritto come "DF". Il "dot join" è per la chiamata del metodo. Poiché utilizza l'indice ma non ci sono danni o modifiche eseguite in quella reale. L'indice di dati reali è preservato come originale.

Parametro

Più tardi, utilizzeremo un parametro come "altro" frame di dati. Ciò aiuta a unirsi ai due telai di dati insieme; La cosa combinata è fatta con questo parametro. Inoltre, l'indice di uno dei due "DF" dovrebbe essere simile per unirsi a loro. Ciò significa che tipi simili di dati o dati utilizzati per lo stesso scopo possono essere insieme per l'elaborazione.

Di seguito sono riportati i diversi modi in cui faremo gli esempi per l'implementazione del metodo join () in un "DF".

  • Metodo di join panda usando gli indici.
  • Metodo di join panda usando le colonne (chiave).
  • Il metodo di join panda conserva l'indice di dati originale.
  • Metodo di join panda usando non unico (chiave).

Creazione di dati per l'implementazione del metodo di join ()

Qui, in primo luogo, dobbiamo importare la libreria Pandas come "PD", quindi creeremo il frame dati costituito da due colonne, una è della "chiave" come "T0", "T1", "T2", "T3 "," T4 "e" T5 "e l'altro è di valori" N "come" N0 "," N1 "," N2 "," N3 "," N4 "e" N5 ". Il "DF" rappresenta il frame dati nel codice.

L'output mostra i dati inseriti nel frame dati; Possiamo vedere le colonne "chiave" e "n" sono stampate.

Creazione di un altro telaio di dati per il metodo Panda join ()

Stiamo creando un altro frame dati perché separare i frame dati e quindi li combineremo usando il metodo PANDAS join (). Il frame dati è costituito da due colonne; Mentre creiamo l'ultimo "DF", la colonna "chiave" ha valori come "T0", "T1", "T2" e "T3"; D'altra parte, l'altra colonna ha i valori di "M" come "M0", "M1", "M2", "M3".

Ecco l'output che visualizza la semplice creazione di dati di dati secondo il codice.

Puoi vedere che ci sono due frame di dati e vogliamo averli entrambi insieme nello stesso frame di dati, quindi ora faremo gli esempi per vedere come accadrà.

Esempio # 01: metodo Panda join () usando gli indici

Apri lo strumento "Spyder". Ora, per unire i due frame dati insieme, dovremmo prima creare i due frame dati per unirci a loro. Qui i frame dati sono costituiti dalle variabili "x" e "y" con i valori assegnati come "x" con "x0", "x1", "x2", "x3", "x4" e "x5" mentre "y" Ha meno valori, che sono "Y0", "Y1", "Y2" e "Y3". I valori "chiave" sono da "k0" a "k5" e in altri valori "df", "chiave" sono da "k0" a "k2". Quindi il frame dati con la chiamata del metodo "Dot join" combinerà i due "DF". Il "suffisso" utilizzato nel codice è perché, nel frame dati, ci sono due colonne che hanno lo stesso nome, i.e., "chiave". Che non si sovrapponga ai dati.

L'output visualizza i due "df" in uno. Come possiamo vedere che ci sono alcuni valori come "nan", il che significa che non è "non un numero". Il "DF" ha più valori del secondo "DF", quindi, dove non c'è valore assegnato, mostra come "NAN".

Esempio # 02: metodo di join panda usando le colonne (chiave)

Come sappiamo ora come unirti a due frame di dati insieme, qui ora lo faremo usando il metodo della colonna "chiave". Il metodo della colonna chiave organizza i dati come colonne per quanto riguarda il loro indice. Qui il telaio di dati è costituito dalle variabili "N" e "W". La "N" ha valori come "N0", "N1", "N2", "N3", "N4" e "N5". Mentre "W" ha i valori "W0", "W1" e "W2". Il df con “.Imposta indice "mostra con la" chiave "e con il metodo di join chiamante come".join ", con l'altro indice" df "allegato. Questo metodo di join combinerà entrambi i "df" usando il loro indice. Questo è un metodo molto efficiente di unione Panda che aiuterà variamente in un ambiente di big data.

L'output utilizzando il metodo della colonna di join () di Pandas mostra le colonne con valori chiave e le variabili "N" e "W".

Esempio # 03: Metodo di join Panda che preserva l'indice originale DataFrame

In questo esempio, vedremo e dimostraremo ciò che abbiamo scritto sopra che i dati sono conservati al suo stato originale. Qui i dati dei dati hanno le variabili "P" e "W". La "P" con i valori "P0", "P1", "P2", "P3", "P4" e "P5". "W" con i valori "Q0", "Q1" e "Q2". IL ".L'implementazione di join "in" DF "è impostata con" Index "(Key). Questo metodo mostrerà i dati mantenuti con l'indice "i dati originali".

Il display rappresenta i dati reali senza avere l'originalità.

Esempio # 04: metodo di join panda usando non unico (chiave)

Ora faremo un esempio per capire un metodo unico. Nell'esempio precedente, abbiamo imparato come vengono mantenuti i dati originali. Ciò è stato fatto mostrando i due frame dati disponibili sul codice. Ora faremo lo stesso per controllare lo stato originale e anche unire il metodo con l'altro "DF" non è lì. Il "DF" qui ha "P" e la "chiave". "P" ha i valori da "p0" a "p5" continui e i valori "chiave" da "k0" a "k5" rispettivamente. La chiamata del metodo "Dot join" viene eseguita con l'altro "set indice" inducendo "chiave".

L'output è simile all'output dell'ultimo esempio. I dati vengono acquisiti dai dati mantenuti originali.

Conclusione

Il metodo di panda che si unisce a due dati di dati è efficiente e conveniente. Questo metodo utilizza il ".Unisciti "Funzione per gestire i dati e per unire i dati di dati insieme. Questo metodo è un ottimo modo per presentare i dati, soprattutto quando stiamo lavorando su un'enorme quantità di dati nella directory ovunque in cui viene eseguita l'analisi dei dati. Abbiamo discusso di come il metodo di join panda può essere implementato per una migliore comprensione della funzione. Abbiamo fatto il modo "indice", il modo di "colonna" e il modo "chiave" per portare i due diversi frame di dati in uno solo.