Panda divise colonne per delimitatore

Panda divise colonne per delimitatore
"Pandas" è un pacchetto Python. È flessibile e ha un design espressivo strutturato dai dati su cui lavorare con i dati in diverse maniere. Inoltre, i dati dei dati Panda sono ottimi per manipolare i dati. Il più delle volte lavoriamo su dati che hanno una colonna contenente un valore di stringa delimitato, ad esempio "x, y, z" e vogliamo che siano in colonne separate. Ciò è possibile utilizzando una funzione dei panda che discuteremo in questo articolo. Impareremo come dividere una colonna di testo in colonne separate individualmente. Per quella funzione panda della colonna divisa per delimitatore dovrebbe essere utilizzata. La sua sintassi è un po 'come la funzione di stringa Python "str ()". Ma i panda divisi per colonna, divide i dati dell'intero telaio. Per l'implementazione del codice, utilizzeremo lo strumento "Spyder". Come è un software per la lingua Python.

Sintassi

Str.diviso()

La sintassi sopra viene utilizzata per dividere il testo in colonne in un frame di dati. Funziona dividendo la colonna per delimitazione in varie colonne. Implementiamo la sintassi della serie Pandas “STR.funzione split () "nella colonna" indirizzo "e passarla con la" virgola "per la separazione della colonna che vogliamo divisi.

Parametri

Esistono alcuni parametri che useremo più avanti negli esempi di colonna divisa Panda per delimitatore:

Espandere: Espande il valore della stringa in una colonna separata.

Condizioni: se "vero", restituisce il frame di dati; Se "false", restituisce la serie/indice (stringhe).

"N" limita il numero di una divisione nell'output.

Di seguito sono riportati i modi in cui i panda si dividono per delimitatore:

  • Panda Split Column per delimitatore (aggiungi una nuova colonna a "DF").
  • Panda Split Column per delimitatore (all'interno di un elenco).
  • Panda Split Column mediante delimitazione specificando il numero di divisioni.

Creazione del frame dati per gli esempi Implementazione di Panda Split Column di Delimiter

Dopo aver aperto lo strumento "Spyder", importa la libreria Pandas come "PD". Ora, inizia a creare il "DF". Il "DF" è l'abbreviazione del "Frame dati". Il "DF" ha l'indirizzo completo di alcune aree dei diversi paesi come: "5632 Main Street, Park, Canada"; "2525 Downtown, Salt Mine, Italia"; "7896 Sky View, appartamento, Messico"; e la "3988" Sunshine Road, Villa, Giappone ". Qui, vediamo che i dati sono separati dalla colonna. Nei prossimi esempi, impareremo come dividere separatamente quelle aree di "virgola" nelle colonne usando la divisione dei panda per funzione delimita.

L'output mostra la creazione di dati dei dati forniti nel codice.

Esempio 01: Panda Split Column per delimitazione in più colonne

In questo esempio, divideremo le colonne dei dati di testo in più colonne per delimitatore della funzione di divisione Panda. Il telaio di dati è costituito dagli indirizzi delle strade come: "5623 Main Street, centro commerciale, Turchia"; "4585 Downtown, scuola scolastica, Francia"; "0032 Sky View, College, Indonesia"; e "1125 Sunshine Next, Università, Cina". Tutti questi indirizzi sono di diverse aree separare quelle aree di "virgola" del testo in una colonna separata. Possiamo dire che possiamo prenderlo come operatore di riconoscimento del separatore per dividere. Applicheremo la funzione di divisione Panda sul "indirizzo". Quindi, la virgola in questo caso si dividerà. Inoltre, dobbiamo assicurarci di passare i parametri come "espandere" per il valore "vero".

L'output visualizza le colonne separate dell'indirizzo nella colonna "0". Nella colonna "1", abbiamo le aree in particolare e nella colonna "2", abbiamo i nomi del paese. Viene creato un telaio di dati ben presentato e organizzato.

Esempio 02: Panda Split Column per delimitatore all'interno di un elenco

Creeremo un telaio di dati per l'implementazione di esempio della colonna divisa Panda per delimitatore questa volta "all'interno di un elenco". Il telaio di dati è come "7854 Main Street, Pire Shop"; "8009 Downtown, Sweet Shop, Tokyo"; "1003 Sky View, Ice Cream Shop, Sri Lanka"; e "7009 Sunshine Next, High School, Africa". Ora non passeremo il parametro vero in questo esempio per fare la divisione all'interno della colonna.

Qui nell'uscita, la divisione viene eseguita all'interno delle colonne. Ma questo non si è rivelato per visualizzare la creazione di colonne separate perché la divisione è all'interno di un elenco. Se vogliamo divisi in una colonna separata, l'ultimo esempio mostrerà.

Esempio 03: Panda Split Column per delimitatore (aggiungi una nuova colonna a "DF")

In questo esempio, aggiungeremo un'altra colonna al telaio di dati accanto alle colonne separate che possono essere fatte facilmente dalla colonna divisa Panda e dalla funzione delimita. Il frame dati è lo stesso dell'ultimo esempio. Ora abbiamo selezionato lo "stato" come colonna aggiuntiva. Abbiamo l'intero telaio di dati e l'ennesima colonna in una colonna separata. In questo modo, se vogliamo modificare o eseguire qualsiasi analisi di tale quantità specifica di dati, possiamo averlo separatamente senza influire sui dati originali.

Il display ha colonne separate e aggiunge la colonna di "stato" in una colonna separata di se stesso. Questo è quattro per quattro colonne che significa 2 righe e 2 colonne.

Esempio 04: Panda Split Column mediante delimitazione specificando il numero di divisioni

Nell'esempio 01 sopra, abbiamo fatto la suddivisione delle colonne di testo fornendo l'indirizzo sul verificarsi della "virgola" delimitante, che ha portato alla separazione di tre colonne. Allo stesso modo, possiamo specificare il numero di divisioni che vogliamo. In questo caso, impareremo come farlo. Il frame dati è costituito dagli indirizzi come: “4585 12th Street, Grocery Store, New York "," 7000 Portlands, Airport, Italia "; “4555 13th Strada, stazione ferroviaria, Spagna ”; e il "7777 commerciale successivo, Candy Shop, Australia". La "n = 1" indica che vogliamo dividere il frame dati una volta. La divisione avverrà al primo occorrenza, le altre colonne di sinistra saranno viste insieme.

L'output visualizza la suddivisione del telaio di dati utilizzando la colonna divisa Panda per funzione delimitante e indicando N come "1". Quindi, la scissione viene eseguita una volta solo. Le città e gli Stati sono nella seconda colonna e la prima occorrenza degli indirizzi è nella prima colonna.

Conclusione

La funzione di funzione Panda divisa per il delimitatore è utile ed efficiente. Tutte le volte in base alla necessità, vogliamo avere i dati in una colonna o una convenzione specifica per necessità. Quindi, tutto ciò può essere fatto usando la colonna divisa Panda per delimitatore. Abbiamo eseguito funzioni come la divisione di più colonne, la divisione all'interno della colonna, la divisione e l'aggiunta di una nuova colonna e infine la divisione specificando il numero di divisioni.