I panda cambiano il tipo di colonna in stringa

I panda cambiano il tipo di colonna in stringa
Potrebbe essere necessario modificare i tipi di colonna di un frame di dati dopo la creazione per una serie di motivi, come per convertire una colonna in un formato numerico che può essere utilizzato per la modellazione e la classificazione. Questo tutorial mostra come convertire i valori della colonna in un tipo di dati stringa utilizzando il pacchetto Pandas di Python. Cercheremo di insegnarti come cambiare i valori galleggianti e interi di panda in stringhe. Inoltre, imparerai i vantaggi dell'utilizzo di String Datatype in Panda e come le stringhe si sono evolute in Panda. Utilizzeremo diverse funzioni per modificare i dataypes della colonna di dati in una stringa.

String Datatalype in panda

I panda usano il tipo di dati Object per impostazione predefinita per archiviare le stringhe. Stringhe e tipi di dati misti sono entrambi gestiti dal tipo di dati dell'oggetto, tuttavia non è esplicito in particolare. C'è stato un dati di stringa dedicato in panda nella versione 1.0. Sebbene questo tipo di dati non fornisca ancora alcuna risorsa esplicita o miglioramenti delle prestazioni, il team di sviluppo di Panda ha affermato che ciò accadrà in futuro. Di conseguenza, questo tutorial impiegherà esclusivamente il tipo di dati String. Usa "STR" al posto della stringa quando possibile se si utilizza una versione Python inferiore a 1.0.

Come cambiare la colonna Pandas in stringa

Diverse funzioni possono essere utilizzate per modificare la colonna in Panda in String Datatype. L'uso del metodo ASTYPE () è il modo più comune per farlo. Diamo un'occhiata alla funzione ASTYPE () per vedere come funziona.

Sintassi: df.ASTYPE (“column_name”: str, errors = "alza")

df.astype (): Un metodo per chiamare la funzione Panda ASTYPE.

"Nome colonna": STR: Colonne da convertire in un formato diverso (tipo di dati String). Il nome della colonna è la colonna il cui tipo di dati verrà modificato. I valori della colonna devono essere trasformati in un tipo di dati richiesto, che è stringa. Qualsiasi tipo di dati integrato di python o tipo di dati è accettabile.

errori = 'sollevare': Per definire come le eccezioni dovrebbero essere gestite durante la converzione. Vengono convertiti solo i possibili valori delle celle; "Sollevare" visualizzerà un errore e "ignora" lo ignorerà.

Abbiamo visto la sintassi del metodo ASTYPE (). Ora, nei seguenti esempi, imparerai come utilizzare ASTYPE (), altre funzioni e attributi per convertire le colonne di dati in stringhe.

Esempio 1: usando il metodo ASTYPE ()

Un oggetto Pandas può essere convertito in un tipo di dati specifico utilizzando il metodo ASTYPE (). Qualsiasi colonna esistente appropriata può essere convertita in un tipo categorico usando la funzione ASTYPE (). Quando dobbiamo convertire il tipo di dati di una colonna specifica in un altro tipo di dati, il metodo ASTYPE () è molto utile. In questo esempio, modificheremo il tipo di dati di colonna in Stringa utilizzando la funzione ASTYPE () perché dobbiamo creare un frame dati. Per la creazione di un frame dati, importare prima la libreria Pandas per utilizzare le sue funzionalità e funzionalità.


Abbiamo creato il nostro telaio dati passando un dizionario al PD.DataFrame () funzioni come argomento. Le chiavi del dizionario diventano le etichette per ogni colonna dopo averli passati nel PD.Funzione DataFrame () e i valori dei tasti diventano i valori delle colonne di DataFrame. Per visualizzare il frame dati, utilizziamo la funzione print ().


Nel precedente Frame Data, abbiamo quattro colonne di dati di dati. La prima colonna "Studente" contiene i nomi degli studenti: "Jack", "Tony", "Marty", "Alex", "Rob". Nella seconda colonna "Age", l'età di ogni studente viene immagazzinata "16, 15, 18, 17, 17". Mentre la colonna "Commissione" memorizza la commissione di ciascun corso "7000.0, 6500.0, 7100.0, 7000.0, 6900.0 ". L'argomento della colonna è costituita dai nomi delle materie: "inglese", "statistica", "matematica", "inglese", "scienza" . Possiamo controllare il tipo di dati di ogni riga utilizzando l'attributo dTypes come segue:


Il tipo di dati delle colonne "Studente" e "Oggetto" è "Oggetto".Mentre il tipo di dati delle colonne "età" e "tassa" è int64 e float64, rispettivamente. Ora, modifichiamo il tipo di dati della colonna "Commissione" da float a String.


Quando abbiamo applicato il metodo ASTYPES () e superata il tipo di dati "String" per modificare il tipo di dati della colonna "Commissione", vediamo se la colonna viene convertita in una stringa o no.


Puoi notare che il tipo di dati della colonna "Commissione" viene convertito in String da Float64.

Esempio 2: utilizzando il metodo Map () e Applica ()

Il metodo Map () viene utilizzato per convertire i valori delle serie nei loro ingressi corrispondenti. Per modificare ogni valore di dati in una serie con un valore diverso, viene utilizzata la funzione mappa (). Tale valore può essere ottenuto da una serie, un dict o una funzione mentre gli utenti possono passare una funzione e applicarla ad ogni valore nella serie Panda utilizzando la funzione PANDAS APPLE (). Tuttavia, queste funzioni possono essere utilizzate per modificare il tipo di dati delle colonne. Usiamo lo stesso telaio di dati che abbiamo creato nell'esempio precedente.


Ora, controlliamo i dati delle colonne utilizzando l'attributo dTypes.


Ora, modifichiamo i dati dei dati della colonna "età" utilizzando la funzione mappa () e modifichiamo i dati della colonna "Commissione" con applicazione ().


Abbiamo applicato sia la funzione Map () che Applic () alla colonna "Commissione" e "Age", rispettivamente. Usiamo l'attributo dTypes sul nostro telaio di dati "DF" per vedere i risultati.


Qui, possiamo vedere che il tipo di dati "String" non può essere utilizzato quando si utilizza il metodo Map () e Applica (). Entrambe le colonne "età" e "tassa" sono ora convertite in un tipo di dati di oggetti di conseguenza. Tuttavia, i panda usano il tipo di dati Object per impostazione predefinita per archiviare le "stringhe", ma desideriamo il risultato in un tipo di dati "String". Per questo motivo, non consigliamo di utilizzare questi metodi nelle nuove versioni di Python per modificare i dati delle colonne.

Esempio 3: usando il metodo ASTYPE ()

Ultimo ma non meno importante, utilizziamo il metodo ASTYPE () per modificare il tipo di dati del frame dati in stringhe. Abbiamo visto come modificare i dati di colonne specifiche del frame dati in "stringa" negli esempi precedenti. Ora cambiamo i dati di tutte le colonne in "String" in questo esempio. Ancora una volta, utilizziamo il telaio di dati "DF" per questo esempio.


Utilizzando l'attributo DTypes, controlliamo prima i dati delle nostre colonne "DF".


Nessuna delle colonne nel Frame dati precedente ha una colonna con tipo di dati String. Ora, utilizziamo il metodo ASTYPE () per modificare il tipo di dati di tutte le colonne del Frame dati nel tipo di dati "String".


Come si può vedere, semplicemente usando la proprietà ASTYPE () con il frame dati mentre si passa la "stringa" all'interno della funzione, è possibile modificare facilmente tutte le colonne del frame dati in stringa.


I dati di ogni colonna vengono modificati in stringa.

Possiamo anche utilizzare la funzione Applicmap () o .valori.ASTYPE () per convertire i dati dei dati ma restituiranno il tipo di dati "oggetto" anziché "stringa".

Conclusione

In questo tutorial, abbiamo discusso di cosa sia una stringa di tipi di dati in Python e come puoi cambiare la colonna Panda nella stringa. Abbiamo imparato la sintassi della funzione astype () per capire come funziona. Dopo aver attraversato questo tutorial, potresti essere in grado di cambiare le colonne nella stringa da solo. Abbiamo implementato diversi esempi per insegnarti come il metodo ASTYPE è possibile utilizzare la mappa () e applicare ().