Un tipo di dati è un elemento fondamentale utilizzato dai linguaggi di computer per capire come preservare e modificare i dati. In un Frame di dati Panda, potresti spesso voler trasformare le colonne singole o più. Convenientemente, usando le varie funzioni native dei panda, questo è semplice da realizzare.
Questo articolo ti insegnerà come trasformare i valori in una colonna in un tipo di dati stringa utilizzando la libreria Pandas in Python. Scoprirai quindi come trasformare i galleggianti e gli interi in stringhe di panda. Scoprirai come convertire le colonne in un frame dati Panda in una stringa oltre ai quattro modi distinti per farlo. Il frame dati.ASTYPE (STR), DataFrame.valori.ASTYPE (STR), DataFrame.Applica (STR), DataFrame.Mappa (STR) e DataFrame.ApplecMap (STR) sono alcuni dei metodi utilizzati nella dimostrazione per convertire qualsiasi tipo in un tipo di stringa.
Costruire il telaio di dati utilizzando panda.Metodo DataFrame ()
Il primo e principale requisito per il programma è importare la libreria Pandas come PD per avvalersi delle funzionalità Panda. Il prossimo passo è creare un frame dati Panda. Costruiremo un telaio di dati con tre colonne distinte, una delle quali funziona come una stringa e le altre due si caricheranno come numeri interi. Quindi, utilizziamo la funzione print () per visualizzare i suoi cinque record.
Nell'illustrazione precedente, abbiamo creato un frame dati che utilizza i panda.Metodo DataFrame (). Questo frame dati ha tre colonne: "nome", "età" e "stipendio". Ogni colonna memorizza cinque record o valori. Abbiamo creato un oggetto DataFrame "dati" e gli abbiamo assegnato l'output di chiamare il PD.Metodo DataFrame (). Quindi, il frame dati Pandas è accessibile utilizzando questo oggetto. Abbiamo quindi utilizzato la funzione print () per visualizzare il frame dati.
Il frame dati che abbiamo appena creato appare sul terminale che può essere visto nell'istantanea allegata nel seguente:
Ora, scopriamo i dati di tutte le colonne del frame dati. Per questo, usiamo i panda .funzione info (). IL .Il metodo info () ci visualizza i dettagli sul frame dati, fornendo i dati di ogni colonna, permettendoci di esaminare come i Panda elaborano i dati della stringa.
Abbiamo utilizzato il telaio di dati Pandas.Metodo info () nel codice precedente. La funzione print () viene quindi invocata con i dati.info () come parametri per visualizzare le informazioni sul tipo di dati delle colonne di DataFrame.
Questo è l'output visualizzato sul terminale:
Nell'esempio precedente, possiamo osservare che Panda gestisce sempre le stringhe come oggetti per impostazione predefinita. Le stringhe e i tipi di dati misti sono entrambi gestiti dal tipo di dati dell'oggetto. Tuttavia, non è notevolmente ovvio.
I panda hanno un tipo di dati stringa specifico dalla versione 1.0. Sebbene questo tipo di dati non fornisca ancora un chiaro miglioramento di archiviazione o efficienza, il team di sviluppatori Pandas ha affermato che ciò accadrà in futuro. Di conseguenza, la lezione impiegherà esclusivamente il tipo di dati String.
Cominciamo convertendo una colonna in una stringa usando l'approccio Panda preferito.
Esempio 1:
Il primo metodo che utilizziamo è la funzione Panda ASTYPE (). La tecnica della colonna (serie) è una caratteristica dei panda.
Se stai gestendo i panda 1.0 o successivo, passare nella "stringa". Altrimenti, usa la "STR" per le edizioni dei panda prima di 1.0. Adottando questo, si può essere certi che il tipo di dati String venga utilizzato al posto del tipo di dati di oggetti.
Cominciamo con la sua dimostrazione pratica in un ambiente Python.
Nel codice precedente utilizzando i "dati" precedentemente creati da dati, ora abbiamo utilizzato i panda ".funzione astype () ". Abbiamo scritto il nome del frame dati con ".Funzione ASTYPE () "e fornito il tipo di dati" String "come parametro. Successivamente, abbiamo invocato il ".Metodo info () ”all'interno della funzione Print () Parentesi per visualizzare il tipo di dati aggiornato delle colonne DataFrame.
L'esecuzione del precedente script di Python ci produce il seguente risultato:
La colonna "Age" del nostro Frame Data Pandas, che è stato inizialmente conservato come un INT64, è attualmente gestita come un tipo di dati di stringa come si può vedere.
Esempio 2:
Puoi impiegare il .Tecnica Map () per cambiare una colonna Panda in stringhe in modo identico al .Funzione della serie Pandas ASTYPE ().
Esploriamo cosa sembra essere:
L'illustrazione inizia utilizzando il codice del telaio di dati che abbiamo spiegato nell'esempio precedente. Dopo aver stampato il telaio dati, abbiamo quindi visualizzato i dati con l'aiuto del ".funzione info () ". Ora, scegliamo una colonna il cui tipo di dati è necessario convertire in una stringa. Abbiamo selezionato di nuovo la colonna "età" per detto scopo. Quindi, abbiamo invocato il ".funzione mappa () "con l'oggetto dati e il nome della colonna specificata. Abbiamo anche definito il tipo di dati all'interno del ".Mappa (STR) "Brace della funzione. Dobbiamo controllare il tipo di dati aggiornato con ".metodo info () ".
L'output può essere visto nella seguente immagine:
È chiaro da ciò che il tipo di dati String non può essere utilizzato quando si utilizza il .Metodo mappa (). I dati vengono archiviati nel tipo di dati oggetto di conseguenza. Per questo motivo, se stai eseguendo un'edizione superiore a 1.0, consigliamo di non utilizzare questo metodo.
Esempio 3:
Come la tecnica descritta in precedenza, possiamo anche cambiare il tipo di dati di una colonna Panda in stringhe usando il .Metodo Applica (). Si applicano le stesse restrizioni, in quanto siamo in grado di trasformarli solo in dati di oggetti. Non siamo ancora in grado di trasformarli in String Datationypes.
Diamo un'occhiata:
Come puoi vedere nel precedente script fornito, viene utilizzato il metodo Applic (). Tra le parentesi graffe di questa funzione, specifichiamo il tipo di dati. Questo metodo non prende la "stringa". Invece, funziona con "STR". Quindi, abbiamo visualizzato i dati con l'utilizzo del metodo info ().
Il terminale risultante mostra che il tipo di dati aggiornato è cambiato da int64 a oggetto che è una stringa.
Esempio 4:
Inoltre, possiamo utilizzare il valore dei Pandas.funzione astype () per trasformare direttamente i valori di una colonna in stringhe.
Qui, esploriamo le sue opere con l'implementazione del codice Python:
Con lo stesso frame e colonna di dati, abbiamo utilizzato i valori dei panda ".Metodo ASTYPE () "e ha superato il tipo di dati" STR "come argomento. Infine, abbiamo visualizzato i dati con il metodo info ().
Questo ci dà il seguente output:
Esempio 5:
Il nostro ultimo segmento ti insegna come utilizzare il .Funzione Applicmap () per trasformare tutte le colonne Pandas DataFrame in stringhe.
In questo metodo, abbiamo usato il .Metodo ApplicMap (). Dato che vogliamo convertire tutte le colonne, non è necessario menzionare alcun nome di colonna specifico con l'oggetto DataFrame come abbiamo fatto in precedenza. Abbiamo semplicemente usato l'oggetto DataFrame con il .Funzione Applicamap () e passato il tipo di dati "STR" come parametro.
Questo è il seguente output:
Conclusione
Questa lezione si basa sui diversi metodi dei Pandas per convertire le colonne in Datatypi String. Abbiamo utilizzato tutti i modi possibili per darti un sacco di scelte facili quando incontriamo tali problemi. Abbiamo dimostrato alcuni codici di esempio pratici per aiutarti a imparare le varie tecniche di panda. Speriamo che questa scrittura ti aiuti a capire i moduli Pandas.