La codifica calda si riferisce alla conversione di dati categorici in modelli che gli algoritmi di apprendimento automatico possono utilizzare. Nella maggior parte dei casi, ciò comporta la conversione di ciascuna categoria in un valore binario di 1 o 0.
L'immagine seguente illustra la codifica onesta.
Fonte: Kaggle
È possibile esplorare la codifica onesta nella risorsa seguente:
https: // en.Wikipedia.org/wiki/one-hot
Dati di esempio
Iniziamo creando dati di esempio. Innanzitutto, utilizzare il codice di esempio come mostrato di seguito:
Importa panda come PDImporta Onehotencoder da Sci-Kit-Learn per eseguire una codifica a un hot per eseguire una codifica a un hot come mostrato:
da Sklearn.Preelaborazione di importazione OneHotecoderNell'esempio sopra, iniziamo importando Onehotencoder da Sci-Kit-Learn. Creiamo quindi un'istanza dell'encoder e passiamo il parametro Handle_unknown da ignorare.
Infine, creiamo un nuovo frame dati dai dati codificati. Il codice sopra dovrebbe restituire il nuovo frame dati come mostrato:
È inoltre possibile unire il telaio di dati codificato sul frame dati originale utilizzando il metodo di join come:
df = df.join (e_df)Il codice sopra dovrebbe restituire:
Conclusione
Questo articolo copre il minimo di eseguire una codifica di base di un Frame Data Panda utilizzando la libreria Sci-Kit-Learn.