I panda factorize

I panda factorize

"Pandas" è la più potente libreria Python per lavorare con i dati dei dati. Serve una diversità di scopi. Uno di questi è la funzione Panda "Facorize ()". Abbiamo spesso bisogno di convertire una variabile fornita in numeri, soprattutto prima di passarla in algoritmi che accettano solo input numerici. Il metodo Pandas "Factorize ()" ti consente di convertire facilmente le stringhe in numeri. Identifica i valori distinti dell'array e li restituisce come numero numerico. In Panda, la funzione "Facorize ()" trasforma un oggetto in una variabile categorica. Questo è utile per identificare i valori univoci."

Di seguito è riportata la sintassi per l'occupazione del metodo "Facorize ()" Panda:

La sintassi ci mostra quattro parametri di questa funzione. Descriviamo brevemente questi parametri.

Il parametro "valori" implica un array unidimensionale, come un elenco. IL "ordinare" Il parametro viene utilizzato per mantenere l'associazione, ordinare i valori distinti e i codici di scambio. Accetta un valore bool. È impostato su false per impostazione predefinita. IL "Na_sentinel" si riferisce al valore che dovrebbe essere contrassegnato come "non trovato". Se nessuno, il NAN non verrà eliminato dal carattere distintivo dei dati. IL "Size_hint" dà un suggerimento per il sizer di hashing.

Per l'utilizzo della funzione "fattorize ()", l'unico argomento obbligatorio è "valori". Tutte le altre funzionalità sono opzionali.

Due oggetti, "Codici" E "unico", sono restituiti dalla funzione "Facorize ()". Il termine "codici" riguarda un NDARRAY numerico che funge da indicizzatore per "unici", mentre i valori univoci validi sono indicati come "unici".

Nel suo articolo, esploreremo il concetto di realizzare fattori nella programmazione di Python usando il metodo Panda "Facorize ()" con alcuni dei suoi parametri per lo più esercitati.

Esempio n. 1: utilizzo del metodo Pandas "Facorize ()"

L'implementazione pratica del programma Python per eseguire il metodo Pandas "Facorize ()" sarà effettuata in questa illustrazione.

Lo strumento che stiamo utilizzando qui per la compilazione dei codici Python è "Spyder". Questo strumento soddisfa meglio i nostri requisiti di sistema. Abbiamo lanciato lo strumento. L'interfaccia utente è apparsa e iniziamo a scrivere il nostro script Python su di essa. La prima cosa che abbiamo fatto sul file Python è stata caricare la libreria, che dobbiamo essere in grado di accedere ai suoi metodi. Per i requisiti del nostro caso, dobbiamo caricare la biblioteca di Python "Panda". Abbiamo scritto lo script per questa libreria come "importare panda come PD". Alias ​​"PD" funzionerà per farci i metodi "panda" digitando l'abbreviazione anziché la forma completa.

Il toolkit Pandas viene caricato nel file Python; Ora, dobbiamo passare al passaggio successivo. Nella riga successiva della sceneggiatura, abbiamo generato un elenco di stringhe. Abbiamo creato una "mylist" variabile per archiviare il contenuto di questo elenco in modo da poterlo accedere in seguito. Le stringhe che abbiamo archiviato in questo elenco sono "Y", "Y", "X", "Z", "Y", "X", "Z" e "Z". Puoi vedere che questo elenco ha valori ricorrenti. In totale, contiene otto valori in esso. Per visualizzare questo elenco di stringhe sullo schermo, abbiamo impiegato la funzione "Print ()" di Python. Abbiamo prima fornito il testo "Questo è il nostro elenco di stringhe:" al metodo "Print ()" da visualizzare e la prossima funzione "Print ()" ha mostrato il contenuto "MyList" sulla console Spyder.

Per compilare lo script che abbiamo scritto sopra, premi il pulsante "Esegui file". Vedrai un elenco presentato sul terminale con otto valori.

Ora per trovare la fattorizzazione di questo elenco, abbiamo un metodo Panda “PD.fattorize () ". Questo metodo ci restituirà due array. Il primo sarà di codici, mentre il secondo mostrerà i valori univoci nell'elenco.

Abbiamo creato due variabili "COD" e "Uniq". Il "COD" memorizzerà i codici generati dal "PD.Metodo Factorize () "per l'elenco fornito. "Uniq" avrà i valori univoci nell'elenco. Abbiamo invocato il "PD.Factorize () "Metodo e ha superato l'elenco che abbiamo creato sopra," MyList "come parametro per questa funzione. Questa funzione genererà codici per ciascun valore nell'elenco e lo memorizzerà nella variabile "COD". E estraggerà i valori univoci dall'elenco e li posizionerà nella variabile "uniq". Quindi abbiamo chiamato il metodo "Print ()" per visualizzare prima il testo "I codici per l'elenco fornito sono:" e quindi il contenuto della variabile "COD". La prossima funzione "print ()" viene utilizzata per visualizzare il testo "Gli unici per l'elenco fornito sono:" e quindi i dati dalla variabile "Uniq".

L'output generato sul terminale ci mostra due array. Il primo array ha valori come "0", "0", "1", "2", "0", "1", "2" e "2". Il metodo "Facorize ()" ha convertito le stringhe in valori numerici. La "Y" è sostituita da "0", "X" è sostituita da "1" e "Z" è sostituita da "2". Il secondo array che ha restituito è l'array di valori unici, che sono "Y", "X" e "Z".

Esempio n. 2: utilizzando il metodo Pandas "Facorize ()" per l'ordinamento dei valori

Questa dimostrazione è per l'apprendimento della tecnica dei valori di smistamento negli array risultanti generati dal "PD.Metodo Factorize () ".

Abbiamo utilizzato l'elenco sopra creato per spiegare la tecnica di smistamento e mescolanza di questa funzione. Qui abbiamo creato due variabili, "shuffle" e "smistamento". La variabile "shuffle" memorizzerà i codici mescolati dalla variabile "mylist", mentre la variabile "ordinamento" avrà i valori univoci ordinati dell'elenco fornito. Abbiamo assegnato a queste variabili l'output di invocare il "PD.Metodo Factorize () ".

Il "PD.Il metodo Facterize () ”viene chiamato con due parametri. Il primo parametro è "valori" che è il nome dell'elenco "mylist" e il secondo parametro è "ordina". Il parametro "Ordina" ordinerà i valori univoci e quindi mescolerà i codici di conseguenza. Per impostazione predefinita, è impostato su "False", abbiamo modificato le impostazioni e impostate su "True" per eseguire l'ordinamento. Abbiamo impiegato due funzioni "print ()". Il primo a visualizzare il testo "I codici mescolati per l'elenco fornito sono:" e quindi i dati nella variabile "shuffle". L'altro metodo "Print ()" deve esibire il testo "Gli unici ordinati per l'elenco fornito sono:" seguito dal contenuto della variabile di "ordinamento".

Quando il risultato è presentato sul terminale, otteniamo nuovi array. Il primo array ha l'elenco di valori numerici mescolati come "1", "1", "0", "2", "1", "0", "2" e "2". Per tua comodità, abbiamo stampato anche i codici non shuffled in modo da poter capire facilmente la differenza. Il secondo array ha ordinato valori univoci come "X", "Y" e "Z". I valori univoci nell'elenco sono ora ordinati in ordine alfabetico. Puoi confrontarlo con l'array non desiderato, che ha gli unici come "y", "x" e "z".

Conclusione

In questo articolo, ci siamo concentrati sull'apprendimento della tecnica di fattorizzazione delle stringhe in numeri. A tale scopo, abbiamo utilizzato il PDAS “PD.Metodo Factorize () ". Questo approccio è abbastanza utile quando si raggruppano i dati e li traducono in valori numerici. Abbiamo elaborato la procedura per utilizzare questo metodo e descritto i suoi diversi parametri che possono essere esercitati quando necessario. Abbiamo effettuato l'implementazione pratica degli script di Python per comprendere l'applicazione di questo metodo. Abbiamo reso i codici di esempio e il loro output in questo tutorial. Raccomandiamo vivamente l'esercizio pratico di queste tecniche che iniziano dai programmi di base a complessi per raggiungere la migliore comprensione delle tecniche di Pandas.