Panda Assegna

Panda Assegna
Utilizzando la funzione ASSEGNA () in Panda, è possibile aggiungere nuovi segmenti a un frame di dati mentre si ripristina un duplicato dell'articolo originale. Le sezioni appena assegnate sostituiranno quelle esistenti. Uno dei pacchetti che rendono più accessibili la raccolta e la ricerca di informazioni. Selezioniamo un'opera mutevole, determiniamo i criteri in base ai quali ciascuna di queste modifiche deve essere applicata, quindi passerlo alle diverse funzioni assegnate. Quando ci sono due argomenti, il tipo target è quello che ci dice quali tipi dovremmo provare. Con un'eccezione discuteremo in un secondo, questo sarà naturalmente lo stesso del tipo iniziale.

Come utilizzare la funzione Assegna () nei panda

Per utilizzare la funzione Assegna () in Panda, in primo luogo, dobbiamo capire la sua sintassi.

Sintassi: DataFrame.Assegna (** Argomenti di parole chiave, self)

Dove,

Argomenti di parole chiave: I nomi delle colonne e gli slogan, fungono da argomenti di parole chiave. Se le qualità possono essere chiamate, il frame dati le elabora e le assegna alle nuove colonne di dati di dati. Anche se Pandas non lo controlla, il callo non può modificare il frame dati di input. Se le proprietà, come serie o cluster, non sono richiamabili. In un certo senso, sono assegnati. Un dizionario di stringhe o elenchi può essere utilizzato come argomenti di parole chiave.

se stesso: Restituisce un frame di dati completamente nuovo con colonne che sono state aggiunte a quelle esistenti come output.

Ora possiamo capire come funziona la funzione Assegna () di Pandas. In ogni caso, non possiamo ridurre significativamente la dimensione del nostro telaio di dati perché il numero intero di 64 byte occupa la stessa quantità di spazio di 64 byte di stringhe o valori di punta mobile, molto simile a come 100 libbre di mattoni pesano uguali a 100 libbre di blocchi. Abbiamo semplificato il processo di scoraggiare in seguito quei segmenti. Abbiamo incredibilmente poche caratteristiche qui, quindi se creiamo una capacità che prende un sottoinsieme di un sottoinsieme di colonna e tenta di determinarlo nella forma più piccola che può assumere, dovrebbe essere in grado di funzionare. I seguenti esempi ti aiuteranno a capirlo meglio.

Esempio 1: utilizzando la funzione Assegna () in Panda

La temperatura verrà calcolata in questo esempio utilizzando il metodo Assegna (). Mentre il modulo numpy funziona principalmente con dati numerici, il modulo Pandas funziona principalmente con dati tabulari. Dopo aver importato i moduli, creeremo un frame dati su cui possiamo applicare la funzione ASSEGNA ().

La funzione Lambda ha lo stesso potenziale per comportarsi come una funzione standard specificata utilizzando la parola chiave DEF di Python. Possiamo vedere la nostra cornice di dati utilizzando la funzione print () e passare il nome del nostro frame di dati dopo aver applicato la funzione ASSEGNA (), i.e., "Df_assign" come argomento nella funzione print (). Puoi anche illustrarlo semplicemente scrivendo il nome del frame di dati.

Numpy viene importato dopo i panda nello script precedentemente menzionato. Le temperature dei due paesi vengono quindi registrate mentre generiamo l'indice di dati e dati di dati per loro. Infine, utilizziamo il metodo Assegna () per calcolare le temperature utilizzando l'equazione fornita del programma. Quando assegniamo la funzione di stampa, la variabile DF, che rappresenta il frame dati, calcola l'equazione matematica e stampa l'output precedentemente visto. La funzione Assegna () calibra l'equazione, che considera le variabili. Per convertire da gradi Fahrenheit in gradi Celsius, 32 viene aggiunto ai valori di questa variabile "A" insieme a lambda. Quindi, il comando completa questa equazione e produce i risultati.

Esempio 2: nuova creazione variabile e un'assegnazione costante

Prima di eseguire uno di questi esempi, è necessario importare panda e creare il telaio di dati necessario.

Abbiamo chiamato il nostro frame dati "S-Data". Questo frame dati include variabili per vendite e spese e dati simulati per le vendite per ogni individuo. Possiamo aggiungere alcune variabili aggiuntive da qui utilizzando il metodo Assess ().

Se tutte le persone in questo set di dati sono impiegate dalla stessa attività o azienda, supponiamo che tu stia lavorando con tali informazioni. A differenza di "S_DATA", che contiene solo i dati dei dipendenti che lavorano per la stessa azienda, altri dati di dati possono avere record per i venditori che lavorano per varie aziende. E se volessimo fare una variabile per gli individui in questo telaio di dati che conteneva il nome della loro azienda? Con la funzione Assegna (), possiamo realizzare quanto segue:

In questo caso abbiamo aggiunto una nuova variabile denominata "business". Il valore della variabile aziendale è lo stesso per ogni riga di dati. Dice "hardware" come valore. Tecnicamente parlando, il valore è lo stesso per ogni riga. È un valore di stringa, per essere più precisi. Avendo affermato che, durante la creazione di variabili con valori costanti, con dati o valore numerici continui, possiamo assegnare una nuova variabile oltre ad aggiungere valori testuali come in questo esempio.

Esempio 3: aggiungi una variabile valore calcolata con il metodo ASSEGNA ()

Utilizzeremo lo stesso frame di dati "S_DATA" in questo esempio. Per essere più precisi, aggiungeremo "profitto" come una nuova variabile, pari costi di vendita (esperti di finanza e contabilità sapranno che questo non è un metodo esatto per calcolare il profitto; tuttavia, utilizzeremo questo calcolo distorto come esempio.).

Utilizzando questo codice, otterremo il seguente output:

In questo caso, abbiamo aggiunto una nuova colonna calcolata denominata "profitto". Il profitto, come si può vedere, è solo le spese di sottrazione delle vendite. Tuttavia, ricorda che dobbiamo usare i nomi "s_data.vendite "e" s_data.Spese "per fare riferimento alle variabili di vendita e spese all'interno di Assess (). Potremmo anche riferirci a loro come "s_data [" spese "]" e "s_data [" vendite "]". Puoi scegliere qualsiasi, ma per questo esempio, verrà utilizzato il precedente.

Esempio 4: aggiunta di più colonne utilizzando la funzione Assegna ()

Aggiungeremo due variabili contemporaneamente in questo esempio. Verranno aggiunte le variabili "affari" e "profitto". Useremo lo stesso frame di dati degli esempi precedenti 2 e 3, i.e., s_data.

Le variabili "profitto" e "business" vengono aggiunte contemporaneamente in questo esempio. Vedrai che abbiamo avviato una nuova riga di codice per la seconda variabile in termini di sintassi. Puoi mantenere tutto il tuo codice su una singola riga se vuoi, anche se non lo suggerisco particolarmente. La sovrascrittura diretta dei dati originali è un'altra opzione.

Basta eseguire il metodo ASSEGNA e inviare i risultati al telaio di dati "S_Data" specificato nel nome di dati originale. In alcune situazioni, farlo è del tutto appropriato. Occasionalmente potresti voler sostituire del tutto i tuoi dati.

Conclusione

Riassumeremo dicendo che la funzione Assemble () in Pandas ci consente di eseguire vari incarichi mentre creiamo un riferimento di Word dei nomi della sezione. In questo tutorial, abbiamo implementato diversi esempi per insegnare come utilizzare la funzione Assegna (), come aggiungere una nuova colonna con valore o dati costanti, come aggiungere una colonna con valori calcolati e come aggiungere più colonne in un frame dati Utilizzo della funzione Assegna ().