Le colonne del frame dati, ognuna delle quali può contenere un numero intero, un numero a punto mobile o una stringa, sono rappresentate a livello di colonna perché contiene numerosi indici, quindi, pertanto, è impostata per considerare il non valore. Di conseguenza, fondiamo le informazioni usando questo livello di colonna. Il nome della variabile è una rappresentazione del nome variabile specifico che viene utilizzato per sciogliere le colonne. Questo adattabile in genere comprende un valore scalare e ha il valore predefinito di non utilizza la variabile utilizzata in quella colonna specifica per sciogliere il frame dati.
La sintassi per la funzione melt ()
"Value_vars" sono rappresentazioni delle colonne non asfaltate esistenti. La maggior parte delle colonne viene restituita e non impostata come "id_var" se i nomi delle colonne non sono indicati. Un elenco tupla o ndarray può essere utilizzato come questi parametri del valore. Tutte le sezioni utilizzate come variabili di identificatore sono rappresentate dalla variabile "ID_VARS". Il frame dati che deve essere assegnato in panda è indicato dal frame.
Esempio n. 1: usando la funzione di fusione, è possibile passare più colonne come parametro Value_Vars
Utilizzando Panda in Python, potremmo ristrutturare i dati in una forma più favorevole al computer per rendere più semplice l'elaborazione dei dati della tabella. La funzione imperativa "melt ()" richiede di essere eseguita. Un frame di dati non è raddoppiato dalla versione grande al solito formato usando “Panda.sciolto()". Inizialmente, creiamo il nostro frame dati. DataFrame viene utilizzato per archiviare le informazioni in formato bidimensionale. È identico a una tabella in cui i dati sono accumulati in righe e colonne. I record sono rappresentati da righe e le funzionalità sono rappresentate da colonne.
In questo caso, il nome del nostro frame di dati è "D1" che ha tre colonne. "Nome" è la prima colonna nel nostro frame di dati e inoltre è incluse un elenco di alcuni nomi: "Thomas", "Lily" e "Henry". La seconda colonna che abbiamo è "età" che contiene "25", "29" e "31". E nella terza colonna, "Profession", abbiamo "ingegnere", "medico" e "contabile". Usando “PD.DataFrame ”Visualizzeremo il frame dati sullo schermo.
Ora, aggiungiamo la funzione "Melt ()" alla nostra applicazione. Sono stati utilizzati i parametri "ID var" della funzione "mel ()" e i parametri "value var". Per utilizzare una colonna o una colonne come variabili di identificatore, utilizzare "Id _var" e "value_var" che è il secondo parametro utilizzato in questo esempio per definire dove il contenuto verrebbe fuso e archiviato nelle righe aggiuntive. Qui, usiamo un "int_var" in una singola colonna e un "valori_var" in numerose colonne. Usiamo "value_var" nelle colonne "età" e "professione" e "id_var" nella colonna "nome". “PD.Melt ”viene utilizzato per generare DataFrame e“ Print (DF_Melted) ”visualizzerà il Frame dati sullo schermo.
Sono visibili due frame dati nell'immagine di output del programma. Usando il "PD.Funzione DataFrame ", abbiamo generato il primo frame di dati in cui abbiamo tre colonne" nome "," età "e" professione ". Applicando i parametri "Id_var" e "Value _Var" al "PD.Metodo melt () ", viene generato il secondo frame dati. "Id_var" viene applicato in una singola colonna che è "nome". Significa che la colonna verrà mostrata esattamente così com'è con i suoi valori e il "valore_var" viene utilizzato in due colonne "età" e "professione". Crea due colonne nel frame dati, una è "variabile" e l'altra è "valore" nella colonna del valore, viene visualizzato il nome della colonna.
Uno strumento cruciale che sceglie righe specifiche e colonne di dati da un telaio di dati è chiamato un indice Pandas. Il suo compito è impostare i dati per un rapido accesso e organizzazione. È anche descritto come un sottogruppo. Il valore individuale dell'indice viene definito un'etichetta e i valori sono scritti in grassetto nell'indice. La dimensione dell'indice di dati iniziali è "3", che varia da "0 a 1" e quando vengono applicati i parametri, la dimensione dell'indice è "6" che varia da "0 a 5".
Esempio 2: usando la funzione di fusione, è possibile passare più colonne come parametro int_vars
Vedi cosa succede quando si specifica più di una colonna per l'opzione ID_VARS. Simile all'ultimo esempio, questo applica "Id_var" a più colonne mentre "value_var" viene applicato a una singola colonna. Nel programma precedente, "value_var" è stato applicato a più colonne mentre "Id_var" è stato applicato a una singola colonna.
La prima cosa che facciamo è costruire un telaio a tre colonne. Il nome della colonna è "nome", "marchi" e "soggetto". I nomi che sono nella prima colonna sono "Ava", "Isla" e "Leo". Nella seconda colonna, abbiamo l'elenco dei marchi "45", "22" e "31". Per la terza colonna, abbiamo il nome dell'argomento tra cui "Gestione", "OOP" e "Java". Ora, "PD.DataFrame ”genererà dati e“ print (df) ”visualizzerà il frame dati sullo schermo.
Incorporiamo ora il metodo "Melt ()" nel nostro codice. Sono stati utilizzati gli argomenti "id_var" e "value _var" della funzione "melt ()". Il "id_var" è usato in due colonne. "Nome" e "Marks" e "Value_var sono usati in una colonna" Soggetto ". Per creare il nuovo telaio di dati utilizzando le informazioni dal vecchio frame dati, utilizzare "PD.sciolto". Ora, il frame dati verrà visualizzato sullo schermo tramite "print (df fuso)".
Il risultato della funzione "Melt ()" con i suoi due argomenti che sono "id_var" e "value_var" viene visualizzato nell'output. Applicando "id_var" sulle due colonne "nome" e "marchi", visualizzerà i suoi valori così com'è e quando abbiamo applicato "value_var" alla colonna "Oggetto". Quindi, è diviso in queste due colonne "variabile" e "valore". Nella colonna "Variabile", mostra il nome della colonna "Soggetto" e nella colonna "Valore" mostra i valori della colonna "Soggetto". L'indice è "3" in grandezza, variando da "0 a 2".
Conclusione
Il metodo "Melt ()" in Panda è un modo versatile per modificare il frame dati Panda. Abbiamo imparato come utilizzare la funzione Melt () di Pandas per convertire un frame Big Data in un lungo frame di dati utilizzando un caso d'uso semplice. Dovresti ristrutturare costantemente una sezione delle parti nel nostro materiale mantenendo almeno un segmento come indicatori. La funzione "Melt ()" in Panda è uno strumento fantastico per la modifica dei dati. Se gestisci molte informazioni economiche e legate al denaro e le richiedi in una forma più lunga più adatta al database, è particolarmente utile.