Pandas DataFrame da Dict

Pandas DataFrame da Dict
Un frame di dati Panda può essere generato utilizzando un Dict Python (Dizionario) che è una coppia di valore chiave. In tempo reale, di solito produciamo un telaio di dati Pandas importando un file CSV o un'altra risorsa, ma è possibile generarlo utilizzando anche un oggetto Dict (Dizionario).

Python Panda sono spesso distribuiti sia nelle attività di elaborazione della scienza/dati dei dati che. È sviluppato sulla fondazione di Numpy, un'altra importante biblioteca Python che supporta i calcoli scientifici. In Python, i dati di dati Pandas sono estremamente utili per lavorare con dati 2D (bidimensionali). Un frame di dati Panda può essere costruito in una varietà di metodi, uno di questi è estrarre i dati da un determinato dizionario.

Esempio 1: utilizzando il costruttore predefinito PD.DataFrame () per generare un dati di dati da un dizionario

Questo approccio inizia generando un dizionario di elenchi Python, che quindi passiamo al PD.Metodo DataFrame (). L'ultimo ma non meno importante, il PD.Il metodo DataFrame () emette un oggetto PANDAS DataFrame contenente il contenuto dal dizionario degli elenchi.

Ora, mettici in pratica usando lo scripting di Python.

Nel file di Python, importiamo innanzitutto la libreria necessaria che è Pandas in questa illustrazione in quanto useremo le funzionalità Panda qui.

Quindi creiamo un dizionario "dati" e li inizializziamo con tre elenchi con il titoli "Nome", "Age" e "Institute", rispettivamente. Assegniamo ogni elenco con quattro valori. Invochiamo il metodo print () per visualizzare il dizionario sul terminale.

L'output che otteniamo eseguendo il codice precedente è allegato qui:


Ora convertiamo questo dizionario Pandas in un frame dati Panda.

Ai fini della generazione di dati da un dizionario, utilizziamo il metodo più semplice. Qui, utilizziamo il costruttore predefinito di Panda per generare un telaio di dati. Viene creato un oggetto Frame dati con il nome "output" e viene assegnato l'output di invocare il PD.Funzione dataframe (). I "dati" dict che abbiamo creato in precedenza vengono passati come parametro al PD.Funzione dataframe (). L'istruzione print () con l'oggetto "output" come argomento esegue per visualizzare il frame dati creato dal dizionario specificato.

Questo ci fornisce i seguenti dati di dati Pandas risultanti:

Esempio 2: utilizzo degli indici definiti dall'utente per generare un telaio da un dizionario

Utilizzando un dizionario con gli indici definiti dall'utente, potremmo costruire un oggetto Panda DataFrame in Python. Questa tecnica inizia generando un dizionario Python, che viene quindi passato contemporaneamente all'elenco degli indici sul PD.Metodo DataFrame (). Il PD.Il metodo DataFrame () alla fine restituisce un oggetto Pandas DataFrame contenente i contenuti del dizionario insieme agli indici dall'elenco indici fornito.

Esploreremo qui come viene utilizzato il codice Python per eseguirlo.

Per creare un telaio di dati da un DICT che utilizza indici definiti dall'utente, dobbiamo prima avere un elenco di dizionari. Da quando abbiamo generato un dizionario nell'esempio precedente, useremo anche lo stesso dizionario in questo caso.

Ora, per aver costruito il telaio di dati da DICT, utilizziamo lo stesso costruttore di dati Panda Data ma con un'altra innovazione in quanto vogliamo che il frame dati venga visualizzato con indici che ci assegniamo invece dei suoi indici predefiniti. Utilizziamo il parametro "indice" all'interno della parentesi con il nome del DICT, separato da una virgola. Assegniamo i valori al parametro "indice" utilizzando l'operatore di assegnazione "=" e inseriamo i valori all'interno delle parentesi. Infine, utilizziamo il metodo Print () per mostrare il risultato del programma.

La seguente immagine mostra il frame dati di output con indici definiti dall'utente “R, X, Y, Z” anziché il metodo di indicizzazione 0.

Esempio 3: generare un telaio di dati da un dizionario con le colonne necessarie

Per la terza istanza, alcune colonne vengono ignorate quando generiamo un frame di dati da un dizionario. Il parametro delle colonne semplifica la realizzazione di questa attività. Come parametro, questo argomento accetta un elenco, gli elementi che sono le colonne specificate. Restituisce il frame dati solo con le colonne selezionate.

Dai un'occhiata al modo per scrivere uno script Python per generare un telaio di dati utilizzando le colonne del dizionario selezionato.

In questo esempio, abbiamo aggiunto un nuovo record al "dati" di DICT precedentemente creato come "rollio" e lo abbiamo assegnato con la stessa lunghezza dei valori che abbiamo usato per gli altri tre record. Ora, collettivamente, abbiamo un detto con 4 record. Quando eseguiamo il metodo Print (), questa volta otteniamo un dizionario con quattro record.

Questo è l'output:

Ora, esploriamo come possiamo costruire un telaio di dati da un dizionario con alcune colonne specificate.

La funzione Pandas DataFrame ci fornisce una "colonna" del parametro per specificare i nomi delle colonne che desideri in particolare nel tuo frame dati. Tra le parentesi graffe del PD.Metodo DataFrame (), abbiamo superato l'argomento "colonne" e assegnato i nomi delle colonne all'interno delle parentesi. Qui, abbiamo scelto due colonne, "nome" e "Institute". L'istruzione Print () è presentata sul terminale come il telaio di dati che contiene solo le colonne precedentemente menzionate.

Abbiamo ottenuto il nostro telaio di dati con due colonne selezionate.

Esempio 4: generare un telaio di dati da un dizionario con un orientamento modificato utilizzando la funzione from_dict ()

Simile al modo precedente, generiamo prima un dizionario di elenchi Python e poi lo passiamo al frame dati.Metodo da_dict (). Alla fine, un oggetto Pandas DataFrame contenente le informazioni sul Dizionario degli elenchi viene restituito dal Frame dati.Metodo da_dict (). Esistono varie alternative quando si utilizzano specificamente la funzione da dict () per costruire un frame di dati da un dizionario. Le chiavi del DICT saranno, per impostazione predefinita, le sue colonne come il solito comportamento. Le chiavi del dizionario sono mostrate come righe quando l'orientamento è "indice."

Qui, vediamo prima le impostazioni predefinite e quindi cambiamo l'orientamento in "indice".

Utilizziamo i "dati" dict. Per generare un telaio di dati dal dizionario, utilizziamo invece il metodo from_dict (). Le chiavi del dizionario sono usate come nomi di colonne per impostazione predefinita quando si utilizza il metodo from_dict (). Le voci dal dizionario sono utilizzate come valori di dati di dati. Quindi, eseguiamo questo metodo con l'impostazione predefinita e lo passiamo il nome dei "dati" DICT. Vediamo l'output tramite la funzione print ().

Quello che segue è il risultato generato dal precedente script di Python:

Ora, per modificare l'orientamento del telaio di dati generato dall'elenco dei dizionari forniti, modifichiamo le impostazioni predefinite della funzione From_dict ().

Quando si fornisce l'argomento Orient = "indice", viene costruito un frame di dati utilizzando i valori dai valori DICT se si preferisce utilizzare le chiavi DICT come righe. Abbiamo quindi aggiunto il parametro "Oriente" per modificare l'orientamento e assegnare il valore "indice". Ciò significa che l'orientamento dei valori dell'indice è alterato dalle colonne a righe.

Questo è l'output di questo programma:

Conclusione

Questa guida spiega la generazione di un telaio di dati da un elenco di dizionari. Abbiamo elaborato tutti i diversi modi e aspetti dell'utilizzo di questo approccio. Con gli esempi pratici, ti abbiamo fatto capire come impiegare la funzione di dati di Panda e la funzione Panda From_dict. L'implementazione dettagliata ti aiuterà a ottenere la migliore esperienza di apprendimento in Python.