Panda di JSON

Panda di JSON

La notazione dell'oggetto JSON o JS è un formato di dati di testo che memorizza i dati di testo come valore chiave. Su Internet, i dati vengono spesso scambiati tramite file JSON. Tra parentesi ricci (), il json è rappresentato. JSON usa virgole per indicare la separazione di ciascuna coppia chiave/valore. I dati JSON ricordano un dizionario Python in apparenza. Tuttavia, i dizionari sono strutture di dati, mentre JSON è un formato di dati. In Pandas, la funzione Read_JSON consente la lettura dei file JSON di Panda DataFrame. Puoi vedere negli esempi seguenti come convertire i file JSON in Pandas DataFrame I file JSON possono essere letti nel telaio di dati di Pandas.

Come leggere i file json in panda?

Usiamo la funzione read_json () per estrarre i file con .JSON Extension passando il percorso del file JSON desiderato all'interno delle parentesi della funzione. Una volta fatto, viene restituito un "data frame" (una tabella con righe e colonne per la memorizzazione dei dati). Possiamo specificare il collegamento alla posizione del file piuttosto che a un percorso locale se vorremmo recuperare un file JSON che viene archiviato su un server remoto. A volte potrebbe essere necessario trasformare un file con un .JSON Extension in Pandas DataFrame. Il metodo Pandas read_json (), che impiega la seguente sintassi, rende semplice raggiungere questo obiettivo.

Sintassi: read_json ('path', orienta = 'indice')

Dove,

sentiero: Posiziona il percorso del file JSON.

Oriente: l'orientamento del file JSON. Il valore predefinito è "indice", ma puoi anche definire "divisione", "record", "colonne" o "valori".

Vediamo come i file con estensioni JSON possono essere letti in un telaio di dati negli esempi seguenti.

Esempio 1: usando la funzione read_json () per leggere un file JSON

Innanzitutto, dobbiamo scaricare un file JSON dal sito Web open source. Possiamo semplicemente scaricare un file con un .Estensione JSON da diversi siti Web. Invece di ottenere un file JSON da Internet, puoi crearne in alternativa uno. Abbiamo scaricato un file 'Iris.JSON 'da un sito Web open source. Per leggere questo file in Pandas, useremo la funzione read_json ().

Abbiamo usato il PD.Metodo read_json () per leggere il file locale (.file json) nella variabile 'df'. Abbiamo superato il percorso del file JSON come stringa alla funzione. Con questo metodo, nei file JSON i dati verranno automaticamente convertiti in dati di dati. Il pacchetto Pandas è stato inizialmente importato come PD. Nella riga finale, esportiamo le dieci righe di esempio dal frame dati. Il metodo read_json () ha preso le 150 righe e 5 colonne di dati dal file di dati IRIS come input.

Usando il DF.Funzione campione (), abbiamo visualizzato solo un campione di 5 righe di dati in questo blocco di output. I dati del Frame Data vengono recuperati in modo casuale dalla funzione Sample (). Un numero definito di righe (casuali) viene restituito con il metodo del campione (). Se non viene specificato un valore, la funzione campione () restituisce 1 riga. Se specifichiamo il parametro orientale della funzione read_json () con valori diversi come "divisione", "colonne", "record" o "valori", l'output può essere leggermente diverso.

Esempio 2: Utilizzo della funzione read_json () per leggere un JSONFILE dalla posizione remota

Un file che si trova su un diverso sistema CICS (sistema di controllo delle informazioni dei clienti). Utilizzando la spedizione della funzione CICS, le richieste per il controllo dei file CICS effettuate contro i file remoti vengono inviate al sistema remoto. Le applicazioni possono essere fatte per accedere ai file anche quando vengono posizionate in una posizione/server sconosciuta. Usando l'URL remoto anziché il percorso del file, possiamo leggere i dati JSON da una posizione remota. Il metodo read_json () può leggere da posizioni diverse da soli file locali. I file JSON conservati su server lontani possono anche essere letti. Possiamo semplicemente fornire la chiamata di funzione con il percorso del file JSON esterno.

Abbiamo usato un'API HTTP accessibile al pubblico che contiene dati in formato JSON. Il metodo read_json () viene anche utilizzato per leggere i dati JSON dall'URL remoto. Questo output contiene un campione di cinque righe di dati JSON utilizzando il metodo read_json (). Questi dati provengono da un URL pubblico e hanno 150 righe e cinque colonne.

Esempio 3: usando PD.Funzione DataFrame () per leggere un file JSON in Pandas DataFrame

Negli esempi precedenti, abbiamo scaricato il file di dati JSON o utilizzato l'URL remoto per leggere i dati. Ora creeremo dati JSON e quindi li convertiremo in un frame di dati utilizzando il PD.Funzione dataframe (). Prima di creare i dati JSON o Pandas, dobbiamo importare i moduli di panda per utilizzare le sue funzioni e funzionalità.

I nostri dati JSON "J_Data" sono creati con due colonne: "Nome" e "Age" con valori ("1": "Brock", "2": "Fin", "3": "John", "4": 'Moris', '5': 'Jack', '6': 'Anna') e ('1': 38, '2': 26, '3': 41, '4': 35, '5': 28, '6': 27) rispettivamente. Ora passeremo i nostri dati JSON all'interno del PD.Funzione dataframe () per leggerlo nel frame dati.

Abbiamo semplicemente superato la funzione "J_Data" all'interno della funzione DataFrame () per convertire i dati JSON in Pandas DataFrame.

Esempio 4: usando PD.Funzione DataFrame () per leggere un JSON Strutture nidificato in Pandas DataFrame

Creeremo i dati JSON utilizzando dizionari nidificati, in questo esempio. In Python, puoi utilizzare dizionari nidificati per creare dati JSON. C'è una colonna o una variabile nel file JSON per ogni elemento nel dizionario esterno. La chiave di ogni elemento è l'intestazione della colonna e i suoi dati sono un altro dizionario costituito dalle righe in quella colonna specifica. Creeremo un dizionario che useremo per creare un file JSON con dettagli su alcuni casuali.

Abbiamo creato i nostri dati JSON nidificati. Le chiavi dei dizionari sono specificate come "nome", "id", "corso" e "età". Ora useremo il PD.Funzione DataFrame () per convertire il dizionario nidificato in Pandas DataFrame.

Il nostro dizionario nidificato di dati JSON viene convertito con successo in un telaio di dati.

Esempio 5: Utilizzo della funzione JSON_NORMALIZIONE () per leggere una struttura JSON nidificata in Pandas DataFrame

Per la lettura di stringhe JSON nidificate e la restituzione di un telaio di dati, la funzione "JSON_NORMALIZZA ()" è comunemente usata. Il json.La funzione Loads () dal pacchetto Python JSON deve essere prima utilizzata per la lettura della stringa JSON prima di utilizzare il metodo JSON_NORMALIZZA (). La funzione JSON_NORMALIZZA () riceverà quindi questo oggetto JSON e restituirà i dati richiesti sotto forma di un telaio di dati.

Insieme ai panda, abbiamo anche importato i moduli JSON e JSON_Normalizza per utilizzare le funzioni e le funzionalità fornite da loro. Abbiamo usato il JSON.carichi () per leggere le corde JSON. Un oggetto file viene passato a JSON.load (), che restituisce un oggetto JSON. Viene utilizzato per leggere i dati che sono stati codificati da JSON da un file, trasformarli in un dizionario Python e quindi deserializzare il file originale. I dati richiesti sono stati contenuti dal tasto "Rec" che viene quindi passato nella funzione JSON_NORMILIZIONE () per appiattire i dati in Pandas DataFrame.

Conclusione

In questo tutorial, abbiamo discusso dei file di dati JSON e di come possiamo leggerli utilizzando la funzione read_json (). Abbiamo visto la sintassi del metodo read_json () per capire come funziona. Abbiamo implementato alcuni esempi in questo articolo per insegnarti come leggere un file JSON da una posizione locale e remota usando la funzione read_json () e come leggere o convertire il file JSON e la struttura JSON nidificata in Panda DataFrame usando il PD.DataFrame () e JSON_Normalize ().