Panda DataFrame query

Panda DataFrame query
Il pacchetto Python lo rende un'ottima lingua per condurre l'analisi dei dati. Uno dei programmi che consentono l'acquisizione e l'analisi dei dati considerevolmente più semplici è Panda. Abbiamo un telaio di dati e filtriamo i dati in base alle nostre esigenze da questo telaio di dati in Panda. L'analisi dei dati richiede numerose tecniche di filtraggio. Esistono numerosi modi per filtrare i dati dal telaio di dati specificato utilizzando i metodi Pandas. Uno di questi è il metodo "query ()" che ci aiuta a filtrare alcuni dati dal frame dati. Possiamo interrogare il frame dati utilizzando la funzione "query ()" in panda. Un'espressione di query viene passata alla funzione "query ()" e restituisce il risultato dalla dichiarazione di query restituita. Utilizzeremo il metodo "Query ()" in questa guida e spiegheremo come aiuta a Panda a filtrare i dati desiderati dal Frame Data.

Sintassi:

DataFrame.query (expr, inplace = false, ** kwargs)

Qui, mettiamo la condizione come primo parametro del metodo "query ()". L'inplace è facoltativo. Se non lo aggiungiamo, il suo valore predefinito è "falso" che viene regolato automaticamente. Possiamo anche impostarlo su "true" che aggiorna il frame dati.

Ora ci spostiamo per utilizzare il metodo "query ()" in Panda in questa guida e lo spiegheremo qui.

Esempio 1:

DEMONSTARTE il metodo "Query ()" in Pandas in questa guida. Usiamo l'app "Spyder" per scrivere il codice Pandas. Siamo consapevoli che dobbiamo importare alcuni metodi Panda come "PD". Sviluppiamo "List_data" e posizioniamo il "P_Name" e "P_AGE" in "List_Data". Il "P_name" contiene "Smith, Oscar, Mary, Theo, Teddy e John". Il "p_age" contiene "50, 33, 56, 29, 45 e 30". Modifichiamo l'elenco nidificato "List_data" nel frame dati "my_df". Lo cambiamo nel frame dati perché dobbiamo applicare il metodo "query ()" al frame dati. Quindi, questo "my_df" è stato creato qui che viene visualizzato anche poiché lo inseriamo nella seguente funzione "print ()".

Ora utilizziamo il metodo "query ()" per estrarre alcuni dati. Riceviamo i dati la cui età è maggiore di 30. Per questo, aggiungiamo la condizione nel metodo "query ()" e utilizziamo questo metodo all'interno della stampa. Il risultato rende anche per noi. Ora filtra quei dati la cui età è superiore a 30 e li visualizza sull'output.

Esistono due metodi per eseguire il codice desiderato mentre compiliamo e lo eseguiamo in "Spyder". Uno tra questi è premere "Shift+Enter". L'altro metodo è utilizzare l'icona "Esegui" dell'app "Spyder" per eseguire il codice. Otteniamo l'output specificato in caso di esecuzione. Innanzitutto, il frame dati completo è reso. Quindi, filtriamo i dati da questo telaio di dati la cui età è maggiore di 30. I dati filtrati sono anche mostrati di seguito. Filtriamo questi dati semplicemente utilizzando il metodo "Query ()" in Panda.

Esempio 2:

Creiamo un elenco nidificato "Player_Data" e aggiungiamo una colonna "Player_Name" in cui abbiamo "Emma, ​​Samuel, Robert, Smith, Noah, Jessica e Harper". Successivamente, aggiungiamo la colonna "Player_age" che ha "22, 26, 21, 25, 29, 24 e 28". Quindi, arriva la colonna "punteggio_1" che contiene "29, 28, 16, 17, 35, 20 e 15". La colonna "Score_2" contiene "28, 45, 49, 62, 70, 55 e 40". Il "punteggio_3" contiene "24, 13, 59, 62, 72, 64 e 66". E l'ultimo che abbiamo è la colonna "SCOPE_4" che ha "38, 44, 69, 72, 81, 71 e 79". Questo elenco "Player_Data" viene trasformato in dati utilizzando il metodo Pandas. Nominiamo questo telaio di dati come "Player_Df".

Mentre aggiungiamo la funzione "Player_Df" alla seguente funzione "Print ()" e visualizzarla. Ora, includiamo la condizione nella funzione "query ()" e utilizziamo questo metodo all'interno del metodo Print () per acquisire i dati il ​​cui "punteggio_1" è più di 20. Lo mettiamo in "stampa" che rende anche il risultato per noi. I dati il ​​cui "punteggio_1" è più di 20 sono ora filtrati e visualizzati sulla console.

Come puoi vedere, ci sono solo tre righe in cui il "punteggio_1" è maggiore di 20. Quindi, questo metodo "query ()" rende questi dati sullo schermo dopo aver visualizzato il frame dati completo.

Esempio 3:

Viene creato il "frutto_data". Vengono aggiunti il ​​"Fruit_name" e "Fruit_Quantity". "Apple, Orange, Mango, Apple, Banana, Apple, Lychee e Apple" sono elencati in "Fruits_name". Le loro quantità che sono "5 kg, 7 kg, 2 kg, 4 kg, 5 kg, 7 kg, 2 kg e 4 kg" sono elencate in "Fruits_Quantity". Trasformiamo l'elenco nidificato "FRUITS_DATA" nel frame dati "FRUITS_DF."Questo" Fruits_DF "è formato qui e viene visualizzato anche poiché lo inseriamo nella seguente funzione" Print () ". Ora filtriamo alcuni dati utilizzando la tecnica "query ()". Vogliamo filtrare la "Apple" da questo frame dati, quindi mettiamo la condizione in cui il "Fruits_name" è uguale a "Apple". Visualizziamo anche le "mele" sul terminale.

In questo risultato, dopo aver reso l'intero telaio di dati, le righe che contengono "Apple" vengono filtrate. I dati filtrati vengono anche visualizzati nella seguente illustrazione. Usiamo il metodo Pandas query () per filtrare questi dati.

Esempio 4:

Sviluppiamo l'elenco nidificato "Result_9th" dopo l'importazione del metodo Pandas. Aggiungiamo una colonna "Nome" alla nostra lista nidificata "Result_9th" e la riempiamo di "Samuel, George, James, Melissa, William, Farnham e Smith". La colonna "subj1" contiene i valori "47, 30, 54, 71, 68, 16 e AB". Il "subj2" viene quindi aggiunto con i seguenti valori: "81, 23, 48, 34, 21, 15 e AB". La colonna "subj3" contain i seguenti valori: "29, 14, 28, 55, 29, 27 e AB". La colonna "subj4" contiene i seguenti valori: "59, 27, 58, 75, 59, 17 e AB". Il "subj5" contiene i seguenti valori: "90, 4, 82, 85, 95, 22 e AB". Quindi, aggiungiamo anche la colonna "Pass/Fail" che contiene lo stato "Pass" e "Fail" degli studenti.

Usiamo la tecnica Pandas qui per convertire questo elenco "Result_9th" in un frame dati che abbiamo chiamato "Result_9th_df ". Il "risultato_9th_df "è reso a seguito della nostra aggiunta al seguente metodo" Print () ". Ora filtriamo i dati dello studente il cui nome è "James". Mettiamo quel nome come condizione del metodo "query ()". Posizioniamo il nome della colonna "nome" e lo uguale a "James". Quindi, archiviamo i dati dello studente "James" nel "DF2". Quindi, posizioniamo questo "DF2" nella "stampa" per visualizzare i dati di "James".

Il primo frame dati contiene il risultato di 7 studenti che aggiungiamo al frame dati. Estraiamo i dati "James" da questo telaio di dati. In questo modo, possiamo facilmente estrarre o filtrare i dati che vogliamo ottenere dal frame dati in Panda.

Conclusione

Questa guida è qui per esplorare il metodo "query ()" in panda. Abbiamo dimostrato diversi esempi in questa guida e spiegato in dettaglio ciascuno di essi per fornirti una corretta comprensione del metodo "query ()". Abbiamo discusso dell'utilizzo del metodo "query ()" per filtrare i dati specifici dal frame dati. A tuo vantaggio, ogni esempio in questa guida e la sintassi di questo metodo "query ()" sono accuratamente presentati qui. Dovresti essere in grado di imparare questo concetto "query ()" in Panda con l'aiuto di questa guida.