Panda DataFrame Seleziona righe per condizione

Dante Palumbo

"In" Python ", abbiamo una biblioteca Open_source che è la biblioteca" Panda ". In "Panda", possiamo svolgere più attività in modo semplice ed efficiente. Come sappiamo che possiamo creare frame dati in "panda" utilizzando i metodi "panda". Quindi, dopo aver creato i dati dei dati, possiamo selezionare le righe applicando le condizioni. Possiamo utilizzare metodi diversi che i "panda" forniscono per la selezione delle righe del telaio di dati a seconda della condizione che abbiamo aggiunto nei metodi "panda". Discuteremo tutti i metodi che possiamo utilizzare per la selezione delle righe nel frame dati in "Panda", in questa guida."

Metodi per la selezione delle righe del telaio dati per condizione

I "panda" forniscono quattro metodi diversi per la selezione delle righe del telaio di dati per condizione. Questi metodi sono qui:

DataFrame.Metodo query ().
DataFrame.Metodo loc ().
DataFrame.Metodo isin ().
DataFrame.Metodo Filtro ().
DataFarm.metodo iloc ().
DataFrame.Metodo Applica ().

Tutti questi metodi sono utilizzati in "Panda" per la selezione delle righe del telaio di dati "Panda". Mettiamo anche la condizione in questi metodi e selezionano le righe a seconda di quella condizione. Utilizzeremo questi metodi e selezioneremo le righe in questa guida e spiegheremo ogni codice qui in dettaglio.

Esempio # 01
Lo strumento che utilizzeremo in questa guida per lo sviluppo del codice "Panda" è lo strumento "Spyder". Generiamo il codice "Panda" importando i moduli di "Panda" e quindi sviluppiamo un elenco chiamato "Matric_Class" che ha "nome" che contiene nomi degli studenti come "Peter, George, Bromley, Samuel, Leo , Farnham e Lily ".

Dopo questo, stiamo aggiungendo alcuni segni di questi studenti in diverse materie e queste materie sono "inglese, computer, fisica, chimica e biologia". In "Inglese", abbiamo aggiunto "46, 32, 54, 71, 68, 31 e 54", in "Computer", abbiamo aggiunto "82, 23, 48, 34, 32, 15 e 33", quindi arriva la "fisica", in cui abbiamo aggiunto "29, 31, 27, 55, 29, 20 e 32", allora è lì "chimica" che contiene "59, 32, 57, 85, 59, 55 e 81 ", La" biologia "è il prossimo in cui i marchi sono" 90, 31, 84, 95, 98, 72 e 77 ". Questo è l'elenco nidificato "Matric_Class".

Ora, dobbiamo convertire questo elenco nidificato in dati di dati, quindi a questo scopo abbiamo usato il metodo "Panda", che è mostrato anche di seguito "PD.DataFrame ". Questo metodo modifica l'elenco "Matric_class" in DataFrame chiamato "Matric_Class_DF". Questo "matric_class_df" viene quindi inserito nel metodo "print ()". Qui, il frame dati è completato e anche reso.

Ora, dobbiamo eseguire questo codice. Quindi, mentre stiamo lavorando allo strumento "Spyder", ecco perché premiamo l'icona "Esegui" di questo strumento per l'esecuzione; Dopo questo, viene reso il seguente risultato in cui viene reso il telaio dati. Ora selezioneremo alcune righe da questo telaio di dati utilizzando il metodo "panda" a seconda di alcune condizioni, che aggiungeremo il metodo "panda".

Qui, stiamo filtrando alcune righe mettendo il nome di dati e la condizione che abbiamo aggiunto in questo metodo è che il "nome" è uguale a "Bromley", quindi sarà la riga in cui il nome dello studente è "Bromley" e memorizzare la riga "Bromley" in "result_df". Il risultato di "Bromley" è ora reso sullo schermo mettendolo in "Print ()".

La riga completa è mostrata qui, che contiene i dati di "Bromley". Abbiamo filtrato questa riga dal telaio dati mettendo la condizione nel metodo "Panda".

Esempio # 02
Stiamo usando di nuovo "Matric_class_df", e qui stiamo selezionando righe diverse da "Bromley". Quindi, la condizione che abbiamo messo qui è che il "nome" dello studente non è uguale a "Bromley". Selezionerà o filtrerà tutte le righe in cui il nome dello studente non è "Bromley" e rende anche tutte le righe tranne la riga che contiene il nome "Bromley" nella colonna "Nome".

Qui, seleziona tutte le righe dal frame dati originale tranne la riga di 2 indici perché, in questa riga, la colonna "Nome" contiene "Bromley". Quindi, ignora quella riga e seleziona tutte le altre righe del telaio di dati e le rende qui.

Esempio # 03
Ora stiamo creando un nuovo elenco per il nuovo esempio qui in cui l'elenco creato è "ABC_LIST". Nella colonna "Nome", aggiungiamo "James, Milli, Farnham, Lily, Leo, Samuel e Fuller". Successivamente, abbiamo i "codici", in cui inseriamo "ABC19, ABC34, ABC39, ABC45, ABC59, ABC62 e ABC15". Poi arriva il "mese", che contiene "luglio, aprile, luglio, agosto, settembre, luglio e ottobre". Le "unità" hanno "19, 14, 9, 16, 15, 10 e 13". Questo elenco viene convertito in dati e quindi il frame dati viene reso.

Dopo questo, utilizziamo il "dati di dati.Metodo query () "per selezionare alcune righe. Mettiamo la condizione che è "Mese == luglio", il che significa che seleziona tutte quelle righe in cui il "mese" è "luglio". Quelle righe vengono salvate in "ABC_DF2", e quindi mostriamo quelle righe che contengono il mese "luglio" utilizzando "Print ()"

Il frame dati originale contiene 7 righe e selezioniamo quelle righe in cui il mese è "luglio", quindi in questo frame dati sono presenti solo tre righe, che contiene "luglio" e queste tre righe sono anche rese separatamente dopo il telaio dati originale.

Esempio # 04
Il telaio di dati creato in questo esempio è chiamato "paziente", contenente "nome, città, seduta_no e tassa/seduta". I nomi dei pazienti sono nel "nome", che sono "James, Noah, Peter, Bromley e Samuel". Le città di quei pazienti sono inserite in "Città", che sono "New York, Birmingham, New York, Los Angeles e Banglore". Quindi abbiamo messo il numero di sedute in "sedutes_no", che sono "2, 6, 4, 4 e 3". Inseriamo anche la tassa per seduta di quei pazienti, che sono "6000, 6000, 6900, 7400 e 6300".

Dopo questo, l'elenco "paziente" viene anche cambiato in "Patient_DF", che è il telaio di dati qui. Quindi stampiamo "paziente_df" e dopo la stampa, ci stiamo muovendo per utilizzare il metodo "LOC" qui, che ci aiuta a selezionare le righe. La condizione che abbiamo impostato qui è che seleziona quelle righe in cui il "seduto" del paziente è "4" e mostra anche quelle file sul terminale.

Nel frame dati ci sono solo due righe in cui il "sedings_no" del paziente è "4" e puoi anche notare queste righe nell'output di seguito.

Esempio # 05
Ora, forniamo un altro esempio qui e creiamo direttamente il frame dati "Teacher_df" qui in cui le colonne che abbiamo aggiunto sono "Exam_Code, Examiner_Name, Examiner_Duty_num, Exam_room_no e Exam_Block". Inseriamo anche i dati in tutte le colonne nello stesso modo in cui abbiamo spiegato nei nostri codici precedenti. Quindi rendiamo anche "insegnante_df", qui stiamo filtrando le righe usando il metodo "isin ()". Inizializziamo una variabile "dati" con "A e C" e quindi posizioniamo il metodo "dati" nel metodo "isin ()" e inserisce anche il nome della colonna in cui controlla questi valori di dati. Il nome della colonna è "Exam_block" qui, quindi controllerà la colonna "Exam_Block" e selezionerà quelle righe in cui "Exam_Block" è "A" o "C" e quindi stampano quelle righe in cui questa condizione è soddisfatta.

Questo metodo "isin ()" seleziona tutte le colonne in cui "Exam_block" è "A" o "C". In questo frame dati, compaiono solo cinque righe che soddisfano questa condizione, e queste vengono visualizzate anche qui.

Conclusione

Questa guida presenta il concetto di "selezione delle righe dei telai di dati in base alla condizione nei panda". Abbiamo discusso diversi metodi che vengono utilizzati per selezionare le righe in panda a seconda di alcune condizioni. Abbiamo utilizzato quattro metodi nei nostri codici qui e abbiamo anche spiegato ciascuno di essi in dettaglio. Abbiamo mostrato come mettiamo la condizione in questi metodi e come questi metodi restituiscono o selezionano le righe del frame dati. Abbiamo discusso che quando mettiamo la condizione in qualsiasi metodo che abbiamo spiegato qui per selezionare le righe, quindi controlla tale condizione e seleziona tali righe dal telaio di dati, che soddisfa la condizione data. Abbiamo visualizzato l'output insieme allo script del codice in questa guida.

Pitone

Python non tutti gli argomenti convertiti durante la formattazione della stringa

Questo errore può essere risolto correggendo la sintassi dell'operatore %, utilizzando la funzione f...

Dr. Ursula Marini

OS Windows

Cos'è Windows Package Manager

Windows Package Manager o Winget è uno strumento potente per l'installazione e la gestione dei pacch...

Dante Palumbo

Pitone

Python Chmod

Il sistema operativo.La funzione chmod () del modulo OS viene utilizzata per modificare la proprietà...

Dr. Evita Damico