Filtro serie Pandas

Filtro serie Pandas

Una serie Pandas è un array unidimensionale con etichette e valori indici. Possiamo filtrare una serie Pandas per condizioni specifiche quando necessario. Per filtrare la serie, impiegheremo due tecniche che sono “serie.filtro () "e" serie.loc [] ".

La sintassi per “serie.Il metodo Filter () "è:

Per utilizzare la proprietà "loc []", la sintassi fornita di seguito deve essere seguita:

Esempio n. 1: utilizzo del metodo Filter () per filtrare una serie Pandas

In questa illustrazione, impiegheremo la serie Pandas.Metodo Filter () ”per filtrare una serie Pandas.

Lo strumento Spyder viene lanciato per creare codici di esempio. Il requisito fondamentale per costruire il programma è il caricamento delle biblioteche richieste. In questo caso, abbiamo solo bisogno di un singolo pacchetto definito "panda". Per introdurre questa libreria nel nostro file Python, abbiamo utilizzato uno script a linea "Importa panda come PD". Questo script ha due parti: la "importazione panda" si caricherà nel toolkit di Pandas nel nostro file di programma e nella parte "As PD" dello script fatto "PD" da utilizzare come alias di "Panda" nel programma Python.

La riga successiva ha invocato il "PD.Serie () "Metodo. Il "PD" si riferisce ai panda mentre la "serie" si riferisce all'inizializzazione della procedura di costruzione della serie. Abbiamo utilizzato questo metodo e specificato alcuni valori interi in esso per creare una serie con questi valori. I valori che abbiamo fornito sono "23", "34", "56", "39", "78", "61", "36", "92", "54" e "11". Abbiamo inserito 10 valori nel "PD.Serie () "Metodo.

Oltre a specificare l'array di valori, abbiamo usato il "nome". L'argomento "Nome" imposta l'etichetta per questo array di valori. Quindi, abbiamo specificato un'etichetta per questo come "numeri interi". Il "ps.La funzione serie () "costruirà una serie ma non sarà in grado di mantenere questa serie. La prossima volta che invochiamo questo metodo nel programma particolare, perderà la serie precedentemente creata. Per ottenere questa serie attualmente generata, viene creato e chiamato "Informazioni" e assegnato il risultato generato dall'esercizio del "PD.Serie () "Metodo. La nostra serie verrà archiviata nell'oggetto della serie "Info" ed è possibile accedere successivamente menzionando questo nome oggetto ovunque nel programma.

La serie verrà generata con i valori specificati e l'elenco dell'indice predefinito. Ma non vogliamo utilizzare l'elenco sequenziale predefinito. Invece, dobbiamo posizionare un elenco di indici definito dall'utente. Per questo, abbiamo creato una variabile "uccelli" e la inizializzata con questi valori "piccione", "pappagallo", "passerow", "pea_cock", "corvo", "gufo", "king_fisher", "cigno", " Colomba "e" Wood_pecker ". Il numero di valori deve essere uguale al conteggio dei valori per la serie che è 10 perché questi valori verranno impostati come elenco di indici.

Per convertire questo elenco di valori nell'elenco degli indici, abbiamo utilizzato la "serie.Proprietà indice ". Qui, il nome della nostra serie è "Info" menzionato con ".Proprietà indice ". Quindi, assegnato ad esso i valori che sta trattenendo la variabile "uccelli". La proprietà "indice" prenderà i valori e li imposterà come elenco di indici per la serie al posto di un elenco sequenziale dell'indice. Abbiamo realizzato una serie, un nome di set e un elenco di indici. Ora, vogliamo vederlo sulla finestra di output. Questo può essere fatto impiegando la funzione Python "Print ()". Abbiamo fornito la nostra serie "Info" come input per stampare il suo contenuto.

Basta premere i tasti "Shift+Enter" per eseguire il programma. Ciò visualizzerà la serie di output con i valori forniti e l'elenco indice specificato sulla console Python.

Ora filtriamo questa serie utilizzando la "serie.funzione filtro () ". Tra le parentesi del metodo, definiremo un elenco di valori da filtrare dalla serie.

La serie.il metodo filtro () ”viene invocato. Dobbiamo fornire il nostro nome in serie al posto della parola "serie". L'abbiamo scritto come "Informazioni.filtro()". Abbiamo applicato il metodo alla serie. Supponiamo che vogliamo cercare un elenco di etichette di indice in modo da identificare quelle etichette di indice in questa funzione. Per identificare le etichette dell'indice, abbiamo usato l'argomento "elementi". Questo parametro "elemento" richiederà i valori da filtrare dalla serie. Gli abbiamo assegnato due etichette di indice "Crow" e "Swan". Dalla serie "Info" cercherà queste due etichette indici e, se trovato, le estraggerà con i loro valori corrispondenti. Quindi, per archiviare l'output filtrato, abbiamo la variabile "alfa". La funzione "Print ()" visualizzerà il risultato sul terminale.

Nell'immagine allegata di seguito, possiamo vedere che sono stati messi in vista due record che possedevano le etichette di indice specificate.

Ora useremo lo stesso metodo per filtrare le etichette dell'indice con un'espressione regolare specifica.

Per questo, abbiamo invocato la "serie.Metodo filtro () ". E all'interno delle sue parentesi graffe, viene utilizzato il parametro "regex". Ciò richiederà un'espressione per filtrare le etichette dell'indice contenente. L'espressione che abbiamo specificato per la ricerca è "_" (sottolineatura) per scoprire le etichette dell'indice che hanno questa espressione in essi. Il risultato verrà archiviato nella variabile "beta" ed esposto con il metodo "print ()".

La serie filtrata mostra tre record le cui etichette indicizzate avevano l'espressione "_".

Esempio n. 2: utilizzando la proprietà LOC () per filtrare una serie Pandas

Un altro metodo per filtrare una serie Pandas per valore è la "serie.Loc [] "Proprietà. Specificheremo una condizione all'interno della "serie.proprietà loc [] "per estrarre il record che specifica la condizione definita.

Abbiamo prima importato la biblioteca Pandas e poi impiegato il "PD. Serie () "per generare una serie con questi valori" 1 "," 25 "," 93 "," 44 "," 51 "," 6 "," 72 "," 18 "," 99 "," 12 "," 64 "," 44 "," 16 "," 77 "," 19 "," 44 "e" 22 ". La serie risultante è memorizzata nell'oggetto della serie "Y". Per presentarlo sullo schermo, abbiamo passato questo oggetto al metodo "Print ()".

Questo ci produce la seguente serie come output:

Abbiamo invocato la "serie.proprietà loc [] "e specificato una condizione al suo interno usando la funzione" lambda ". La condizione che abbiamo definito è per ogni valore della serie per verificare se il valore è uguale a "44". Quindi, memorizza il risultato generato nella variabile "cond" e presentalo usando la funzione "print ()".

Il risultato mostra 3 record all'indice "3", "11" e "15" che hanno un valore pari a 44.

Per la dimostrazione, applicheremo una condizione "o" con la proprietà "loc []".

Tra le parentesi della proprietà ".loc [] ", abbiamo usato la funzione" lambda "per specificare la condizione che indica per estrarre valori inferiori a 30. O i valori che sono superiori a 50, dove "x" è un valore nella serie "y". La variabile "z" manterrà l'output.

Ecco l'output reso nell'istantanea seguente che mostra solo quei valori che soddisfacevano la condizione definita.

Conclusione

In questo articolo, abbiamo elaborato il concetto di filtraggio di una serie Pandas con condizioni particolari. Abbiamo spiegato due metodi per farlo: “Serie.filtro () "e" serie.Loc [] "Proprietà. La prima illustrazione ha spiegato la "serie.FUNZIONE FILTER () "per filtrare le etichette dell'indice in una serie Pandas fornendo l'elenco delle etichette degli indici e anche utilizzando l'espressione regolare presente nelle etichette dell'indice. Il 2nd L'istanza ha lavorato sull'uso della "serie.Loc [] "Proprietà ai valori di ricerca nella serie che soddisfano la condizione particolare.