Pandas Str contiene

Pandas Str contiene
“Questo articolo ti insegnerà come Python può essere usato per determinare se una parte particolare della stringa è inclusa o meno nel valore della stringa. Python ha una varietà di metodi per trovare una sottostringa all'interno di una stringa, come il controllo di modelli, insensibilità al caso e altro ancora. Qualsiasi livello di programmatore dovrebbe essere in grado di affrontare le stringhe in Python."

Dopo aver finito questo tutorial, saprai:

  • Metodi e operatori Python per determinare se una stringa comprende una sottostringa o meno.
  • Filtrando il telaio dati quando una sottostringa è presente in una colonna
  • Usando Regex, determinare se una stringa include una sottostringa.

Come scoprire se esiste una sottostringa o un'espressione nel valore della stringa nei panda?

Per determinare se una stringa è costituita da una sottostringa particolare o meno, ci sono diverse funzioni che possiamo fare per farlo.

Esempio n. 1: verificare se la sottostringa specificata è inclusa nei dati di stringa utilizzando l'operatore In

In Python, l'operatore in può essere utilizzato con tipi iterabili come elenchi e stringhe. È usato per determinare se un elemento è presente nell'iterabile o no. Un elemento trovato è indicato dall'operatore in restituzione vera. In caso contrario, restituisce falso. L'operatore In è l'approccio più rapido e pitonico per determinare se una stringa include una sottostringa in Python. L'operatore rende chiaro per ogni lettore del tuo codice ciò che stai cercando di realizzare.


La serie Pandas è stata creata usando il PD.Funzione serie () dopo l'importazione del modulo Pandas. La nostra serie è composta da valori di stringa "pavimento", "nostro", "annulla", "sicuri", "tour", "negozio", "aledro" e "malvagio". Ora utilizzeremo l'operatore In per scoprire se la sottostringa specificata esiste nei valori di stringa della serie Pandas. Per iterating su ciascun valore della serie Pandas, verrà utilizzato il loop "per", come mostrato nello script seguente.

Usando l'operatore In, abbiamo ottenuto i risultati sotto forma di vero e falso. "Vero" indica la presenza di una sottostringa per i valori della stringa e "falso" indica l'assenza di una sottostringa. Possiamo anche utilizzare l'operatore In Elenco Pandas e le colonne di dati contenenti valori di stringa. Proviamo l'operatore in una colonna di dati. Per creare il frame dati, useremo il PDAS PD.Funzione dataframe ().

Innanzitutto, abbiamo creato un "DIC" di Python Dizionario composto da coppie di valore chiave. Quindi abbiamo superato il dizionario "DIC" all'interno del PD.DataFrame (). Abbiamo creato il nostro frame dati con tre colonne, i.e., id, nome e corso. Miriamo a scoprire se esistono o meno substrings nella colonna String, quindi ci concentreremo solo sulle colonne delle stringhe. Ci sono due colonne di stringa nel nostro frame dati "Nome" e "Colonna" con i valori delle stringhe ("Davidson", "HenDery", "Henderson", "Jason", "Kim", "Jenson", "Jackson", "Carl ") E (" Python "," Amazon "," Economics "," Business "," Languages ​​"," Database "," Designing "," Drawing ") rispettivamente.

Abbiamo specificato la colonna "nome", che è iterate da loop per verificare se il "figlio" di sottostringa è presente nei valori stringa del nome della colonna o no. La funzione genera il risultato controllando ciascun valore all'interno della colonna.

Esempio n. 2: filtrare una stringa se la sottostringa è presente

L'operatore in verrà utilizzato per filtrare l'elenco, la serie o il telaio di dati estraendo i valori della stringa se la sottostringa è presente. Per raggiungere questo obiettivo, iterizzeremo attraverso ogni oggetto dell'oggetto usando un iteratore per loop per vedere se è presente una sottostringa. Se gli elementi dell'elenco sono costituiti dalla sottostringa, le stringhe verranno aggiunte a un altro elenco. Lasciate prima creare un oggetto elenco

Innanzitutto, abbiamo creato un elenco contenente gli elementi come valori di stringa "banana", "mela", "natura", "analizza", "pesce", "nome", "camicia", "analogico". Quindi viene creato un elenco vuoto "filtrato" per archiviare i valori risultanti. Abbiamo usato l'operatore In per determinare la presenza dei sottostringi. La funzione di append viene utilizzata per aggiungere le stringhe di output (in cui era presente la sottostringa) nella stringa vuota "filtrata". Abbiamo quattro valori, io.e., "Banana", "Analyze", "Name", "Analogue" che contengono la sottostringa "NA". Ora lascia che lo provi con una colonna di dati. Utilizzeremo il frame dati che abbiamo creato nell'esempio n. 1.

Questa volta verificheremo la colonna del corso.

Abbiamo specificato la colonna del corso da essere iterate da per loop per verificare se la sottostringa "ON" è inclusa nella colonna del corso del frame dati. I valori in cui esiste la sottostringa sono aggiunti a un elenco vuoto "filtrato" che abbiamo stampato come output.

La serie.La funzione STR "può ottenere i valori della serie come stringhe ed eseguire varie operazioni. Per verificare se un modello o un regex è presente all'interno di un indice o di una stringa di serie, possiamo usare la "serie.str.contiene () "funzione nei panda. A seconda che un modello specificato o regex sia presente in una serie o valore di stringa indice, il metodo restituisce un indice o una serie booleano.

Sintassi: Serie.str.contiene (pat, case = true, flags = 0, na = nan, regex = true)

Dove,

colpetto: Espressione regolare o sequenza di caratteri.

caso: Case sensibile se impostato su True.

Flag: Flag da passare attraverso il modulo RE, ad esempio, re.Ignorecase.

n / a: Per riempire i valori mancanti o null.

Regex: La PAT è considerata un'espressione regolare se vera.

Esempio # 4: Usa la serie.str.contiene () funzione per determinare se la sottostringa è presente nei dati

Innanzitutto, creeremo un elenco con valori stringa. Insieme ai panda, importeremo anche i re-moduli. Il re-modulo offre una serie di funzionalità di espressione regolari efficienti che consentono di determinare facilmente se una stringa fornita corrisponde o contiene un modello particolare usando il metodo Match e usando il metodo di ricerca, rispettivamente.

Abbiamo creato un elenco con PD.Series () funzione con i valori stringa "team_a", "team_ab", "team_b", "team_alpha", "team_ace", "team_stars" e "team_c". Abbiamo anche specificato un indice per la nostra serie "SR" come "Team 1", "Team 2", "Team 3", "Team 4", "Team 5", "Team 6" e "Team 7". Ora, usiamo la serie.str.contiene () funzione da trovare se la sottostringa è presente nei valori stringa dell'elenco.

All'interno della str.contiene () funzione, abbiamo specificato il parametro PAT come "team_a" per verificare se la sottostringa "team_a" è inclusa nei valori stringa dell'elenco. L'output mostra che una serie contenente valori booleani viene restituito dalla serie.str.contiene () funzione. Laddove il modello fornito si trova nella stringa, è vero; Altrimenti, False viene restituito.

Esempio # 5: Usa la serie.str.contiene () funzione per determinare se il modello è presente nei dati

Ora verificheremo se il modello specificato esiste nei dati di stringa dell'oggetto serie sottostante. Creiamo una stringa contenente valori di stringa.

Abbiamo creato una serie con i valori "Mickey", "Rickon", "Alex", "Nick", "ROV", "Tim" e "Danny". Per determinare se uno schema è incluso nei dati di stringa dell'oggetto serie, ora useremo la "serie.str.contiene () "funzione.

Abbiamo specificato Path = "I [A-Z]" per scoprire se c'è un valore di stringa nella serie "S" con la lettera "I" seguita da qualsiasi alfabeto minuscolo.

Conclusione

In questo tutorial, abbiamo cercato di insegnare come determinare se una stringa include una sottostringa in Panda. Questo può essere fatto usando diversi metodi, ma ne abbiamo discussi alcuni negli esempi. Abbiamo implementato esempi per insegnarti come determinare se la stringa contiene la sottostringa specificata utilizzando l'operatore in, filtrare una stringa se la sottostringa è presente in una serie o un telaio di dati e utilizzare la STR.contiene () funzione per determinare se la sottostringo o l'espressione è presente nei dati.