Questo articolo illustrerà come ottenere tutte le righe in un telaio di dati Panda che contiene una determinata sottostringa.
Esempio di dati dati
In questo esempio, utilizzeremo un telaio di dati fornito nel link seguente:
1 | Set di dati di film.CSV |
Una volta scaricato, caricare il frame dati come mostrato;
1 | df = pd.read_csv ('film.CSV ') |
Controlla se la colonna contiene
Identifichiamo le righe che contengono una sottostringa specifica. Per questo, useremo la funzione contiene () nei panda.
Ad esempio, per verificare se qualsiasi titolo contiene la stringa "Capitano" nel Frame dati fornito, possiamo fare quanto segue:
1 | Stampa (df ['title'].str.contiene ("Capitano")) |
Il codice sopra deve verificare se tutte le righe contengono la sottostringa specificata e restituire i valori booleani corrispondenti.
Per le righe corrispondenti, la funzione dovrebbe restituire vera e falsa se altrimenti.
Recuperare le file che corrispondono.
Sebbene l'esempio sopra funzioni, non restituisce la riga e i suoi valori. Possiamo espanderci utilizzando i loro valori come indici per il frame dati.
Un esempio è come mostrato:
1 | Stampa (DF [DF ['Titolo'].str.contiene ("capitano")]) |
La funzione dovrebbe restituire le righe corrispondenti e i loro valori corrispondenti in questo caso.
Controlla più condizioni.
Possiamo filtrare ulteriormente i risultati controllando se le righe contengono "Capitano" e "America.'
Prendi il codice di esempio mostrato di seguito:
1 2 | new_df = df [df ['title'].str.contiene ("Capitano") e df ["Titolo"].str.contiene ("America")] new_df |
Usiamo l'operatore e per combinare due condizioni booleane in questo esempio.
Il frame dati risultante è come mostrato:
Puoi anche verificare se una riga contiene "Capitano" o "America".
1 2 | new_df = df [df ['title'].str.contiene ("Capitano") | df ['title'].str.contiene ("America")] new_df |
Questo dovrebbe restituire un titolo contenente la stringa "Capitano" o "America". I dati risultanti sono come mostrati:
Conclusione
In questo articolo, abbiamo discusso del controllo se una riga contiene una sottostringa all'interno di un frame dati Panda. Abbiamo anche coperto come ottenere le righe che corrispondono a una sottostringa specifica.