In questo tutorial R, filtreremo le righe utilizzando la funzione Filter ().
Creiamo un frame dati con quattro righe e cinque colonne.
#Crea un mercato dati che ha 4 righe e 5 colonne.
mercato = dati.frame (market_id = c (1,2,3,4), market_name = c ('m1', 'm2', 'm3', 'm4'), market_place = c ('India', 'USA', 'India' ',' Australia '), market_type = c (' drogheria ',' bar ',' drogheria ',' ristorante '), market_squarefeet = c (120.342.220.110)))
#Display Market
Stampa (mercato)
Risultato:
Filtriamo le righe in questo frame dati.
Sintassi:
filtro (dataframe_object, condizione)
Parametri:
Ci vogliono due parametri:
Possiamo specificare le condizioni utilizzando gli operatori relazionali e logici.
Esempio 1:
In questo esempio, specificheremo la condizione sulla colonna Market_id.
Filtreremo le righe selezionando i valori in questa colonna maggiore di 3.
#Crea un mercato dati che ha 4 righe e 5 colonne.
mercato = dati.frame (market_id = c (1,2,3,4), market_name = c ('m1', 'm2', 'm3', 'm4'), market_place = c ('India', 'USA', 'India' ',' Australia '), market_type = c (' drogheria ',' bar ',' drogheria ',' ristorante '), market_squarefeet = c (120.342.220.110)))
#Return Righe Solo quando i valori nella colonna Market_id sono superiori a 3
Stampa (filtro (mercato, market_id> 3))
Risultato:
Possiamo vedere che le righe sono filtrate e utilizzate l'operatore maggiore di (>) sulla colonna Market_id.
Esempio 2:
In questo esempio, specificheremo la condizione sulle colonne Market_id e Market_Place.
Filtreremo le righe selezionando i valori nella colonna Market_id superiori a 2 e il valore Market_Place "India".
#Crea un mercato dati che ha 4 righe e 5 colonne.
mercato = dati.frame (market_id = c (1,2,3,4), market_name = c ('m1', 'm2', 'm3', 'm4'), market_place = c ('India', 'USA', 'India' ',' Australia '), market_type = c (' drogheria ',' bar ',' drogheria ',' ristorante '), market_squarefeet = c (120.342.220.110)))
#Return Righe solo quando i valori nella colonna Market_id sono superiori a 3 e il luogo è l'India
stampa (filtro (mercato, market_id> 2 e market_place == 'India'))
Risultato:
Possiamo vedere che le righe sono filtrate e utilizzate l'operatore maggiore di (>) sulla colonna Market_id e l'operatore == sulla colonna Market_Place combinata con l'operatore e (&).
Esempio 3:
In questo esempio, specificheremo la condizione sulle colonne Market_id e Market_Place.
Filtreremo le righe selezionando i valori nella colonna Market_id maggiore di 2 o "India" Market_Place.
#Crea un mercato dati che ha 4 righe e 5 colonne.
mercato = dati.frame (market_id = c (1,2,3,4), market_name = c ('m1', 'm2', 'm3', 'm4'), market_place = c ('India', 'USA', 'India' ',' Australia '), market_type = c (' drogheria ',' bar ',' drogheria ',' ristorante '), market_squarefeet = c (120.342.220.110)))
#Return Righe Solo quando i valori nella colonna Market_id sono maggiori di 3 o il luogo è l'India
stampa (filtro (mercato, market_id> 2 | market_place == 'India'))
Risultato:
Possiamo vedere che le righe sono filtrate e utilizzate l'operatore maggiore di (>) sulla colonna Market_id e l'operatore == sulla colonna Market_Place combinata con l'oroperatore o (|).
Esempio 4:
In questo esempio, specificheremo la condizione sulla colonna Market_Place.
Filtreremo le righe selezionando i valori nella colonna Market_Place in modo che i valori siano in "India" o "USA" utilizzando l'operatore % in %.
#Crea un mercato dati che ha 4 righe e 5 colonne.
mercato = dati.frame (market_id = c (1,2,3,4), market_name = c ('m1', 'm2', 'm3', 'm4'), market_place = c ('India', 'USA', 'India' ',' Australia '), market_type = c (' drogheria ',' bar ',' drogheria ',' ristorante '), market_squarefeet = c (120.342.220.110)))
#Return Righe solo quando i valori in Market_Place sono solo in India e USA
stampa (filtro (mercato, market_place % in % c ("India", "USA")))
Risultato:
Possiamo vedere che le righe vengono filtrate e utilizzate l'operatore % in % per verificare i valori che sono "India" o "USA".
Conclusione
In questo articolo, abbiamo discusso dei quattro diversi esempi per filtrare il telaio di dati specificando le diverse condizioni utilizzando gli operatori relazionali, gli operatori logici e l'operatore % in %.