Le analisi statistiche vengono eseguite utilizzando le diverse funzioni integrate in R. Queste funzioni sono incluse nei pacchetti di base di R. Per generare i risultati in R insieme agli argomenti, i vettori vengono presi come input. Queste funzioni integrate sono medie, mediane e modalità, ma discuteremo solo della media in questo post. La media gioca un ruolo importante quando dobbiamo trovare dove si trova il valore centrale di un set di dati. La media di un set di dati mantiene anche le informazioni su tutti i dati all'interno del set.
In generale, la media è definita come la somma di dati/elementi/osservazioni diviso per il numero totale di dati/elementi/osservazioni.
Qual è la funzione r media in ubuntu 20.04
La media non può contenere sia i caratteri numerici che i dati numerici, come la modalità. Può solo generare risultati come valore numerico. La modalità di calcolo è una caratteristica integrata di R, il che significa che ha una funzionalità definita nel linguaggio di programmazione R. Queste funzioni predefinite accettano un vettore come input e producono un risultato come valore numerico.
La sintassi della funzione media è la seguente:
1 | Medio (x, na.RM) |
Dove x è il vettore di input e na.RM è un valore booleano per ignorare i valori mancanti del vettore di input.
Come fa la media a R funziona in Ubuntu 20.04?
In R, la media della funzione integrata () viene utilizzata per calcolare la media aritmetica degli elementi del vettore numerico e mostra il risultato nella forma numerica in modo che possa essere superata come argomento.
Ti mostreremo come calcolare la media nel linguaggio di programmazione R in Ubuntu 20.04 In questo tutorial. Esistono numerosi esempi dei diversi scenari di dati.
Esempio n. 1: semplice r media di un vettore
Per trovare la media di un vettore, dobbiamo prendere un vettore con dati numerici. Creiamo un vettore x per insegnarti come possiamo usare la funzione media quando dobbiamo trovare la media di un vettore.
Quando la media viene applicata al vettore x, sommerà tutti i valori nel vettore X e li dividerà per il numero totale di valori, che è 9.
Come possiamo vedere, la media prende il vettore X come input e genera un valore numerico che è 12.66667. Questo era semplice poiché non c'erano valori nulli coinvolti nei dati. Se è stato incluso un valore nullo, il risultato sarà diverso.
Esempio n. 2: media del vettore numerico con valori NA in r
Poi un.RM è un'opzione che viene utilizzata per ignorare i valori null o NA. È un parametro logico che aiuta la funzione a decidere se rimuovere o meno i valori NA, quindi potrebbe non influire sul risultato dopo i calcoli. In una funzione media, se Na.rm = true, elimina i valori NA. Poi un.RM non è né un'operazione né una funzione. È un parametro utilizzato dalle diverse funzioni dei dati del frame.
Per trovare la media di un vettore in cui sono coinvolti i valori di Na, potremmo affrontare un problema tipico.
Dopo aver aggiunto un valore NA al vettore X1, lo abbiamo assegnato al vettore X2 che ci dà il seguente risultato:
Il vettore X2 sembra uguale allo stesso modo del vettore x1. Ma ora, il valore NA viene aggiunto alla fine. Quando applichiamo la media al vettore X2, si verificherà il seguente problema:
Il risultato, medio (x2) restituisce na, non è quello che ci aspettavamo. Come accennato in precedenza, la funzione media in R può contenere solo dati numerici. Poiché il valore NA non è un dato numerico, il NA.RM viene utilizzato per ignorare i valori NA per evitare che si verifichi questo problema.
È chiaramente illustrato che il NA.L'opzione RM ha eliminato il problema del valore NA e ha generato la media corretta del vettore X2 che è 4.625.
Esempio n. 3: media del vettore numerico con opzione di rivestimento
Proprio come il NA.RM, TRIM è anche un parametro logico utilizzato dalle funzioni della cornice di dati. In generale, l'opzione TRIM nella media è la media del set di dati dopo aver eliminato una determinata percentuale dai valori più piccoli e migliori dal set di dati. Puoi anche dire che, prima di trovare la media di un set di dati, viene rimossa una percentuale specifica dei valori più piccoli e maggiori.
La sintassi della media tagliata è la seguente:
1 | medio (x, trim = 0) |
Proviamo un rivestimento del 20 percento al nostro precedente vettore X1.
Come puoi vedere nell'immagine precedente, la media di V1 senza trim è 4.625. Ma cosa succede se applichiamo un rivestimento del 20% su di esso?
Dopo aver applicato un rivestimento del 20%, il 20% viene rimosso dal valore più grande e più piccolo del set di dati e il valore delle variazioni medie a 4.8333333.
Esempio n. 4: media in R dal set di dati di esempio
Per offrirti un esempio più realistico, implementeremo la funzione media su una colonna del frame di dati da un set di dati reali. Qui, abbiamo scelto un frame di dati "iris". Innanzitutto, dobbiamo scaricare il file di dati in modo da poter implementare la funzione media su di esso.
I dati (IRIS) stanno recuperando i dati dall'iride.File CSV alla nostra console. Chiamare la testa () sta recuperando i titoli dei nostri dati Iris. Il set di dati ci viene visualizzato come visto nel seguente:
Per trovare la media della prima colonna dalla tabella precedente del set di dati, è possibile utilizzare il seguente script:
Come la prima colonna, puoi anche trovare il valore medio per le altre colonne (i.e. sepalo.larghezza, petalo.lunghezza e petalo.larghezza). Come discusso in precedenza in questo argomento, la media non può contenere dati di carattere. Si verificherà un problema ogni volta che proviamo a trovare la media della quinta colonna poiché non vi è valore numerico nella colonna di specie.
Puoi vedere che il risultato non è un dati numerico. Invece, mostra un messaggio di avviso che l'argomento non è numerico o logico.
Conclusione
Dopo aver coperto questo tutorial, ora dovresti avere una migliore comprensione della media. Dovresti anche essere in grado di calcolare la media usando il linguaggio di script R in Ubuntu 20.04. La media è una delle metriche vitali nella ricerca statistica. Essere consapevoli della media può rivelarsi utile per noi nelle ulteriori ricerche. Tuttavia, la capacità di valutare la media non implica che si comprende la ricerca statistica e il principio della media. In R, per trovare la media di un set di dati, abbiamo praticamente implementato i più esempi della media con vettori, parametri logici e set di dati.