hoe de modus te berekenen in R (met voorbeelden)
de modus van een dataset vertegenwoordigt de meest voorkomende waarde.
in een gegeven dataset kan er geen modus, één modus of meerdere modi zijn.
de statistische software R heeft geen ingebouwde functie om de modus van een dataset te berekenen, maar u kunt de volgende functie gebruiken om de modus te berekenen:
find_mode < - function(x) { u <- unique(x) tab <- tabulate(match (x, u)) u}
de volgende voorbeelden laten zien hoe deze functie in de praktijk te gebruiken.
Voorbeeld 1: Berekening van de modus van een numerieke Vector
de volgende code laat zien hoe deze functie gebruikt wordt om de modus van een numerieke vector
# define function te berekenen modefind_mode < - function (x) { u < - unique (x) tab <- tabulate(match(x, u)) u} # define numeric vectordata < - c(1, 2, 2, 3, 4, 4, 4, 4, 5, 6)#Zoek modefind_mode (data) 4
de modus van de dataset blijkt 4 te zijn. Dit is het nummer dat het vaakst voorkomt.
merk op dat we deze functie ook kunnen gebruiken wanneer er meerdere modi in een dataset zijn:
# definieer functie om modefind_mode < te berekenen-function (x) { u < - unique (x) tab <- tabulate(match(x, u)) u} # definieer numerieke vector met meerdere modesdata < - c(1, 2, 2, 2, 2, 3, 4, 4, 4, 4, 5, 6)#find modefind_mode (data) 2 4
de modi van de dataset zijn 2 en 4. Beide getallen komen het vaakst voor.
Voorbeeld 2: berekenen van de modus van een Tekenvector
deze functie kan ook worden gebruikt om de modus van een tekenvector te berekenen:
#define function to calculate modefind_mode <- function(x) { u <- unique(x) tab <- tabulate(match(x, u)) u}#define character vectordata <- c('Sunny', 'Cloudy', 'Sunny', 'Sunny', 'Rainy', 'Cloudy')#find modefind_mode(data) "Sunny"
de modus blijkt “Sunny” te zijn – dit is de string die het vaakst voorkomt in de vector.