januari 31, 2022

hoe de modus te berekenen in R (met voorbeelden)

de modus van een dataset vertegenwoordigt de meest voorkomende waarde.

in een gegeven dataset kan er geen modus, één modus of meerdere modi zijn.

de statistische software R heeft geen ingebouwde functie om de modus van een dataset te berekenen, maar u kunt de volgende functie gebruiken om de modus te berekenen:

find_mode < - function(x) { u <- unique(x) tab <- tabulate(match (x, u)) u}

de volgende voorbeelden laten zien hoe deze functie in de praktijk te gebruiken.

Voorbeeld 1: Berekening van de modus van een numerieke Vector

de volgende code laat zien hoe deze functie gebruikt wordt om de modus van een numerieke vector

 # define function te berekenen modefind_mode < - function (x) { u < - unique (x) tab <- tabulate(match(x, u)) u} # define numeric vectordata < - c(1, 2, 2, 3, 4, 4, 4, 4, 5, 6)#Zoek modefind_mode (data) 4

de modus van de dataset blijkt 4 te zijn. Dit is het nummer dat het vaakst voorkomt.

merk op dat we deze functie ook kunnen gebruiken wanneer er meerdere modi in een dataset zijn:

 # definieer functie om modefind_mode < te berekenen-function (x) { u < - unique (x) tab <- tabulate(match(x, u)) u} # definieer numerieke vector met meerdere modesdata < - c(1, 2, 2, 2, 2, 3, 4, 4, 4, 4, 5, 6)#find modefind_mode (data) 2 4

de modi van de dataset zijn 2 en 4. Beide getallen komen het vaakst voor.

Voorbeeld 2: berekenen van de modus van een Tekenvector

deze functie kan ook worden gebruikt om de modus van een tekenvector te berekenen:

#define function to calculate modefind_mode <- function(x) { u <- unique(x) tab <- tabulate(match(x, u)) u}#define character vectordata <- c('Sunny', 'Cloudy', 'Sunny', 'Sunny', 'Rainy', 'Cloudy')#find modefind_mode(data) "Sunny"

de modus blijkt “Sunny” te zijn – dit is de string die het vaakst voorkomt in de vector.

Geef een antwoord

Het e-mailadres wordt niet gepubliceerd.