1月 31, 2022
Rでのモードの計算方法(例あり)
データセットのモードは、最も頻繁に発生する値を表します。
任意のデータセットには、モードが存在しない、1つのモード、または複数のモードが存在することができます。
統計ソフトRにはデータセットのモードを計算するための組み込み関数はありませんが、次の関数を使用してモードを計算できます:
find_mode<-function(x){u<-unique(x)tab<-tabulate(match(x,u))u}
以下の例は、この関数を実際に使用する方法を示しています。
例1: 数値ベクトルのモードの計算
次のコードは、この関数を使用して数値ベクトルのモードを計算する方法を示しています
#modefind_modeを計算する関数を定義します<-function(x){u<-unique(x)tab<-tabulate(match(x,u))u}#数値ベクトルを定義します<-c(1, 2, 2, 3, 4, 4, 4, 4, 5, 6)#find modefind_mode(data)4
データセットのモードは4になります。 これは最も頻繁に発生する数です。
データセットに複数のモードがある場合にも、この関数を使用できることに注意してください:
#modefind_modeを計算する関数を定義する<-function(x){u<-unique(x)tab<-tabulate(match(x,u))u}#複数のmodesdataを持つ数値ベクトルを定義する<-c(1, 2, 2, 2, 2, 3, 4, 4, 4, 4, 5, 6)#find modefind_mode(data)2 4
データセットのモードは2と4です。 これらの数字の両方が最も頻繁に発生します。
例2:文字ベクトルのモードの計算
この関数は、文字ベクトルのモードの計算にも使用できます:
#modefind_modeを計算する関数を定義する<-function(x){u<-unique(x)tab<-tabulate(match(x,u))u}#文字ベクトルデータを定義する<-c('Sunny','Cloudy','Sunny','Sunny','Rainy','Cloudy')#modefind_mode(data)"Sunny"
モードは”sunny”であることが判明しました–これはベクトルで最も頻繁に発生する文字列です。