Jak vypočítat relativní frekvenci třídy
frekvenční distribuce ukazuje počet prvků v datové sadě, které patří do každé třídy. V relativní frekvenční distribuci je hodnota přiřazená každé třídě podíl celkové datové sady, která patří do třídy.
Předpokládejme například, že frekvenční distribuce je založena na vzorku 200 supermarketů. Ukazuje se, že 50 z těchto supermarketů účtuje cenu mezi 8, 00 a 8, 99 USD za libru kávy. V relativní frekvenční distribuci by číslo přiřazené této třídě bylo 0,25 (50/200). Jinými slovy, to je 25 procent z celkového počtu.
zde je užitečný vzorec pro výpočet relativní frekvence třídy:
frekvence třídy označuje počet pozorování v každé třídě; n představuje celkový počet pozorování v celé datové sadě. Pro příklad supermarketu je celkový počet pozorování 200.
relativní četnost může být vyjádřena jako podíl (zlomek) z celkového počtu nebo jako procento z celkového počtu. Například následující tabulka ukazuje frekvenční rozdělení cen plynu na 20 různých stanicích.
ceny plynu ($/galon) | počet čerpacích stanic |
---|---|
$3.50–$3.74 | 6 |
$3.75–$3.99 | 4 |
$4.00–$4.24 | 5 |
$4.25–$4.49 | 5 |
na základě těchto informací můžete pomocí vzorce relativní frekvence vytvořit další tabulku, která ukazuje relativní frekvenci cen v každé třídě jako zlomek i procento.
ceny plynu ($/galon) | počet čerpacích stanic | relativní frekvence (zlomek) |
relativní frekvence (procento) |
---|---|---|---|
$3.50–$3.74 | 6 | 6/20 = 0.30 | 30% |
$3.75–$3.99 | 4 | 4/20 = 0.20 | 20% |
$4.00–$4.24 | 5 | 5/20 = 0.25 | 25% |
$4.25–$4.49 | 5 | 5/20 = 0.25 | 25% |
při velikosti vzorku 20 čerpacích stanic se relativní frekvence každé třídy rovná skutečnému počtu čerpacích stanic dělenému 20. Výsledek je pak vyjádřen jako zlomek nebo procento. Například vypočítáte relativní frekvenci cen mezi 3,50 a 3,74 usd jako 6/20, abyste získali 0,30 (30 procent). Podobně relativní frekvence cen mezi 3, 75 a 3, 99 USD se rovná 4/20 = 0, 20 = 20 procent.
jednou z výhod použití relativní frekvenční distribuce je, že můžete porovnat datové sady, které nemusí nutně obsahovat stejný počet pozorování. Předpokládejme například, že výzkumný pracovník má zájem porovnat distribuci cen plynu v New Yorku a Connecticutu. Protože New York má mnohem větší populaci, má také mnohem více čerpacích stanic. Výzkumník se rozhodne vybrat pro vzorek 1 procento čerpacích stanic v New Yorku a 1 procento čerpacích stanic v Connecticutu. To se ukázalo být 800 V New Yorku a 200 v Connecticutu. Výzkumník sestavuje frekvenční distribuci, jak je uvedeno v následující tabulce.
Cena | New York Gas Stations | Connecticut Gas Stations |
---|---|---|
$3.00–$3.49 | 210 | 48 |
$3.50–$3.99 | 420 | 96 |
$4.00–$4.49 | 170 | 56 |
na základě tohoto kmitočtového rozdělení je trapné srovnávat rozložení cen v obou státech. Převedením těchto dat na relativní frekvenční distribuci je srovnání značně zjednodušeno, jak je vidět v konečné tabulce.
Cena | New York Čerpací stanice | relativní frekvence | Connecticut Čerpací stanice | relativní frekvence |
---|---|---|---|---|
$3.00–$3.49 | 210 | 210/800 = 0.2625 | 48 | 48/200 = 0.2400 |
$3.50–$3.99 | 420 | 420/800 = 0.5250 | 96 | 96/200 = 0.4800 |
$4.00–$4.49 | 170 | 170/800 = 0.2125 | 56 | 56/200 = 0.2800 |
výsledky ukazují, že rozložení cen plynu v obou státech je téměř totožné. Zhruba 25 procent čerpacích stanic v každém státě účtuje cenu mezi $ 3.00 a $ 3.49; asi 50 procent účtuje cenu mezi $ 3.50 a $ 3.99; a asi 25 procent účtuje cenu mezi $ 4.00 a $ 4.49 .