logo
Методы математической статистики и теории вероятностей в выборе фильма

2.2 Сравнения размаха количества просмотренных фильмов отечественных и зарубежных кинокомпаний

За исходные данные было решено взять 130 фильмов, просмотренных за последнее время. Эти фильмы были разбиты по странам производителям и по жанрам. Было выбрано 7 жанров отечественных кинокомпаний и 7 зарубежных. Результаты выборки приведены в таблице 2.1

Таблица 2.1

Жанр

Страна выпуска

Отечественные фильмы

Зарубежные фильмы

Артхаус

3

7

Биография

12

4

Военный

15

5

Документальный

8

2

Драма

6

16

Комедия

9

19

Сказки

10

14

Используем тест экстремальных реакций Мозеса для сравнения размаха количества просмотренных фильмов отечественных и зарубежных кинокомпаний.

В тесте экстремальных реакций Мозеса одна выборка выступает в качестве контрольной группы, а другая - в качестве экспериментальной.

В качестве экспериментальной группы выбирается та, в которой, предполагается, что результаты будут носить более экстремальный характер. В нашем случае это группа зарубежных фильмов.

В качестве меры изменчивости, позволяющей сравнивать "ширину" обеих выборок, используется один из наиболее редко применяемых статистических показателей - размах. Размах S определяется как разность между максимальным и минимальным значением плюс единица:

Размах для контрольной группы "отечественные фильмы":

Размах для экспериментальной группы "зарубежные фильмы":

Как видим, результаты в экспериментальной группе носят более экстремальный характер.

В тесте экстремальных реакций Мозеса размах (по отношению к рангам) вычисляется для контрольной группы. Затем, на основе значения размаха, сведений о размере выборок и других показателях, вычисляется вероятность получения такого результата.

Если полученное значение вероятности оказывается меньшим или равным выбранному значению уровня значимости , то нулевая гипотеза отвергается.

Если значение вероятности больше выбранного значения уровня значимости , то оснований отвергнуть нулевую гипотезу нет.

Применим тест экстремальных реакций Мозеса к нашим данным.

Выберем уровень значимости и сформулируем нулевую и альтернативную гипотезы.

: Страна производитель не влияет на количество просмотренных фильмов разных жанров.

: Количество просмотренных зарубежных фильмов носит более экстремальный характер по сравнению с количеством просмотренных отечественных фильмов.

Объединим обе выборки, расположив значения цен в порядке возрастания, присвоим каждому значению свой ранг и укажем кому - "отечественным фильмам" (L) или "зарубежным фильмам" (А) - принадлежит то или иное значение (табл. 2.2):

Таблица 2.2. Упорядоченные значения количества для объединенной выборки

2

3

4

5

6

7

8

9

10

12

14

15

16

19

1

2

3

4

5

6

7

8

9

10

11

12

13

14

На основании результатов ранжирования определяем размах для контрольной группы зарубежных фильмов.

Как видно из таблицы, минимальное значение ранга в контрольной группе равно 4, максимальное значение ранга равно 13.

Размах .

Однако в статистике размах считается ненадежной мерой изменчивости, поскольку он слишком зависит от колебаний крайних значений. Для придания размаху большей стабильности в тесте экстремальных реакций Мозеса слева и справа отбрасывается несколько крайних значений, и размах вычисляется для оставшихся значений.

Обозначим как то, сколько значений слева и справа будет отброшено. Для малых выборок обычно равно 1. В общем случае рекомендуется слева и справа отсекать по 2,5% значений (то есть всего, слева и справа, отсекается не более 5%).

Отбросим от рангов для контрольной группы по одному крайнему значению слева и справа (то есть отбросим значения 4 и 13). Новое минимальное значение ранга для контрольной группы будет равно 5, а новое максимальное значение будет равно 9. Обозначим новое значение размаха как . Оно будет равно.

Можно показать, что при любых размерах экспериментальной и контрольной группы значение размаха не может быть меньше, чем и больше, чем .

Обозначим как то, насколько наблюдаемое значение размаха больше минимально возможного.

В нашем случае минимально возможное значение размаха равно .

Поскольку -и , то .

После проделанной подготовки можно приступить к вычислению требуемой вероятности. Формула для ее вычисления выглядит следующим образом:

.

, если и , если .

Подставляем в формулу наши данные: ; ; .

Полученное значение вероятности меньше выбранного значения уровня значимости а=0,05. Нулевая гипотеза отвергается, и принимается альтернативная. Количество просмотренных зарубежных фильмов носит более экстремальный характер по сравнению с количеством просмотренных отечественных фильмов.