2.2 Сравнения размаха количества просмотренных фильмов отечественных и зарубежных кинокомпаний
За исходные данные было решено взять 130 фильмов, просмотренных за последнее время. Эти фильмы были разбиты по странам производителям и по жанрам. Было выбрано 7 жанров отечественных кинокомпаний и 7 зарубежных. Результаты выборки приведены в таблице 2.1
Таблица 2.1
Жанр |
Страна выпуска |
||
Отечественные фильмы |
Зарубежные фильмы |
||
Артхаус |
3 |
7 |
|
Биография |
12 |
4 |
|
Военный |
15 |
5 |
|
Документальный |
8 |
2 |
|
Драма |
6 |
16 |
|
Комедия |
9 |
19 |
|
Сказки |
10 |
14 |
Используем тест экстремальных реакций Мозеса для сравнения размаха количества просмотренных фильмов отечественных и зарубежных кинокомпаний.
В тесте экстремальных реакций Мозеса одна выборка выступает в качестве контрольной группы, а другая - в качестве экспериментальной.
В качестве экспериментальной группы выбирается та, в которой, предполагается, что результаты будут носить более экстремальный характер. В нашем случае это группа зарубежных фильмов.
В качестве меры изменчивости, позволяющей сравнивать "ширину" обеих выборок, используется один из наиболее редко применяемых статистических показателей - размах. Размах S определяется как разность между максимальным и минимальным значением плюс единица:
Размах для контрольной группы "отечественные фильмы":
Размах для экспериментальной группы "зарубежные фильмы":
Как видим, результаты в экспериментальной группе носят более экстремальный характер.
В тесте экстремальных реакций Мозеса размах (по отношению к рангам) вычисляется для контрольной группы. Затем, на основе значения размаха, сведений о размере выборок и других показателях, вычисляется вероятность получения такого результата.
Если полученное значение вероятности оказывается меньшим или равным выбранному значению уровня значимости , то нулевая гипотеза отвергается.
Если значение вероятности больше выбранного значения уровня значимости , то оснований отвергнуть нулевую гипотезу нет.
Применим тест экстремальных реакций Мозеса к нашим данным.
Выберем уровень значимости и сформулируем нулевую и альтернативную гипотезы.
: Страна производитель не влияет на количество просмотренных фильмов разных жанров.
: Количество просмотренных зарубежных фильмов носит более экстремальный характер по сравнению с количеством просмотренных отечественных фильмов.
Объединим обе выборки, расположив значения цен в порядке возрастания, присвоим каждому значению свой ранг и укажем кому - "отечественным фильмам" (L) или "зарубежным фильмам" (А) - принадлежит то или иное значение (табл. 2.2):
Таблица 2.2. Упорядоченные значения количества для объединенной выборки
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
12 |
14 |
15 |
16 |
19 |
|
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
13 |
14 |
На основании результатов ранжирования определяем размах для контрольной группы зарубежных фильмов.
Как видно из таблицы, минимальное значение ранга в контрольной группе равно 4, максимальное значение ранга равно 13.
Размах .
Однако в статистике размах считается ненадежной мерой изменчивости, поскольку он слишком зависит от колебаний крайних значений. Для придания размаху большей стабильности в тесте экстремальных реакций Мозеса слева и справа отбрасывается несколько крайних значений, и размах вычисляется для оставшихся значений.
Обозначим как то, сколько значений слева и справа будет отброшено. Для малых выборок обычно равно 1. В общем случае рекомендуется слева и справа отсекать по 2,5% значений (то есть всего, слева и справа, отсекается не более 5%).
Отбросим от рангов для контрольной группы по одному крайнему значению слева и справа (то есть отбросим значения 4 и 13). Новое минимальное значение ранга для контрольной группы будет равно 5, а новое максимальное значение будет равно 9. Обозначим новое значение размаха как . Оно будет равно.
Можно показать, что при любых размерах экспериментальной и контрольной группы значение размаха не может быть меньше, чем и больше, чем .
Обозначим как то, насколько наблюдаемое значение размаха больше минимально возможного.
В нашем случае минимально возможное значение размаха равно .
Поскольку -и , то .
После проделанной подготовки можно приступить к вычислению требуемой вероятности. Формула для ее вычисления выглядит следующим образом:
.
, если и , если .
Подставляем в формулу наши данные: ; ; .
Полученное значение вероятности меньше выбранного значения уровня значимости а=0,05. Нулевая гипотеза отвергается, и принимается альтернативная. Количество просмотренных зарубежных фильмов носит более экстремальный характер по сравнению с количеством просмотренных отечественных фильмов.
- Введение
- 1. Частота встречаемости зарубежных/отечественных фильмов на сайте Megogo.net
- 1.1 Теоретическое описание фильмов сайта Megogo.net
- 1.2 Популярность "отечественных" фильмов
- 2. Сравнение размаха количества просмотренных фильмов отечественного и зарубежного производства
- · Сравнить размах количества просмотренных фильмов отечественных и зарубежных кинокомпаний.
- 2.2 Сравнения размаха количества просмотренных фильмов отечественных и зарубежных кинокомпаний
- Заключение
- Теория вероятностей и математическая статистика
- Теория вероятностей и математическая статистика
- «Теория вероятностей и математическая статистика»
- Предмет теории вероятностей и математической статистики
- 2.2.1. Теория вероятностей и математическая статистика в принятии решений
- «Элементы теории вероятностей и математической статистики»
- Содержание курса теории вероятностей и математической статистики Теория вероятностей
- Теория вероятностей и математическая статистика