§2 Задача перевірки статистичних гіпотез
-
Постановка задачі
Припустимо, що маємо вибірку об’єму . Закон розподілу відповідної випадкової величини невідомий. Висувається основна гіпотеза : випадкова величина розподілена за вказаним законом , та низка альтернативних гіпотез : випадкова величина розподілена за іншими законами: тощо.
У простішому випадку:
: випадкова величина розподілена за законом ,
: випадкова величина не розподілена за законом .
Припустимо, що ми маємо певний спосіб перевірки гіпотез (критерій). Тоді можливий один з 4 випадків:
-
Гіпотеза вірна, але відхиляється за критерієм (тобто приймається альтернативна гіпотеза );
-
Гіпотеза вірна та приймається;
-
Гіпотеза невірна та відхиляється;
-
Гіпотеза невірна, але приймається.
Як бачимо, у випадках 2) та 3) критерій спрацював правильно, а випадки 1) та 4) треба розглядати, як помилки.
Помилка 1 - гіпотеза вірна, але відхиляється – називається помилкою першого роду. Помилка 4 - гіпотеза невірна, але приймається – називається помилкою другого роду.
Як правило, за помилку першого роду беруть ту помилку, ціна якої більше. Виходячи з цього, відповідна гіпотеза вибирається за основну. Наприклад, нові ліки перевіряються на токсичність. Очевидно, за основну гіпотезу краще прийняти гіпотезу «препарат є токсичним». Дійсно, помилкою першого роду в цьому випадку буде класифікувати токсичний препарат, як нетоксичний. Ціною цього буде погіршення стану хворих, судові процеси, скандал, антиреклама і під кінець - можливе банкрутство. У випадку же помилки другого роду нетоксичний препарат буде прийнятий за токсичний, і в найгіршому випадку прийдеться починати все з початку, а то й лише відправити препарат на доопрацювання. Ціною будуть певні фінансові втрати, значно менші у порівнянні з втратами від помилки 1 роду.
Ймовірність помилки1 роду, тобто прийняття альтернативної гіпотези при тому, що вірною є основна гіпотеза ) позначається . Ймовірність помилки 2 роду - . Ясно, що ймовірність мусить бути малою. Зазвичай розглядають
,
де - рівень значущості критерію. Чим важливішими є наслідки помилки 1 роду – тим меншим беруть . Зазвичай розглядають тощо. Однак не треба зловживати зменшенням . Справа у тому, що у випадку завищеного рівня значущості критерій почне приймати без розбору велику кількість різноманітних нульових гіпотез, серед яких буде багато невірних – тобто зросте ймовірність помилки 2 роду, чого теж треба уникати.
-
Содержание
- Елементи теорії ймовірностей
- §1. Означення ймовірності
- Простіші властивості ймовірності
- Класичне означення ймовірності
- VII. Геометрична ймовірність.
- VIII. Умовна ймовірність. Формула Байєса.
- §2. Послідовності незалежних випробувань
- I. Послідовність незалежних випробувань.
- II. Схема Бернуллі
- Iіi. Граничні теореми у схемі Бернуллі
- §3. Випадкові величини
- II. Дискретна випадкова величина
- III. Неперервна випадкова величина
- §4. Нормальний розподіл та його властивості
- §5. Кореляція
- V. Кореляційний момент:
- Vі. Коефіцієнт кореляції
- Vіі. Лінійна регресія -
- Елементи математичної статистики
- §1 Вибірка та її характеристики
- Варіаційний ряд.
- Емпірична (вибіркова) функція розподілу
- Полігон частот
- Гістограма
- §2 Задача перевірки статистичних гіпотез
- Гіпотеза про параметри нормального розподілу : .
- Гіпотеза про параметри нормального розподілу : .
- Гіпотеза про закон розподілу. Критерій Колмогорова.
- §3. Довірчі інтервали
- §4. Вибіркова кореляція
- §5. Значущість вибіркового коефіцієнту кореляції
- §6. Критерій , як критерій незалежності ознак