logo search
Міністерство освіти та науки Україн1

Поняття про статистичну перевірку гіпотез

Задачі знаходження вірогідних областей для параметрів розподілів споріднені до задач перевірки статистичних гіпотез. Статистичною гіпотезою будемо називати припущення про вид або параметри розподілу деякої ознаки генеральної сукупності.

Розрізняють два види статистичних гіпотез про параметри розподілу. Гіпотези першого типу стверджують, що невідомий параметр набуває певного значення (або належить деякому проміжку значень). Гіпотеза другого типу полягає в тому, що невідомі параметри у двох (або кількох) незалежних вибірках мають однакові значення. Останнє практично означає, що серії експериментів, у яких отримані ці вибірки, здійснювались в однакових умовах.

Статистична перевірка гіпотези полягає в тому, щоб на основі проведених спостережень підтвердити або відхилити цю гіпотезу. Тому поряд із даною статистичною гіпотезою, яку, як правило, називають нульовою (оскільки в більшості випадків вона стверджує, що відхилення значення досліджуваного параметра від заданого числа дорівнює нулю), розглядають альтернативну гіпотезу, котра є запереченням даної. Далі будується процедура перевірки гіпотези (критерій згоди) — правило, яке дозволяє за даними спостережень приймати гіпотезу або відхиляти її (тобто приймати альтернативну гіпотезу). Для цього вибирають статистичний критерій — випадкову величину, яка є статистикою вибірки. Розрізняють параметричні і непараметричні критерії. Якщо статистичний критерій залежить від параметрів розподілу досліджуваної величини, то його називають параметричним. Непараметричні критерії не залежать від параметрів розподілу досліджуваної величини Вважається, що розподіл критерію відомий. Множину значень критерію, які не суперечать нульовій гіпотезі називають областю допустимих значень, а множину решти значень — критичною областю. Точки, які відділяють область до­пустимих значень від критичної області називають критичними точками. Розрізняють лівосторонню ( рис. 14 а), правосторонню (рис. 14 б) та двосторонню (рис. 14 в) критичні області.

Оскільки подія випадкова, то гіпотеза відхиляється або приймається внаслідок спостереження випадкової події. А це означає, що при при­йнят­ті рішення дослідник може допустити похибку. Помилку, яка полягає у відхиленні нульової гіпотези (прийнятті альтернативної гіпотези), коли вона правильна, називають помилкою першого роду, а помилку, яка полягає у прийнятті нульової гіпотези, коли вона хибна, — помилкою другого роду. Ймовірність  похибки першого роду називають рівнем значущості критерію, а ймовірність  похибки другого роду — його оперативною характеристикою. Величину 1 –  називають надійністю критерію, а величину 1 –  — його потужністю.

При побудові процедур перевірки гіпотез бажано добиватись мінімального рівня обох помилок, однак зниження рівня однієї з них приводять до збільшення рівня іншої. Розглянемо такий приклад.

Приклад 18. Випадкова величина Х має нормальний розподіл, дисперсія якого дорівнює 4. Висувається нульова гіпотеза Н0 : МХ =1, та альтернативна гіпотеза Н1 : МХ =–1. Для перевірки гіпотези Н0 проводять серію з п = 5 випробувань і визначають середнє значення . При рівні значущості  і двосторонній критичній області знайти оперативну характеристику критерію. Обчислити її при . Як зміниться оперативна характеристика, якщо серія складатиметься з десяти випробувань?

Розв’язання: Випадкова величина матиме те ж математичне сподівання, що й Х і стандартне відхилення . Критичні значення х1 та х2 критерію знаходимо як квантилі нормального розподілу з математичним сподіванням 1 і дисперсією 0,894 рів­нів та . Тоді , а . (В Excel можуть бути знайдені як НОРМОБР(0,025;1;0,894) та НОРМОБР(0,975;1;0,894)). Тоді .

Якщо , то , , .

Якщо серія випробувань складатиметься з десяти, то і для маємо , і . Якщо ж , то , і . Графіки відповідних щільностей розподілів та області для наведено на рис. 15.

Як бачимо з прикладу, зниження рівня похибки першого роду призводить до підвищення рівня похибки другого роду. Знизити одночасно рівень похибок першого і другого роду можна, збільшивши об’єм вибірки.