Общая постановка задачи о принятии решения

Статистический критерий

Статистический критерий – это решающее правило, обеспечивающее надежное поведение, то есть принятие истинной и отклонение ложной гипотезы с высокой вероятностью. Статистические критерии обозначают также метод расчета определенного числа и само это число. Когда, мы говорим, что достоверность различий определяется по критерию , то имеем в виду, что использовали метод для расчета определенного числа. По соотношению эмпирического и критического значений критериев судят о том, подтверждается или опровергается гипотеза. Например, если , отвергается. В большинстве случаев для того, чтобы признать различия значимыми, необходимо, чтобы эмпирическое значение критерия превышало критическое, хотя есть критерии (например, критерий знаков), в которых надо придерживаться противоположного правила. Эти правила должны оговариваться в руководстве по использованию критерия. В некоторых случаях расчетная формула критерия включает в себя количество наблюдений в исследуемой выборке n. В этом случае эмпирическое значение критерия одновременно является тестом для проверки статистических гипотез. По специальной таблице определяется, какому уровню статистической значимости различий соответствует данная эмпирическая величина. Примером такого критерия является критерий , вычисляемый на основе углового преобразования Фишера. В большинстве случаев одно и то же эмпирическое значение критерия может оказаться значимым или незначимым в зависимости от количества наблюдений в исследуемой выборке n или от количества степеней свободы v. Число степеней свободы v равно числу классов вариационного ряда минус число условий, при которых он был сформирован. К числу таких условий относится объем выборки, среднее и дисперсия. Если наблюдения расклассифицированы по классам какой-либо номинативной шкалы и подсчитано количество наблюдений в каждой ячейке классификации, то получается частотный вариационный ряд. Единственное условие, которое соблюдается при таком формирование – объем выборки n. Поэтому, если классификация проводится по трем классам, а число испытаний равно 50, мы свободны только в определении количества наблюдений только в двух классах, количество наблюдений в третьем классе будет определяться первыми двумя. Следовательно, здесь имеем v = c – 1 = 3. Существуют и более сложные способы подсчета степеней свободы, которые будут рассмотрены далее. Зная n и/или число степеней свободы, по специальным таблицам можно определить критическое значение критерия и сопоставить с ним эмпирическое значение. Критерии делятся на параметрические и непараметрические. Параметрические критерии включают в формулу расчета параметры распределения, то есть, чаще всего, среднее и дисперсию (t – критерий Стьюдента, критерий F и др.). Непараметрические критерии не включают в формулу расчета параметры распределения и основаны на оперировании частотами или рангами (критерий Q Розенбаума, критерий Т. Вилкоксона и др.). Возможности и ограничения параметрических и непараметрических критериев

№	Параметрические критерии	Непараметрические критерии
1	Позволяют прямо оценить различия в средних, полученные в двух выборках (t – критерий Стьюдента)	Позволяют оценить лишь средние тенденции, например, ответить на вопрос, чаще ли в выборке А встречаются более высокие, а в выборке Б – более низкие значения признака (критерии Q, U и др.)
2	Позволяют прямо определить различия в дисперсиях (критерий Фишера)	Позволяют оценить лишь различия в диапазонах вариативности признака (критерий )
3	Позволяют выявить тенденции изменения признака при переходе от условия к условию (дисперсионный однофакторный план), но лишь при условии нормального распределения признака	Позволяют выявить тенденции изменения признака при переходе от условия к условию при любом распределении признака (критерии тенденций L и Q)
4	Позволяет оценивать взаимодействие двух и более факторов и их влияние на изменение признака (двухфакторный дисперсионный анализ)	Эта возможность отсутствует
5	Экспериментальные данные должны отвечать двум, а иногда трем, условиям: А) значения признака измерены по интервальной шкале Б) распределение признака является нормальным В) в дисперсионном анализе должно соблюдаться требование равенства дисперсий в ячейке комплекса	Экспериментальные данные могут не отвечать ни одному из этих условий: А) значения признаков могут быть представлены в любой шкале, начиная от шкалы наименований Б) распределение признака может быть любым и совпадение его с каким-либо теоретическим законом распределения необязательно и не нуждается в проверке В) требование равенства дисперсий отсутствует
6	Математические расчеты достаточно сложны	Математические расчеты по большей части просты и занимают мало времени (за исключением критериев )и
7	Если условие 5 выполняется, параметрические критерии оказываются более мощными	Если условия 5 не выполняются, непараметрические критерии оказываются более мощными

Уровни значимости Уровень значимости – это вероятность того, что мы сочли различия существенными, а они на самом деле случайны. Таким образом, уровень значимости – это вероятность отклонения нулевой гипотезы, в то время как она верна. Ошибка, состоящая в том, что мы отклонили нулевую гипотезу, в то время . Есликак она верна, называется ошибкой 1 рода и обозначается ., то вероятность правильного решения 1 - вероятность ошибки – это , тем больше вероятность правильного решения.Чем меньше Будем обозначать гипотезу об отсутствии различий - , а о статистической достоверности различий - . Правило отклонения и принятия . Если эмпирическое значение критерия равняется критическому значению, 0.05 (например, так исторически сложилось в соответствующему психологии) или превышает его, то отвергается, но мы еще не можем определенно принять . 0.01 или превышает его, то Если эмпирическое значение критерия равняется критическому значению, соответствующему отклоняется и принимается . Исключение: критерий знаков G, критерий Т. Вилкоксона, критерий U Манна – Уитни. Для них установлено обратное соотношение. Для иллюстрации правила иногда используют «ось значимости». Критические значения критерия обозначим , эмпирическое значение критерия как . Уровень статистической значимости или критические значения критериев определяются по-разному при проверке направленных и ненаправленных статистических гипотез. При направленной статистической гипотезе используется односторонний критерий, при ненаправленной гипотезе – двусторонний критерий.

Содержание