Статистический критерий
Статистический критерий – это решающее правило, обеспечивающее надежное поведение, то есть принятие истинной и отклонение ложной гипотезы с высокой вероятностью. Статистические критерии обозначают также метод расчета определенного числа и само это число. Когда, мы говорим, что достоверность различий определяется по критерию , то имеем в виду, что использовали метод для расчета определенного числа. По соотношению эмпирического и критического значений критериев судят о том, подтверждается или опровергается гипотеза. Например, если , отвергается. В большинстве случаев для того, чтобы признать различия значимыми, необходимо, чтобы эмпирическое значение критерия превышало критическое, хотя есть критерии (например, критерий знаков), в которых надо придерживаться противоположного правила. Эти правила должны оговариваться в руководстве по использованию критерия. В некоторых случаях расчетная формула критерия включает в себя количество наблюдений в исследуемой выборке n. В этом случае эмпирическое значение критерия одновременно является тестом для проверки статистических гипотез. По специальной таблице определяется, какому уровню статистической значимости различий соответствует данная эмпирическая величина. Примером такого критерия является критерий , вычисляемый на основе углового преобразования Фишера. В большинстве случаев одно и то же эмпирическое значение критерия может оказаться значимым или незначимым в зависимости от количества наблюдений в исследуемой выборке n или от количества степеней свободы v. Число степеней свободы v равно числу классов вариационного ряда минус число условий, при которых он был сформирован. К числу таких условий относится объем выборки, среднее и дисперсия. Если наблюдения расклассифицированы по классам какой-либо номинативной шкалы и подсчитано количество наблюдений в каждой ячейке классификации, то получается частотный вариационный ряд. Единственное условие, которое соблюдается при таком формирование – объем выборки n. Поэтому, если классификация проводится по трем классам, а число испытаний равно 50, мы свободны только в определении количества наблюдений только в двух классах, количество наблюдений в третьем классе будет определяться первыми двумя. Следовательно, здесь имеем v = c – 1 = 3. Существуют и более сложные способы подсчета степеней свободы, которые будут рассмотрены далее. Зная n и/или число степеней свободы, по специальным таблицам можно определить критическое значение критерия и сопоставить с ним эмпирическое значение. Критерии делятся на параметрические и непараметрические. Параметрические критерии включают в формулу расчета параметры распределения, то есть, чаще всего, среднее и дисперсию (t – критерий Стьюдента, критерий F и др.). Непараметрические критерии не включают в формулу расчета параметры распределения и основаны на оперировании частотами или рангами (критерий Q Розенбаума, критерий Т. Вилкоксона и др.). Возможности и ограничения параметрических и непараметрических критериев
№ | Параметрические критерии | Непараметрические критерии |
1 | Позволяют прямо оценить различия в средних, полученные в двух выборках (t – критерий Стьюдента) | Позволяют оценить лишь средние тенденции, например, ответить на вопрос, чаще ли в выборке А встречаются более высокие, а в выборке Б – более низкие значения признака (критерии Q, U и др.) |
2 | Позволяют прямо определить различия в дисперсиях (критерий Фишера) | Позволяют оценить лишь различия в диапазонах вариативности признака (критерий ) |
3 | Позволяют выявить тенденции изменения признака при переходе от условия к условию (дисперсионный однофакторный план), но лишь при условии нормального распределения признака | Позволяют выявить тенденции изменения признака при переходе от условия к условию при любом распределении признака (критерии тенденций L и Q) |
4 | Позволяет оценивать взаимодействие двух и более факторов и их влияние на изменение признака (двухфакторный дисперсионный анализ) | Эта возможность отсутствует |
5 | Экспериментальные данные должны отвечать двум, а иногда трем, условиям: А) значения признака измерены по интервальной шкале Б) распределение признака является нормальным В) в дисперсионном анализе должно соблюдаться требование равенства дисперсий в ячейке комплекса | Экспериментальные данные могут не отвечать ни одному из этих условий: А) значения признаков могут быть представлены в любой шкале, начиная от шкалы наименований Б) распределение признака может быть любым и совпадение его с каким-либо теоретическим законом распределения необязательно и не нуждается в проверке В) требование равенства дисперсий отсутствует |
6 | Математические расчеты достаточно сложны | Математические расчеты по большей части просты и занимают мало времени (за исключением критериев )и |
7 | Если условие 5 выполняется, параметрические критерии оказываются более мощными | Если условия 5 не выполняются, непараметрические критерии оказываются более мощными |
Уровни значимости Уровень значимости – это вероятность того, что мы сочли различия существенными, а они на самом деле случайны. Таким образом, уровень значимости – это вероятность отклонения нулевой гипотезы, в то время как она верна. Ошибка, состоящая в том, что мы отклонили нулевую гипотезу, в то время . Есликак она верна, называется ошибкой 1 рода и обозначается ., то вероятность правильного решения 1 - вероятность ошибки – это , тем больше вероятность правильного решения.Чем меньше Будем обозначать гипотезу об отсутствии различий - , а о статистической достоверности различий - . Правило отклонения и принятия . Если эмпирическое значение критерия равняется критическому значению, 0.05 (например, так исторически сложилось в соответствующему психологии) или превышает его, то отвергается, но мы еще не можем определенно принять . 0.01 или превышает его, то Если эмпирическое значение критерия равняется критическому значению, соответствующему отклоняется и принимается . Исключение: критерий знаков G, критерий Т. Вилкоксона, критерий U Манна – Уитни. Для них установлено обратное соотношение. Для иллюстрации правила иногда используют «ось значимости». Критические значения критерия обозначим , эмпирическое значение критерия как . Уровень статистической значимости или критические значения критериев определяются по-разному при проверке направленных и ненаправленных статистических гипотез. При направленной статистической гипотезе используется односторонний критерий, при ненаправленной гипотезе – двусторонний критерий.
- Выбор меры
- Статистические гипотезы
- Статистический критерий
- Мощность критерия
- Принятие решения о выборе метода математической обработки
- Общая и основная задачи линейного программирования
- Симплекс метод
- Прямая и двойственная задача линейного программирования Определение двойственной задачи
- Связь между решениями прямой и двойственной задач
- Геометрическая интерпретация двойственных задач
- Экономическая интерпретация двойственных задач
- Транспортная задача