Выборочный коэффициент ранговой корреляции Спирмена и проверка гипотезы о его значимости
Допустим, что объекты генеральной совокупности обладают двумя качественными признаками. Под качественным подразумевается признак, который невозможно измерить точно, но он позволяет сравнивать объекты между собой и, следовательно, расположить их в порядке убывания или возрастания качества. Для определенности будем всегда располагать объекты в порядке ухудшения качества. При таком “ранжировании” на первом месте находится объект наилучшего качества по сравнению с остальными; на втором месте окажется объект “хуже” первого, но “лучше” других, и т. д.
Пусть выборка объема содержит независимые объекты, которые обладают двумя качественными признаками и . Для оценки степени связи признаков вводят, в частности, коэффициенты ранговой корреляции Спирмена и Кендалла.
Для практических целей использование ранговой корреляции весьма полезно. Например, если установлена высокая ранговая корреляция между двумя качественными признаками, то достаточно контролировать только один из признаков.
Расположим сначала объекты выборки в порядке ухудшения качества по признаку при допущении, что все объекты имеют различное качество по обоим признакам (случай, когда это допущение не выполняется, рассмотрим ниже). Припишем объекту, стоящему на -м месте, число – ранг равный порядковому номеру объекта.
Например, ранг объекта, занимающего первое место, ; объект, расположенный на втором месте, имеет ранг , и т. д. В итоге получим последовательность рангов по признаку .
Расположим теперь объекты в порядке убывания качества по признаку и припишем каждому из них ранг , однако (для удобства сравнения рангов) индекс при будет по-прежнему равен порядковому номеру объекта по признаку . Например, запись означает, что по признаку объект стоит на втором месте, а по признаку на пятом.
В итоге получим две последовательности рангов:
по признаку ,
по признаку .
Заметим, что в первой строке индекс совпадает с порядковым номером объекта, а во второй, вообще говоря, не совпадает. Итак, в общем случае .
Рассмотрим два “крайних случая”.
1. Пусть ранги по признакам и совпадают при всех значениях индекса . В этом случае ухудшение качества по одному признаку влечет ухудшение качества по другому. Очевидно, признаки связаны: имеет место “полная прямая зависимость”.
2. Пусть ранги по признакам и противоположны в том смысле, что если , то ; если , то ; …., если , то . В этом случае ухудшение качества по одному признаку влечет улучшение по другому. Очевидно, признаки связаны – имеет место “противоположная зависимость”.
На практике чаще будет встречаться промежуточный случай, когда ухудшение качества по одному признаку влечет для некоторых объектов ухудшение, а для других – улучшение качества. Задача состоит в том, чтобы оценить связь между признаками. Для ее решения рассмотрим ранги как возможные значения случайной величины X, а – как возможные значения случайной величины Y. Таким образом, о связи между качественными признаками и можно судить по связи между случайными величинами X и Y, для оценки которой используем коэффициент корреляции. Вычислим выборочный коэффициент корреляции случайных величин X и Y в условных вариантах, учитывая, что каждому рангу , соответствует только один ранг :
приняв в качестве условных вариант отклонения , . Учитывая, кроме того, что среднее значение отклонения равно нулю т.е. , получим более простую формулу вычисления выборочного коэффициента корреляции: .
Выразим через известные числа – объем выборки и разности рангов . Поскольку средние значения рангов равны между собой, то и следовательно . Несложный подсчет суммы квадратов дает . Отсюда . Таким образом .
Учитывая, что
,
получим: . Аналогично . Следовательно .
Подставив, найденные выражения в формулу для вычисления коэффициента корреляции получим выборочный коэффициент ранговой корреляции Спирмена
.
Приведем свойства выборочного коэффициента корреляции Спирмена.
Свойство 1. Если между качественными признаками A и B имеется “полная прямая зависимость” в том смысле, что ранги объектов совпадают при всех значениях , то выборочный коэффициент ранговой корреляции Спирмена равен единице.
Свойство 2. Если между качественными признаками A и B имеется “противоположная зависимость”, то выборочный коэффициент ранговой корреляции Спирмена равен минус единице.
Свойство 3. Если между качественными признаками A и B нет ни “полной прямой”, ни “противоположной” зависимостей, то коэффициент корреляции Спирмена заключен между и , причем чем ближе к нулю его абсолютная величина, тем зависимость меньше.
Замечание. Если выборка содержит объекты с одинаковым качеством, то каждому из них приписывается ранг, равный среднему арифметическому порядковых номеров объектов. Например, если объекты одинакового качества по признаку A имеют порядковые номера 5 и 6, то их ранги соответственно равны: .
Приведем правило, позволяющее установить значимость или незначимость ранговой корреляции связи.
Правило. Для того чтобы при уровне значимости проверить нулевую гипотезу о равенстве нулю генерального коэффициента ранговой корреляции Спирмена при конкурирующей гипотезе , надо вычислить критическую точку:
,
где – объем выборки, – выборочный коэффициент ранговой корреляции Спирмена, – критическая точка двусторонней критической области, которую находят по таблице критических точек распределения Стьюдента, по уровню значимости и числу степеней свободы .
Если – нет оснований отвергнуть нулевую гипотезу. Ранговая корреляционная связь между качественными признаками незначима.
Если – нулевую гипотезу отвергают. Между качественными признаками существует значимая ранговая корреляционная связь.
- Основные понятия, используемые в математической обработке психологических данных Признаки и переменные
- Шкалы измерения
- Математическая статистика. Первоначальные понятия математической статистики
- Измерение значений психологических признаков
- Разные виды случайных выборок
- Статистическое распределение выборки.
- Типы выборки
- Эмпирическая функция распределения.
- Гистограмма
- Статистические оценки параметров распределения.
- Групповая и общая средние
- Групповая, внутри групповая, межгрупповая и общая дисперсии
- Интервальные оценки.
- Доверительные интервалы для оценки среднеквадратического отклонения нормального распределения
- Характеристики вариационного ряда
- Обычные, начальные и центральные эмпирические моменты
- Эмпирические и выравнивающие (теоретические) частоты
- Асимметрия и эксцесс
- Метод моментов.
- Метод наибольшего правдоподобия.
- Элементы теории линейной корреляции.
- Статистическая проверка гипотез о виде и о параметрах распределений.
- Статистический критерий проверки нулевой гипотезы
- Критерий Пирсона проверки гипотезы о нормальном распределении генеральной совокупности
- Сравнение двух дисперсий нормальных генеральных совокупностей
- Сравнение исправленной выборочной дисперсии с гипотетической генеральной дисперсией нормальной совокупности
- Сравнение двух средних нормальных генеральных совокупностей, дисперсии которых известны (независимые выборки)
- Сравнение двух средних произвольно распределенных генеральных совокупностей (большие независимые выборки)
- Сравнение двух средних нормальных генеральных совокупностей, дисперсии которых неизвестны и одинаковы (малые независимые выборки)
- Сравнение выборочной средней с гипотетической генеральной средней нормальной совокупности
- Связь между двусторонней критической областью и доверительным интервалом
- Определение минимального объема выборки при сравнении выборочной и гипотетической генеральной средних
- Сравнение двух средних нормальных генеральных совокупностей с неизвестными дисперсиями (зависимые выборки)
- Сравнение наблюдаемой относительной частоты с гипотетической вероятностью появления события
- Сравнение двух вероятностей биномиальных распределений
- Сравнение нескольких дисперсий нормальных генеральных совокупностей по выборкам различного объема. Критерий Бартлетта
- Сравнение нескольких дисперсий нормальных генеральных совокупностей по выборкам одинакового объема. Критерий Кочрена
- Проверка гипотезы о значимости выборочного коэффициента корреляции
- Выборочный коэффициент ранговой корреляции Спирмена и проверка гипотезы о его значимости
- Выборочный коэффициент ранговой корреляции Кендалла и проверка гипотезы о его значимости
- Критерий Вилкоксона и проверка гипотезы об однородности двух выборок
- Однофакторный дисперсионный анализ Сравнение нескольких средних. Понятие о дисперсионном анализе
- Общая факторная и остаточная суммы квадратов отклонений
- Общая, факторная и остаточная дисперсии
- Сравнение нескольких средних методом дисперсионного анализа
- Критические точки распределения
- Критические точки распределения Стьюдента
- Критические точки распределения f Фишера — Снедекора
- Критические точки распределения Кочрена
- Критические точки распределения Кочрена (продолжение)
- Критические точки критерия Вилкоксона
- Критические точки критерия Вилкоксона (продолжение)
- Критические точки критерия Вилкоксона (продолжение)