logo search
645145

Выборочный коэффициент ранговой корреляции Спирмена и проверка гипотезы о его значимости

Допустим, что объекты генеральной совокупности обладают двумя качественными признаками. Под качественным подразумевается признак, который невозможно измерить точно, но он позволяет сравнивать объекты между собой и, следовательно, расположить их в порядке убывания или возрастания качества. Для определенности будем всегда располагать объекты в порядке ухудшения качества. При таком “ранжировании” на первом месте находится объект наилучшего качества по сравнению с остальными; на втором месте окажется объект “хуже” первого, но “лучше” других, и т. д.

Пусть выборка объема содержит независимые объекты, которые обладают двумя качественными признаками и . Для оценки степени связи признаков вводят, в частности, коэффициенты ранговой корреляции Спирмена и Кендалла.

Для практических целей использование ранговой корреляции весьма полезно. Например, если установлена высокая ранговая корреляция между двумя качественными признаками, то достаточно контролировать только один из признаков.

Расположим сначала объекты выборки в порядке ухудшения качества по признаку при допущении, что все объекты имеют различное качество по обоим признакам (случай, когда это допущение не выполняется, рассмотрим ниже). Припишем объекту, стоящему на -м месте, число – ранг равный порядковому номеру объекта.

Например, ранг объекта, занимающего первое место, ; объект, расположенный на втором месте, имеет ранг , и т. д. В итоге получим последовательность рангов по признаку .

Расположим теперь объекты в порядке убывания качества по признаку и припишем каждому из них ранг , однако (для удобства сравнения рангов) индекс при будет по-прежнему равен порядковому номеру объекта по признаку . Например, запись означает, что по признаку объект стоит на втором месте, а по признаку на пятом.

В итоге получим две последовательности рангов:

по признаку ,

по признаку .

Заметим, что в первой строке индекс совпадает с порядковым номером объекта, а во второй, вообще говоря, не совпадает. Итак, в общем случае .

Рассмотрим два “крайних случая”.

1. Пусть ранги по признакам и совпадают при всех значениях индекса . В этом случае ухудшение качества по одному признаку влечет ухудшение качества по другому. Очевидно, признаки связаны: имеет место “полная прямая зависимость”.

2. Пусть ранги по признакам и противоположны в том смысле, что если , то ; если , то ; …., если , то . В этом случае ухудшение качества по одному признаку влечет улучшение по другому. Очевидно, признаки связаны – имеет место “противоположная зависимость”.

На практике чаще будет встречаться промежуточный случай, когда ухудшение качества по одному признаку влечет для некоторых объектов ухудшение, а для других – улучшение качества. Задача состоит в том, чтобы оценить связь между признаками. Для ее решения рассмотрим ранги как возможные значения случайной величины X, а – как возможные значения случайной величины Y. Таким образом, о связи между качественными признаками и можно судить по связи между случайными величинами X и Y, для оценки которой используем коэффициент корреляции. Вычислим выборочный коэффициент корреляции случайных величин X и Y в условных вариантах, учитывая, что каждому рангу , соответствует только один ранг :

приняв в качестве условных вариант отклонения , . Учитывая, кроме того, что среднее значение отклонения равно нулю т.е. , получим более простую формулу вычисления выборочного коэффициента корреляции: .

Выразим через известные числа – объем выборки и разности рангов . Поскольку средние значения рангов равны между собой, то и следовательно . Несложный подсчет суммы квадратов дает . Отсюда . Таким образом .

Учитывая, что

,

получим: . Аналогично . Следовательно .

Подставив, найденные выражения в формулу для вычисления коэффициента корреляции получим выборочный коэффициент ранговой корреляции Спирмена

.

Приведем свойства выборочного коэффициента корреляции Спирмена.

Свойство 1. Если между качественными признаками A и B имеется “полная прямая зависимость” в том смысле, что ранги объектов совпадают при всех значениях , то выборочный коэффициент ранговой корреляции Спирмена равен единице.

Свойство 2. Если между качественными признаками A и B имеется “противоположная зависимость”, то выборочный коэффициент ранговой корреляции Спирмена равен минус единице.

Свойство 3. Если между качественными признаками A и B нет ни “полной прямой”, ни “противоположной” зависимостей, то коэффициент корреляции Спирмена заключен между и , причем чем ближе к нулю его абсолютная величина, тем зависимость меньше.

Замечание. Если выборка содержит объекты с одинаковым качеством, то каждому из них приписывается ранг, равный среднему арифметическому порядковых номеров объектов. Например, если объекты одинакового качества по признаку A имеют порядковые номера 5 и 6, то их ранги соответственно равны: .

Приведем правило, позволяющее установить значимость или незначимость ранговой корреляции связи.

Правило. Для того чтобы при уровне значимости  проверить нулевую гипотезу о равенстве нулю генерального коэффициента ранговой корреляции Спирмена при конкурирующей гипотезе , надо вычислить критическую точку:

,

где – объем выборки, – выборочный коэффициент ранговой корреляции Спирмена, – критическая точка двусторонней критической области, которую находят по таблице критических точек распределения Стьюдента, по уровню значимости  и числу степеней свободы .

Если – нет оснований отвергнуть нулевую гипотезу. Ранговая корреляционная связь между качественными признаками незначима.

Если – нулевую гипотезу отвергают. Между качественными признаками существует значимая ранговая корреляционная связь.