logo
Учебн

7.3. Ранговый коэффициент корреляции

В ряде случаев, когда необходимо измерить степень изменчивости между варьирующими величинами Х и Y, связанными друг с другом общим направлением изменчивости, можно воспользоваться непараметрическим, так называемым ранговым методом. В отличие от описанного выше способа, когда при вычислении коэффициента корреляции варианты располагаются в ряд как попало, ранговый метод требует ранжирования вариант, т.е. распределения их в возрастающем или убывающем порядке, так, чтобы каждая варианта занимала в каждом строю свое место.

В основу этого метода положены весьма простые соображения. Чтобы установить, имеется ли связь между признаками Х и У, необходимо расположить цифровой материал в возрастающем или убывающем порядке.

Обозначив ранжированные значения величин Х и У порядковыми числами натурального ряда, получим полное совпадение этих чисел друг с другом по абсолютной величине и разница между ними будет равняться нулю. Если же полного совпадения между порядковыми числами вариант (назовем их рангами) не окажется, то разность между ними не превратится в нуль, и по величине этой разности можно будет судить о степени зависимости между Х и У. Существо метода, сводится к расчету рангов, по которым и вычисляется коэффициент ранговой корреляции, называемый просто ранговым коэффициентом. Этот показатель обозначается греческой буквой ро () и определяется по формуле Ч.Спирмена (1904).

(7.6)

где Σ- знак суммирования,d– разность между рангами сопряженных рядов Х и У,n– объем выборки, или число парных наблюдений.

Если ранги рядов по абсолютной величине полностью совпадают друг с другом то и ранговый коэффициент равен единице, что может быть только при полной, функциональной зависимости между переменными Х и у. Если же величины Х и Yизменяются совершенно независимо одна от другой, то зависимость (7.6) равна нулю. Таким образом, как и коэффициент корреляции, ранговый коэффициент изменяется в пределах от нуля до единицы, он выражается в долях единицы и сопровождается всегда одним знаком – либо плюс (при положительной корреляции), либо минус (при отрицательной корреляции) между переменными Х и у.

Ошибка рангового коэффициента вычисляется по следующей формуле :

(7.7)

Расчет рангов не представляет никаких затруднений, если варианты не повторяются. Однако в практике таких случаев, как правило, не встречается. Обычно, значения вариант в большем или меньшем числе повторяются и необходимо определять средние арифметические из этих чисел. Например, имеется следующий ряд ранжированных значений

2,4,5,6,6,8,9.

Если бы варианта 6 не повторялась, ранги этих значений были бы следующими

1,2,3,4,5,6,7,

но так как шестерка в этом ряду повторяется дважды, то и ранг ее независимо от местоположения один и тот же – это средняя арифметическая из соответствующих чисел натурального ряда (4+5):2=4,5. Методику вычисления рангового коэффициента легче усвоить из соответствующего примера. Изменение затрат в зависимости от объема выпуска продукции, будем ранжировать варианты по ряду Х, т.е. расположим значения объема в возрастающем порядке и определим их ранги. Для удобства порядковые числа вариант запишем в первом столбце расчетной таблицы.

Таблица 7.4. Расчет затрат и объема выпуска продукции

Номера по порядку

Объем выпуска продукции

Затра-ты Y

Ранги

d=x-y

d2=(x-y)2

Номера по порядку

Затраты

Объем выпуска продук-ции

Затра-ты

Значения

Ранги

1

17,7

74

1

3

-2,0

4,0

1

70

1

2

18

70

2,5

1

+1,5

2,25

2

72

2

3

18

80

2,5

6,5

-4,0

16,00

3

74

3

4

19

72

4,5

2

+2,5

6,25

4

76

4

5

19

77

4,5

5

-0,5

0,25

5

77

5

6

20

76

6

4

+2,0

4,00

6

80

6,5

7

21

89

7

9

-2,00

4,00

7

80

6,5

8

22

80

8

6,5

+1,5

2,25

8

86

8

9

30

86

9

8

+1,0

1,0

9

89

9

Сумма

40,00

Если бы отдельные варианты не повторялись, их рангами были бы порядковые числа. Но так как некоторые варианты повторяются, например варианты 18 и 19 в ряду Х, то рангами их будут средние арифметические из соответствующих порядковых чисел. Так, для варианты 18 ранг определяется как полусумма порядковых чисел 2 и 3, т.е. (2+3):2=2,5. Для следующей варианты 19 ранг выражается полусуммой (4+5):2=4.5. Таким же образом рассчитываются ранги и по ряду У, как это показано в правой стороне таб-. лице 7.3, и заносятся эти ранги на присущие им в общем строю места. Когда эта наиболее ответственная работа проделана, остается взять разность между рангами, возвести ее в квадрат и просуммировать эту графу. Подставляя найденные значения в формулу Спирмена, находим величину рангового коэффициента:

1-=1-=+0,67

Простота расчетов при вычислении рангового коэффициента корреляции позволяет широко использовать его в практической работе биологов. Достоинство этого метода заключается в том, что он в равной мере характеризует степень сопряженности между признаками как в случаях прямолинейной, так и в случаях криволинейной корреляции, что выгодно отличает его от других методов определения связи между признаками.