Статическое моделирование систем

курсовая работа

3.2 Проверка гипотезы о независимости случайных величин при уровне значимости в момент времени

Для проверки гипотезы о независимости двух случайных величин по выборке XX и YY, весь диапазон значений отдельно по каждой переменной разбивается на интервалы, как это делалось при построении гистограммы при применении критерия Пирсона. Затем вычисляется статистика чn и сравнивается с табличным значением статистики (распределения) чІ с (r-1)*(s-1) степенями свободы, где r и s - количество интервалов, на которые разбит диапазон изменения каждой переменной. Так как в нашем случае диапазон изменения каждой переменной разбит на одно и то же число К, то r и s одинаковы. Гипотеза о независимости двух случайных величин отвергается с уровнем значимости б, если чn> чІ.

Для подсчёта статистики необходимо определить количество точек, попавших в каждый интервал по переменной XX, количество точек, попавших в каждый интервал по переменной YY, количество точек, попавших одновременно в интервалы по двум переменным (в соответствующие прямоугольники). Для этого найдём частоты попадания выборочных значений в каждый k-ый интервал по обеим переменным и количество точек, попавших одновременно в оба интервала по двум переменным.

Пусть K - количество интервалов, на которые разбит диапазон изменения каждой переменной. Количество интервалов К вычисляется по правилу Стургерса. Для вычисления используется встроенная функция Mathcad (3.11):

, (3.11)

где n - количество реализаций случайного процесса.

Тогда длину интервала можно вычислить по формуле (3.12):

, (3.12)

где Xmax, Xmin - максимальное и минимальное значение реализации случайного процесса.

Для определения частоты попадания выборочных значений в каждый k-ый интервал по переменной Х воспользуемся формулой (3.13):

, (3.13)

где k=1..K - номер интервала,

uk - точки, лежащие на границе интервала,

n - количество реализаций случайной величины

Сумма частот всех интервалов должна быть равна количеству реализаций случайной функции n, так как все точки функции распределены на K интервалах. Это условие проверяется формулой (3.14).

(3.14)

Частота попадания в последний интервал равна 1. следовательно стоит объединить интервалы.

После объединения крайних интервалов получаем формулу для подсчета частот попадания (3.15), которая также проверяется суммой частот попадания всех интервалов (3.16).

(3.15)

(3.16)

Рассмотрим теперь вторую переменную YY. Максимальное и минимальное значение выборки, количество интервалов в гистограмме, длина интервала определяются аналогично. Частоты попадания выборочных значений в k-ый интервал по переменной YY, определяются формулой (3.17):

, (3.17)

где uyk - точки, лежащие на границе интервала,

n - количество реализаций случайной величины,

k=1..K - номер интервала.

Правильность подсчёта частот попадания также проверяется суммой всех частот попадания:

Крайние интервалы объединяются аналогично переменной XX.

Теперь найдём количество точек, попавших одновременно в оба интервала по двум переменным (3.18):

(3.18)

Преобразуем эту формулу (3.19):

. (3.19)

Сумма точек, попавших одновременно в оба интервала по двум переменным должна быть равна количеству реализаций n:

где k и t - количество интервалов по каждой переменной соответственно.

Все предварительные расчёты для вычисления статистики произведены. Далее необходимо вычислить саму статистику (3.20):

, (3.20)

где K-2 - количество интервалов по каждой переменной после объединения крайних интервалов, - количество точек, попавших в i-ый интервал по переменной XX, - количество точек, попавших в j-ый интервал по переменной YY, - количество точек, попавших одновременно в i-ый и j-ый интервалы по двум переменным.

Для вычисления табличной статистики необходимо высчитать количество степеней свободы (3.21):

н=(r-1)(s-1), (3.21)

где r и s - количество интервалов по каждой переменной, то есть r=s=K-2, так как крайние интервалы были объединены.

Значит, количество степеней свободы вычисляются по формуле:

Табличное значение распределения можно вычислить с помощью специальной функции Mathcad (3.22):

, (3.22)

где б - уровень значимости

Для данных двух случайных процессов XX и YY значение статистики . При этом табличное значение распределения .

Очевидно, что , следовательно, гипотеза о независимости двух случайных величин отвергается.

Делись добром ;)