Элементы теории корреляции.
Во многих задачах требуется установить и оценить зависимость изучаемой случайной величины Y от одной или нескольких других величин. Рассмотрим зависимость У от одной случайной (или неслучайной) величины X.
Две случайные величины могут быть связаны либо функциональной зависимостью, либо зависимостью другого рода, называемой статистической, либо быть независимыми.
Строгая функциональная зависимость реализуется редко, так как обе величины или одна из них подвержены еще действию случайных факторов, причем среди них могут быть и общие для обеих величин (под «общими» здесь подразумеваются такие факторы, которые воздействуют и на У и на К). В этом случае возникает статистическая зависимость.
Статистической называют зависимость, при которой изменение одной из величин влечет изменение распределения другой. В частности, статистическая зависимость проявляется в том, что при изменении одной из величин изменяется среднее значение другой; в этом случае статистическую зависимость называют корреляционной.
Приведем пример случайной величины Y, которая не связана с величиной X функционально, а связана корреляционно. Пусть Y — урожай зерна, X—количество удобрений. С одинаковых по площади участков земли при равных количествах внесенных удобрений снимают различный урожай, т. Е. Y не является функцией от X. Это объясняется влиянием случайных факторов (осадки, температура воздуха и др.). Вместе с тем, как показывает опыт, средний урожай является функцией от количества удобрений, т. Е. Y связан с X корреляционной зависимостью.
Пусть изучается система количественных признаков (X, Y). В результате п независимых опытов получены n пар чисел (x1; y1), (х2; у2), . .., (хn; уn).
Найдем по данным наблюдений выборочное уравнение прямой линии среднеквадратичной регрессии . Для определенности будем искать уравнение
Yx=kx + b регрессии Y на X.
Поскольку различные значения х признака X и соответствующие им значения у –признака Y наблюдались по одному разу, то группировать данные нет необходимости. Также нет надобности использовать понятие условной средней, поэтому искомое уравнение можно записать так:
y=kx+b.
Угловой коэффициент прямой линии регрессии Y на X называют выборочным коэффициентом регрессии Y на X и обозначают через рyx; он является оценкой коэффициента регрессии .
Итак, будем искать выборочное уравнение прямой линии регрессии Y на X вида
y= рyx x+b.
Выборочный коэффициент корреляции определяется равенством
,
где х, у — варианты (наблюдавшиеся значения) признаков X и Y; nxy – частота пары вариант (х, у); n— объем выборки (сумма всех частот); - выборочные средние квадратические отклонения; - выборочные средние.
Если величины У и X независимы, то коэффициент корреляции г = 0 ; если г = ±1, то У и X связаны линейной функциональной зависимостью. Отсюда следует, что коэффициент корреляции г измеряет силу (тесноту) линейной связи между Y и X.
Выборочный коэффициент корреляции является оценкой коэффициента корреляции г генеральной совокупности и поэтому также служит для измерения линейной связи между величинами – количественными признаками У и X. Допустим, что выборочный коэффициент корреляции, найденный по выборке, оказался отличным от нуля. Так как выборка отобрана случайно, то отсюда еще нельзя заключить, что коэффициент корреляции генеральной совокупности также отличен от нуля.
Для оценки тесноты линейной корреляционной связи между признаками в выборке служит выборочный коэффициент корреляции. Для оценки тесноты нелинейной корреляционной связи вводят новые сводные характеристики:
- выборочное корреляционное отношение Y к X;
- выборочное корреляционное отношение X к Y.
Выборочным корреляционным отношением Y к X называют: отношение межгруппового среднего квадратического отклонения к общему среднему квадратическому отклонению признака Y:
- Учебная программа дисциплины
- 2. Данные о дисциплине:
- 1.7 Список литературы
- 1.8 Оценка знаний согласно шкале рейтинга
- 1.9 Политика и процедура
- Учебно-методические материалы по дисциплине
- 2.1 Тематический план курса
- 2.2 Тезисы лекционных занятий
- 2.3 Планы практических занятий
- Оценка участия в семинарах
- Содержание домашних заданий
- Оценка домашних заданий
- Содержание заданий для срсп
- Оценка заданий для срсп
- Матрицы и операции над ними.
- Определители и их свойства.
- Системы линейных алгебраических уравнений.
- Векторы. Линейные операции над векторами.
- Нелиейные операции над векторами. Метод координат
- Прямая на плоскости.
- Кривые 2-го порядка.
- Уравнение плоскости.
- Прямая в пространстве. Взаимное расположение прямой и плоскости в пространстве.
- Функция. Действительные числа. Предел функции. Односторонние пределы функции.
- Элементарные функции
- Предел функции. Основные теоремы о пределах
- Замечательные пределы. Сравнение бесконечно малых функций. Широко используются следующие два предела
- Непрерывность функции. Классификация точек разрыва функции.
- Производная. Правила и формулы дифференцирования.
- Производные высших порядков. Дифференциалы первого и высших порядков и их приложения.
- Основные теоремы дифференциального исчисления (Ферма, Ролля, Лагранжа, Коши). Правило Лопиталя. Приложения производной и исследование функции.
- Исследование поведения функции и построение их графиков.
- Выпуклость графика функции. Точки перегиба
- Асимтоты.
- Первообразная. Неопределенный интеграл и его свойства.
- Интегрирование рациональных функций.
- Интегрирование иррациональных и трансцендентных функций.
- Определенный интеграл. Условия существования определенного интеграла. Свойства определенного интеграла.
- Проведя в точках деления a,b прямые, параллельные оси ординат, разобьем криволинейную трапецию на n частичных трапеций. В каждом частичном интервале возьмем точки 1,2,…,т, так что
- Оценка интеграла. Теорема о среднем. Формула Ньютона-Лейбница. Замена переменных и интегрирование по частям в определенном интеграле.
- Приложения определенного интеграла.
- Частные производные и дифференцируемость функций нескольких переменных.
- Частные производные высших порядков
- Лекции 29. Дифференциальные уравнения. Дифференциальные уравнения I порядка.
- Линейные дифференциальные уравнения второго порядка. Линейные дифференциальные уравнения второго порядка с постоянными коэффициентами.
- Числовые ряды.
- Признаки сходимости рядов
- Степенные ряды. Интервал сходимости степенного ряда. Разложение функций в степенные ряды.
- Свойства степенных рядов.
- Двойные и тройные интегралы.
- Векторные и скалярные поля
- Криволинейные интегралы
- Случайные события. Определение вероятности.
- Теоремы сложения и умножения вероятностей. Формула полной вероятности. Формула Байеса.
- Формула Бернулли. Предельные теоремы.
- Случайные величины и их числовые характеристики.
- Задачи математической статистики. Выборочный метод. Эмпирическая функция распределения. Полигон и гистограмма.
- Параметры распределения.
- Точечные и интервальные оценки.
- Элементы теории корреляции.
- Статистическая проверка статистических гипотез.