45. Выбор формы зависимости между переменными. Метод наименьших квадратов
Одна из наиболее общих задач статистики состоит в определении формы и оценивании связи между переменными Х и Y (если такая связь существует). Если имеется n пар наблюдений над такими переменными, то наблюдения можно представить точками на плоскости, получая так называемую диаграмму (или поле) рассеяния. Затем можно постараться подобрать некоторую гладкую кривую таким образом, чтобы она располагалась как можно «ближе» к этим точкам. Особенность задачи состоит в том, чтобы наличие случайных возмущений делает бесполезным подбор такой функции, которая точно описывала бы опытные значения, т.е. график искомой функции не должен обязательно проходить через все точки диаграммы рассеяния. Другими словами, требуется как можно точнее отразить общую тенденцию зависимости Y от Х, сглаживая при этом случайные возмущения.
Для решения поставленной задачи часто применяется метод наименьших квадратов. Этот метод дает возможность при заданном виде зависимости переменных выбрать ее параметры (коэффициенты) так, чтобы получаемая кривая в некотором смысле наилучшим образом отображала экспериментальные данные.
Весьма часто вопрос о типе зависимости между переменными Х и Y решается по внешнему виду поля рассеяния. Например, экспериментальные точки, изображенные на первом из двух представленных ниже рисунков, явно наводит на мысль о линейной зависимости вида , где и b – некоторые постоянные величины, – случайная переменная, характеризующая отклонение от теоретической кривой. Квадратичная зависимость, изображенная на втором рисунке, хорошо может быть представлена многочленом второй степени .
|
|
Предположим, что исходя из некоторых соображений, выбран вид зависимости , где – неизвестные параметры, – случайная переменная, характеризующая отклонение от теоретической кривой. Требуется так выбрать параметры , чтобы кривая «наилучшим» образом отображала зависимость, полученную в опыте.
Метод наименьших квадратов выбора сглаживающей кривой состоит в том, чтобы сумма квадратов отклонений экспериментальных точек от сглаживающей кривой обращалась в минимум. Другими словами, требуется выбрать параметры так, чтобы функция
достигала минимума.
Если функция имеет частные производные по всем параметрам , то необходимое условие минимума функции представляет собой систему уравнений с m неизвестными:
- Бийский технологический институт (филиал)
- Теория вероятностей и математическая статистика
- Введение
- События. Классификация событий. Классическое определение вероятности
- Статистическое определение вероятности
- Геометрическая вероятность
- Контрольные вопросы
- Контрольные задания
- 4. Операции над событиями. Соотношения между событиями
- 5.Теорема сложения вероятностей
- 6. Теорема умножения вероятностей
- Контрольные вопросы
- Контрольные задания
- 7. Формула полной вероятности
- 8. Теорема гипотез (формула Бейеса)
- Контрольные вопросы
- Контрольные задания
- Литература
- 9. Повторение опытов. Формула Бернулли
- 10. Локальная формула Муавра-Лапласа. Формула Пуассона
- 11. Интегральная формула Муавра-Лапласа. Вероятность отклонения частоты события от его вероятности в n независимых испытаниях
- Контрольные вопросы
- Контрольные задания
- Литература
- 12. Понятие случайной величины. Ряд распределения. Многоугольник распределения
- 13. Функция распределения. Вероятность попадания непрерывной случайной величины в заданный интервал
- Контрольные вопросы
- Контрольные задания
- 14. Плотность распределения
- Контрольные вопросы
- Контрольные задания
- 15. Числовые характеристики случайных величин. Математическое ожидание и его свойства
- Свойства математического ожидания
- 16. Дисперсия и ее свойства. Среднее квадратическое отклонение
- 17. Моменты распределения случайной величины
- Контрольные вопросы
- Контрольные задания
- 18. Типы распределений дискретных случайных величин
- Биномиальное распределение
- 18.2 Гипергеометрическое распределение
- 18.3 Геометрическое распределение
- 4. Распределение Пуассона
- Контрольные вопросы
- Контрольные задания
- 19. Типы распределений непрерывных случайных величин
- 19.1 Равномерное распределение
- 19.2 Показательное распределение
- 20. Нормальный закон распределения
- 21. Вероятность попадания нормально распределенной случайной величины в заданный интервал. Правило трёх сигма
- Контрольные вопросы
- Контрольные задания
- Литература
- 22. Понятие системы случайных величин
- 23. Закон распределения вероятностей дискретной двумерной случайной величины
- Контрольные вопросы
- 24. Функция распределения двух случайных величин. Вероятность попадания случайной величины в полуполосу и прямоугольник
- 25. Плотность распределения системы двух случайных величин. Законы распределения отдельных величин, входящих в систему
- 26. Условные законы распределения
- Контрольные вопросы
- 27. Зависимые и независимые случайные величины
- 28. Числовые характеристики составляющих системы двух случайных величин. Условное математическое ожидание
- 29. Корреляционный момент. Коэффициент корреляции
- 30. Коррелированность и зависимость случайных величин
- Если величины независимы, то они некоррелированы.
- 31. Линейная регрессия. Прямые линии среднеквадратической регрессии
- Контрольные вопросы
- Контрольные задания
- Литература
- 32. Закон больших чисел
- 33. Центральная предельная теорема
- Контрольные вопросы
- Контрольные задания
- Литература
- Математическая статистика
- 34. Понятие о выборочном методе. Генеральная и выборочная совокупность
- 35. Статистические данные и их представление
- 36. Статистические аналоги теоретических законов распределения
- 36.1 Эмпирическая функция распределения
- 36.2 Полигон и гистограмма
- Контрольные вопросы
- Контрольные задания
- Литература
- 37. Точечное оценивание параметров распределения
- 38. Свойства статистических оценок
- Контрольные вопросы
- Контрольные задания
- 39. Интервальное оценивание параметров распределения
- 40. Интервальное оценивание параметров нормального распределения
- 40.1 Интервальная оценка математического ожидания нормального распределения при известной дисперсии
- 40.2 Интервальная оценка математического ожидания нормального распределения при неизвестной дисперсии
- Контрольные вопросы
- Контрольные задания
- Литература
- 41. Статистические гипотезы
- 42. Критерии проверки гипотез
- Контрольные вопросы
- Контрольные задания
- 43.Критерий согласия Пирсона «Хи-квадрат» ( )
- Контрольные вопросы
- Контрольные задания
- Литература
- 44. Элементы теории корреляции. Задачи корреляционного анализа
- 45. Выбор формы зависимости между переменными. Метод наименьших квадратов
- Контрольные вопросы
- 46. Коэффициент корреляции и проверка его значимости. Линейная регрессия и прогноз
- Контрольные вопросы
- Контрольные задания
- Литература
- Глоссарий