Регрессионный анализ
Прямая линия на плоскости (в пространстве двух измерений) задается уравнением Y=a+b*X. Переменная Y может быть выражена через константу (a) и угловой коэффициент (b), умноженный на переменную X. Константу иногда называют также свободным членом, а угловой коэффициент - регрессионным или B-коэффициентом. В многомерном варианте, когда имеется более одной независимой переменной, линия регрессии не может быть отображена в двумерном пространстве, однако она также может быть легко оценена. в общем случае, процедуры множественной регрессии будут оценивать параметры линейного уравнения вида:
Y = a + b1*X1 + b2*X2 + ... + bp*Xp
Регрессионные коэффициенты (или B-коэффициенты) представляют независимые вклады каждой независимой переменной в предсказание зависимой переменной. Другими словами, переменная X1, к примеру, коррелирует с переменной Y после учета влияния всех других независимых переменных. Этот тип корреляции называется частной корреляцией.
Линия регрессии выражает наилучшее предсказание зависимой переменной (Y) по независимым переменным (X). Однако, обычно имеется существенный разброс наблюдаемых точек относительно подогнанной прямой на диаграмме рассеяния. Отклонение отдельной точки от линии регрессии (от предсказанного значения) называется остатком. Чем меньше разброс значений остатков около линии регрессии по отношению к общему разбросу значений, тем, очевидно, лучше переменные коррелируют между собой. Например, если связь между переменными X и Y отсутствует, то отношение остаточной изменчивости переменной Y к исходной дисперсии равно 1,0. Если X и Y жестко связаны, то остаточная изменчивость отсутствует, и отношение дисперсий будет равно 0.0. В большинстве случаев отношение будет лежать где-то между этими экстремальными значениями, т.е. между 0 и 1,0. 1,0 минус это отношение называется R-квадратом или коэффициентом детерминации. Это значение непосредственно интерпретируется следующим образом. Если имеется R-квадрат равный 0,4, то изменчивость значений переменной Y около линии регрессии составляет 1-0,4 от исходной дисперсии; другими словами, 40% от исходной изменчивости могут быть объяснены, а 60% остаточной изменчивости остаются необъясненными. В идеале желательно иметь объяснение если не для всей, то хотя бы для большей части исходной изменчивости. Значение R-квадрата является индикатором степени подгонки модели к данным (значение R-квадрата близкое к 1,0 показывает, что модель объясняет почти всю изменчивость соответствующих переменных).
- Статистические методы контроля качества Развитие статистических методов контроля качества. Основные области применения статистических методов управления качеством
- Основные понятия теории вероятности и математической статистики
- Свойства вероятности
- Сложение и вычитание вероятностей
- Теорема сложения вероятностей
- Теорема умножения вероятностей
- Формула полной вероятности
- Дискретные и непрерывные случайные величины
- Характеристики распределения случайных величин
- Пример.Случайная величина имеет следующее распределение
- Сложение средних арифметических и стандартных отклонений
- Законы распределения дискретных случайных величин Законы распределения
- Закон биномиального распределения
- Закон редких событий (Пуассона)
- Геометрическое распределение
- Законы распределения непрерывных случайных величин Закон нормального распределения (Гаусса)
- Закон равной вероятности (равномерного распределения)
- Закон распределения эксцентриситета (Релея)
- Интегральный закон распределения эксцентриситета имеет выражение
- Закон распределения модуля разности
- Основные понятия и определения теории выборок
- Оценка точности вычисления генерального среднего значения по данным выборки
- Оценка точности вычисления стандартного отклонения генеральной совокупности по данным выборки
- Статистическая проверка гипотез
- Значения вероятностей р( λ ) для различных λ
- Далее рассчитывается число степеней свободы
- Плотность распределения z(t) нормированного нормального распределения
- Статистические показатели возможностей процесса
- Зависимость коэффициентов d2иc4от объёма выборкиn.
- Статистическое управление процессами
- Контрольные карты регулирования по количественному признаку
- Простые контрольные карты по количественному признаку
- Контрольные карты с предупреждающими границами регулирования
- Приемочные контрольные карты
- Уровни приемлемых процессов рассчитываются по формуле
- Уровни неприемлемых процессов рассчитываются по формуле
- Контрольные карты кумулятивных сумм
- Контрольные карты регулирования по альтернативному признаку
- Если присутствует несколько потоков процесса, то они должны идентифицироваться и прослеживаться отдельно. Статистические методы приемочного контроля качества продукции
- Виды статистических методов приемочного контроля
- Уровень качества
- Оперативная характеристика плана выборочного контроля
- Планы контроля
- Последовательный план контроля
- Диаграмма Исикавы
- Диаграмма разброса
- Регрессионный анализ