5. Проверка нормальности при помощи вероятностной бумаги
Этот простой графический метод часто используют для первоначальной прикидки, правдоподобно ли предположение о том, что независимая выборка взята из нормального распределения. Эта прикидка осуществляется в буквальном смысле ``на глазок'', поэтому здесь не идет речь о количественных показателях, таких как вероятность ошибки и т.п.
Чтобы пояснить идею этого метода, сформулируем вспомогательное утверждение. Пусть -- функция распределения закона,.
Лемма 1. Рассмотрим отображение , действующее по формуле
где обозначает функцию, обратную к функции распределения стандартного нормального закона. При этом отображении графикпереходит в прямую линию, а графикпереходит в прямую линию.
Доказательство. Достаточно заметить, что. См. по этому поводу также Упражнение3.6на стр..
Предположим, что в нашей выборке все числа различны. Переупорядочим выборку в порядке возрастания:
То, что получается после такого переупорядочения, называют вариационным рядом.
Из Определения 6.1легко вытекает, что в этом случае эмпирическая функция распределения может быть выражена формулой
(54) |
В частности, .
С другой стороны, теорема Гливенко утверждает, что при большом объеме выборки эмпирическая функция распределения близка к теоретической функции распределения. Принимая во внимание Лемму 9.1, заключаем, что если выборкадействительно взята из нормального распределения, то точки
(55) |
должны приблизительно оказаться на одной прямой линии (а именно, на прямой ).
Замечание 9.2
Мы намеренно не включаем в перечень (55) точку, соответствующую, так как, а отображениев точках видане определено.
Таким образом, мы пришли к очень простому глазомерному способупроверки нормальности выборки: наносим на плоскость точки
и смотрим, лежат ли они вблизи какой-либо прямой линии. Если такую прямую можно провести, то по ее чертежу можно грубо оценить значения неизвестных параметров и.
Чтобы было удобнее наносить эти точки, прибегают к так называемой вероятностной бумаге. Вероятностная бумага получается выбором неравномерной шкалы координат вдоль оси ординат. А именно, на расстоянииот оси абсцисс мы ставим пометкудля новой неравномерной шкалы. На вероятностную бумагу (в системе новых координат) наносят точки.
Замечание 9.3
В силу того, что данные наблюдений и измерений, как правило, округлены до некоторого знака, предположение о том, что все различны, нередко нарушается. Это приводит к тому, что в вариационном ряду некоторые соседние значения могут совпадать и формула (54) для выражениячерез вариационный ряд несколько видоизменяется. Но, тем не менее, изложенный выше глазомерныйметодопределения нормальностиостается пригодным.
Замечание 9.4
Мы не используем точку , тем самым теряя некоторую информацию, содержащуюся в выборке. Имея в виду приблизительность этого метода, можно надеяться, что в случае больших выборок, эта потеря не слишком существенна. Отметим, однако, что существуют приемы, позволяющие учитывать и значение. Нетрудно модифицировать этот метод для проверки гипотез о выборках из распределений, не являющих нормальными, но зависящих от неизвестных параметров сдвига-растяжения. Детали можно найти, например, в [13, § 5.1] и [6, § 4].
Пример 9.1
Вернемся к нашему числовому Примеру 6.4и зададимся вопросом, насколько в Примере8.2было обоснованным предположение о нормальности выбороки. Для этого проведем их проверку на нормальность при помощи вероятностной бумаги.
Для выборки , соответствующей содержанию углерода в пробах, чертеж представлен на рисунке3.
Рис. Данные о процентном содержании углерода в пробах |
Для выборки , содержащей значения прочности на разрыв, чертеж представлен на рисунке4.
Рис. Данные о значениях прочности на разрыв |
Видно, что и в том, и в другом случае точки располагаются вблизи некоторой прямой линии. Таким образом, имеются основания для гипотез о нормальности выборок и.
Большое число естественно-научных примеров, при анализе которых используется вероятностная бумага, содержится во второй части книги [12].
- Проверка статистических гипотез
- Статистические гипотезы
- 1. Простые и сложные гипотезы и их проверка
- 2. Критерий согласия Пирсона
- Поведение , когда гипотезаверна.
- Поведение , когда гипотезаневерна.
- Критерий проверки.
- Границы применимости критерия на практике.
- 3. Критерий согласия для сложных гипотез
- 4. О критериях согласия Колмогорова и Смирнова
- 5. Проверка нормальности при помощи вероятностной бумаги
- Статистические критерии.
- [Править] Уровень значимости и мощность.
- [Править] Состоятельность и несмещенность критериев.
- [Править] Некоторые типовые задачи прикладной статистики [править] Статистические данные и прикладная статистика
- [Править] Статистический анализ точности и стабильности технологических процессов и качества продукции
- [Править] Задачи одномерной статистики (статистики случайных величин)
- [Править] Непараметрическое оценивание математического ожидания.
- [Править] Непараметрическое оценивание функции распределения.
- [Править] Таблица 1
- [Править] Проблема исключения промахов.
- [Править] Многомерный статистический анализ
- [Править] Корреляция и регрессия.
- [Править] Дисперсионный анализ.
- [Править] Методы классификации.
- [Править] Дискриминантный анализ.
- [Править] Кластер-анализ.
- [Править] Задачи группировки.
- [Править] Снижение размерности.
- [Править] Статистика случайных процессов и временных рядов
- [Править] Статистика объектов нечисловой природы
- Лабораторная работа №14. Изучение критериев Колмогорова и омега-квадрат
- Лабораторная работа №15. Изучение критерия хи-квадрат Пирсона