7.1.4. Доверительные интервалы для параметров нормального распределения
1. Доверительный интервал для неизвестного М(Х)=а при известной дисперсии
Х~N(a;σ); σ – известна;
γ – доверительная вероятность – задана.
- доверительный интервал;
t определяется из равенства ,
где - функция Лапласа (табулирована).
2. Доверительный интервал для неизвестного М(Х)=а при неизвестной дисперсии
Х~N(a;σ); σ – неизвестна; γ – доверительная вероятность. - доверительный интервал,
где S – исправленное среднее квадратическое отклонение;
- определяется по таблице квантилей распределения Стьюдента, α=1- γ – уровень значимости; k=n-1 – число степеней свободы.
3. Доверительный интервал для неизвестного при неизвестном математическом ожидании М(Х).
Х~N(a;σ); a и σ – неизвестны; γ – доверительная вероятность (задана).
доверительный интервал, где
и находятся по таблице , k =n-1 – число степеней свободы.
4. Доверительный интервал для оценки вероятности успеха при большом числе испытаний Бернулли.
Интервальная оценка параметров генеральной лингвистической совокупности.
Одним из важных вопросов квантитативной лингвистики является выявление объективных статистических признаков для отдельных разновидностей языка (стилей, подъязыков, жанров, авторского стиля). Для этого из каждой разновидности языка как генеральной совокупности извлекают выборки, строят доверительные интервалы для параметров каждой выборки с большой надёжностью. Если доверительные интервалы пересекаются, то данный параметр не может являться различительной характеристикой рассматриваемых стилей. В противном случае, параметр принимается за объективную статистическую характеристику различия стилей и жанров.
Задача 4.17 Была сделана попытка разграничить жанры и стили современного украинского языка с помощью частоты употребления в них глагольных словоформ. Извлечено 250 выборок по 500 словоупотреблений в каждой. Для каждого жанра и стиля была вычислена средняя частота глагольных словоупотреблений и исправленное выборочное среднее квадратическое
отклонение S, а также S(). Результаты показаны в таблице:
Таблица2. Статистические характеристики употребления глаголов
в различных стилях современного украинского языка
Жанры и стили современного украинского литературного языка | Количество выборок | S | S() | |
Язык художественной литературы Драма Проза Поэзия | 60 |
90,5 91,2 82,1 |
15,36 13,45 10,44 |
1,98 1,73 1,48 |
Общественно-политическая проза | 60 | 48,0 | 10,55 | 1,35 |
Научно-техническая проза | 50 | 61,7 | 9,92 | 1,40 |
Используя таблицу 2, построить доверительные интервалы для математического ожидания частоты употребления глагольных форм с доверительной вероятностью 0,95 (0,996) для каждого стиля и жанра и сделать вывод о возможности или невозможности обособления данных жанров и стилей с помощью такого статистического параметра, как частота употребления глагольных форм.
Задача 5. В молдавском публицистическом тексте длиной в 200 тыс. словоупотреблений встретилось 31286 глагольных форм. Определить с вероятность 95% доверительные границы вероятности появления во взятом тексте глагольгого словоупотребления.
Решение. Распределение глагольных форм в тексте при большом количестве испытаний можно считать нормальным. Воспользуемся формулой для нахождения доверительного итервала вероятности альтернативного признака А: , где- относительная частота события А,
- абсолютная ошибка;
t определяется из равенства .
.
По таблице значений функции Лапласа находим t=1,96. Тогда доверительный интервал вероятности события А
(0,1564-0,0016; 0,1564+0,0016)
Ответ: вероятность появления глагольного словлупотребления в молдавских публицистических текстах попадает в интервал (0,1548;0,1580) с надёжностью 95%.
- Часть1. Тематический план дисциплины
- Часть 2. Конспекты лекций 8
- Часть 3. Вопросы и задания для практических работ. 79
- Часть 4. Задания для самостоятельной работы 92
- Часть 5. Лабораторные работы 97
- Часть1. Тематический план дисциплины «Основы математической обработки информации»
- Часть 2. Конспекты лекций
- 1.1. Исторические периоды развития математики.
- 1.2. Основы теории множеств
- 1.2.1. Начальные понятия теории множеств.
- 2.1.3. Основные понятия комбинаторики
- 2) Перестановка из n элементов – это размещение из n элементов по n.
- 2.2. Начальные понятия теории вероятностей
- 2.2.2. Определения вероятности событий
- 3.1. Действия над событиями
- 3.2. Вероятность суммы событий
- 3.3. Вероятность произведения событий.
- 3.4. Вычисление вероятности цепочек языковых элементов.
- 3.5. Формула полной вероятности. Формула Байеса.
- 1 H2) Формула полной вероятности.
- 3.6. Теорема Бернулли
- 3.7. Вероятностное моделирование порождения текста.
- 3.8. Предельные теоремы в схеме Бернулли
- 4.1. Случайная величина (св). Начальные понятия.
- 4.2. Функция распределения св (интегральная функция распределения) f(X)
- 4.3. Функция плотности вероятности нсв f(X)
- 4.4. Числовые характеристики св
- 4.5. Законы распределения случайных величин.
- 1) Биномиальный закон распределения.
- 2) Закон Пуассона
- 3) Нормальное распределение (закон Гаусса)
- 6. Вероятность попадания нсв х в заданный промежуток
- 7. Логнормальное распределение
- 5.1. Система двух случайных величин (двумерная св) (1 час)
- 5.1.1. Начальные понятия.
- 5.1.2. Операции над независимыми случайными величинами
- 5.1.3. Числовые характеристики системы двух св
- 5.2. Предельные теоремы теории вероятностей: Закон больших чисел, Центральная предельная теорема и их значение для лингвистического эксперимента.(1 час)
- 5.2.1. Теорема Чебышева для среднего арифметического случайных величин.
- 6.1. Предмет математической статистики. Генеральная и выборочная совокупность.
- 6.2. Статистическое распределение выборки и его графическое изображение
- 6.2.1. Дискретный статистический ряд
- 6.2.2. Интервальный статистический ряд
- 6.3. Числовые характеристики статистического распределения
- Лекция 7. Элементы теории статистических оценок и проверки гипотез.
- 7.1 Статистические оценки параметров распределения и их свойства. Оценка параметров генеральной совокупности по выборке
- 7.1.1. Свойства статистических оценок:
- 7.1.2. Точечные оценки математического ожидания, дисперсии и вероятности.
- 7.1.3. Интервальное оценивание параметров.
- 7.1.4. Доверительные интервалы для параметров нормального распределения
- 7.1.5. Число степеней свободы
- 7.1.7. Определение минимально достаточного объёма выборки в грамматических, фонетико-фонологических и лексикологических исследованиях.
- 7.2. Проверка статистических гипотез. Исследование вероятностных свойств языка и статистики текста с помощью метода гипотез.
- 7.2. Проверка статистических гипотез.
- 7.2.1. Статистические гипотезы.
- 7.2.2. Статистический критерий
- 4.2.3. Принцип проверки статистических гипотез
- 7.2.4. Ошибки при проверке гипотез
- 7.2.5. Проверка лингвистических гипотез с помощью параметрических критериев.
- 7.2.6. Проверка гипотез с помощью непараметрических критериев.
- Часть 3. Вопросы и задания для практических работ.
- I. Элементы комбинаторики.
- Часть 4. Задания для самостоятельной работы
- 1. Графический способ.
- 2. Критерий асимметрии и эксцесса.
- 3. Критерий Колмогорова-Смирнова.
- 4. Критерий Пирсона
- Приложение 1. Значения интегральной функции Лапласа
- Приложение 2. Критические значения ( распределение Пирсона)