6.3. Числовые характеристики статистического распределения
Среднее выборочное – среднее значение выборки
Выборочная дисперсия - среднее значение квадрата отклонения значений выборки от выборочного среднего.
Часто используют более простую формулу для вычисления дисперсии:
3. Исправленная выборочная дисперсия
зависит от объёма выборки, является лучшей оценкой дисперсии генеральной совокупности
4. Исправленное выборочное среднее квадратическое отклонение S
Если выборка представлена в виде интервального статистического ряда, то числовые характеристики находят для дискретного статистического ряда, составленного из середин интервалов.
6.4. Числовые характеристики вариационного ряда.
1. Мода Мо* –значение вариационного ряда, имеющее наибольшую частоту.
2. Размах вариаций R =.
3. Медиана Ме* – серединное значение вариационного ряда. Если ряд имеет нечётное число членов, то медиана равна члену ряда, находящемуся посередине. Если ряд имеет чётное число членов, то медиана равна среднему арифметическому двух членов, расположенных в середине вариационного (проранжированного) ряда.
, если n=2k - чётное;
если n=2k+1 - нечётное.
Для расчёта числовых характеристик в случае интервального статистического ряда используется дискретный ряд, вариантами которого являются середины интервалов.
Если мода, медиана и среднее выборочное почти не отличаются друг от друга, то можно говорить о симметричности распределения изучаемого признака.
Задачи.
1) В лингвистическом эксперименте проверялась гипотеза о том, что читательское впечатление «стиля Симонова» связано с какими-то устойчивыми соотношениями в тексте различных языковых элементов. Было взято по 6 проб авторской художественной речи. Каждая проба равнялась 500 знаменательным словам. Пробы выбирались случайно, из разных мест разных произведений и состояли только из слов атора, а не речи персонажей. Получены следующие данные по количеству наречий в каждой пробе: 51,75,69,56,70,43. Необходимо определить числовые характеристики полученной выборки.
2) По данным задачи 1 и задачи 2 вычислите числовые характеристики статистического распределения и вариационного ряда.
В лингвистических исследованиях часто встречаются такие ситуации, когда дать точную количественную характеристику признака невозможно или нецелесообразно. В этом случае используют порядковое или номинативное шкалирование.
Порядковое шкалирование используют в том случае, когда условие эксперимента позвляют нам ранжировать варианты. Например, при составлении частотных словарей опирающихся на малые выборки, пользоваться частотами отдельных слов нецелесообразно, поскольку статистическая ошибка при определении этих частот велика. Поэтому, здесь рассматривается порядок (ранг) расположения отдельных форм или словосочетаний.
Номинативное шкалирование применяют тогда, когда признак лингвистических единиц не может быть оценен количественно и не содержит возможности их ранжирования. Пользуясь определённым правилом, объекты группируются по разным классам так, чтобы внутри класса они были идентичны по измеряемому свойству. Каждому классу даётся наименование и обозначение, обычно числовое. Примером может служить группировка словоформ по семантическим или грамматическим классам.
- Часть1. Тематический план дисциплины
- Часть 2. Конспекты лекций 8
- Часть 3. Вопросы и задания для практических работ. 79
- Часть 4. Задания для самостоятельной работы 92
- Часть 5. Лабораторные работы 97
- Часть1. Тематический план дисциплины «Основы математической обработки информации»
- Часть 2. Конспекты лекций
- 1.1. Исторические периоды развития математики.
- 1.2. Основы теории множеств
- 1.2.1. Начальные понятия теории множеств.
- 2.1.3. Основные понятия комбинаторики
- 2) Перестановка из n элементов – это размещение из n элементов по n.
- 2.2. Начальные понятия теории вероятностей
- 2.2.2. Определения вероятности событий
- 3.1. Действия над событиями
- 3.2. Вероятность суммы событий
- 3.3. Вероятность произведения событий.
- 3.4. Вычисление вероятности цепочек языковых элементов.
- 3.5. Формула полной вероятности. Формула Байеса.
- 1 H2) Формула полной вероятности.
- 3.6. Теорема Бернулли
- 3.7. Вероятностное моделирование порождения текста.
- 3.8. Предельные теоремы в схеме Бернулли
- 4.1. Случайная величина (св). Начальные понятия.
- 4.2. Функция распределения св (интегральная функция распределения) f(X)
- 4.3. Функция плотности вероятности нсв f(X)
- 4.4. Числовые характеристики св
- 4.5. Законы распределения случайных величин.
- 1) Биномиальный закон распределения.
- 2) Закон Пуассона
- 3) Нормальное распределение (закон Гаусса)
- 6. Вероятность попадания нсв х в заданный промежуток
- 7. Логнормальное распределение
- 5.1. Система двух случайных величин (двумерная св) (1 час)
- 5.1.1. Начальные понятия.
- 5.1.2. Операции над независимыми случайными величинами
- 5.1.3. Числовые характеристики системы двух св
- 5.2. Предельные теоремы теории вероятностей: Закон больших чисел, Центральная предельная теорема и их значение для лингвистического эксперимента.(1 час)
- 5.2.1. Теорема Чебышева для среднего арифметического случайных величин.
- 6.1. Предмет математической статистики. Генеральная и выборочная совокупность.
- 6.2. Статистическое распределение выборки и его графическое изображение
- 6.2.1. Дискретный статистический ряд
- 6.2.2. Интервальный статистический ряд
- 6.3. Числовые характеристики статистического распределения
- Лекция 7. Элементы теории статистических оценок и проверки гипотез.
- 7.1 Статистические оценки параметров распределения и их свойства. Оценка параметров генеральной совокупности по выборке
- 7.1.1. Свойства статистических оценок:
- 7.1.2. Точечные оценки математического ожидания, дисперсии и вероятности.
- 7.1.3. Интервальное оценивание параметров.
- 7.1.4. Доверительные интервалы для параметров нормального распределения
- 7.1.5. Число степеней свободы
- 7.1.7. Определение минимально достаточного объёма выборки в грамматических, фонетико-фонологических и лексикологических исследованиях.
- 7.2. Проверка статистических гипотез. Исследование вероятностных свойств языка и статистики текста с помощью метода гипотез.
- 7.2. Проверка статистических гипотез.
- 7.2.1. Статистические гипотезы.
- 7.2.2. Статистический критерий
- 4.2.3. Принцип проверки статистических гипотез
- 7.2.4. Ошибки при проверке гипотез
- 7.2.5. Проверка лингвистических гипотез с помощью параметрических критериев.
- 7.2.6. Проверка гипотез с помощью непараметрических критериев.
- Часть 3. Вопросы и задания для практических работ.
- I. Элементы комбинаторики.
- Часть 4. Задания для самостоятельной работы
- 1. Графический способ.
- 2. Критерий асимметрии и эксцесса.
- 3. Критерий Колмогорова-Смирнова.
- 4. Критерий Пирсона
- Приложение 1. Значения интегральной функции Лапласа
- Приложение 2. Критические значения ( распределение Пирсона)