Биномиальное распределение
Повторные независимые испытания называются испытаниями Бернулли, если при каждом испытании имеется только два возможных исхода и вероятности этих исходов остаются неизменными для всех испытаний.
Пространство элементарных событий для каждого отдельного испытания состоит из двух точек, которые принято называть «успехом» (У) и «неудачей» (Н), а их вероятности обозначать соответственно через р и q, p+q=1. Для n испытаний Бернулли пространство элементарных событий содержит 2n точек или последовательностей из n символов У и Н, где каждая точка представляет возможный исход составного опыта. Можно подсчитать вероятность появления какой-то определенной последовательности. Так как опыты независимы, то такая вероятность получается перемножением вероятностей элементарных событий У и Н, составляющих данную последовательность.
Рассмотрим следующий пример. Пусть пол новорожденного не зависит от пола детей, родившихся в семье до него. Примем для простоты, что соотношение полов 1 : 1, а это значит, что вероятности рождения мальчика или девочки одинаково равны ½. Если в семье двое детей, то можно оценить вероятность и того, что оба ребенка мальчики или девочки или один — мальчик, а другой — девочка. При принятом упрощении вероятности рождения двух мальчиков или двух девочек равны ½*½ =¼, а вероятности рождения сначала девочки, а потом мальчика и наоборот также равны ¼.
Усложним задачу. Пусть в семье пятеро детей и нас интересует вероятность того, что трое из них — мальчики, а двое — девочки, и при этом последовательность, в которой рождались эти дети, неважна. Тогда, исходя из тех же предположений, что и в предыдущем параграфе, вероятность рождения трех мальчиков будет равна (½)3, a девочек— (½)2, а общая вероятность в семье с пятью детьми иметь трех мальчиков и двух девочек равна (½)3(½)2n5, где n5 —число различных последовательностей рождений трех мальчиков и двух девочек в рассматриваемой семье. Чему же равно это число? Очевидно, что оно равно числу сочетаний из пяти по два или по три т.е.
Таким образом, интересующая нас вероятность равна 5/16. Этот результат может быть записан в виде
Как в этой, так и в большом числе других задач представляет интерес лишь число успехов или неудач, достигнутых в последовательности из n испытаний Бернулли, независимо от порядка их следования. В общем случае, если производится серия из n зависимых испытаний, в каждом из которых возможны два исхода с вероятностями p и q=1-p, не меняющимися от испытания к испытанию, и при этом k раз имел место успех, а (n — k) раз — неудача (0 < k < n), то вероятность
Пусть в аудитории имеется 6 светильников и каждый из при включении может перегореть с вероятностью 1/4. Считается, что аудитория непригодна для занятий, если горят меньше чем четыре лампочки. Интерес представляет определение вероятности того, что после включения освещения аудитория будет непригодна для занятий.
Событие, означающее пригодность светильника при включении, обозначим через А. Тогда р(А) = 3/4, a q(A) = 1/4. Аудитория будет пригодна для занятий, если в ней будет гореть 4, 5 или 6 светильников. Вероятность сложного события, состоящего в том, что не менее 4 лампочек будет исправно, может быть подсчитана следующим образом:
Представим себе, что некоторое редкое заболевание встречается у 0,1% данной большой популяции. Из этой популяции случайно выбирают 5000 человек и проверяют на это заболевание. Интерес представляет определение того, каково наиболее вероятное число людей, имеющих это заболевание, и какова вероятность, что оно будет обнаружено именно у этого количества людей.
Условия задачи полностью соответствуют схеме Бернулли, поэтому наиболее вероятное число людей, у которых будет обнаружено заболевание при обследовании 5000 людей, равно n*р= 5000*0,001 = 5. Вероятность того, что именно у 5 человек будет найдено это заболевание, может быть найдена из распределения Бернулли:
Даже на непросвещенный взгляд вычисление интересующего нас результата таких параметрах получить довольно сложно. Мы отложим получение численного значения интересующей нас вероятности и перейдем к рассмотрению нового распределения, которое может быть представлено как приближение биномиального
- Введение
- Раздел I. Введение в теорию вероятностей
- Понятие о случайном событии
- Классическое определение вероятности
- Относительная частота. Статистическое определение вероятности.
- Геометрическая вероятность
- Свойства вероятностей Сложение вероятностей несовместимых событий
- Умножение вероятностей
- Сложение вероятностей совместимых событий
- Формула полной вероятности
- Основные формулы комбинаторики
- Дискретные и непрерывные случайные величины. Понятие «случайные величины»
- Закон распределения случайной величины
- Теоретические распределения вероятностей
- Биномиальное распределение
- Распределение Пуассона
- Числовые характеристики дискретных случайных величин
- Нормальное распределение
- Вопросы для самопроверки:
- Раздел II. Основные понятия и термины биологической статистики Генеральная совокупность и выборка
- Непреднамеренный отбор. Метод последовательных номеров. Случайный и механический методы отбора
- Признаки и показатели
- Правила ранжирования
- Способы группировки первичных данных.
- Схемы (модели) научного исследования
- Однофакторная и многофакторная модель Контрольные и экспериментальные группы
- Метод автоконтроля
- Метод дублирования
- Метод последовательного пополнения групп
- Численность контрольных и экспериментальных групп
- Научные гипотезы
- Направленные гипотезы
- Статистические критерии
- Параметрические критерии
- Непараметрические критерии
- Уровни статистической значимости
- 1 Рода.
- Вопросы для самопроверки
- Раздел III. Статистические методы обработки экспериментальных данных
- Проверка гипотезы о законе распределения
- Χ2 Пирсона
- Описательные статистики Концепция сжатия экспериментальных данных
- Показатели центральной тенденции. Средние.
- Медиана
- Персентили
- Показатели изменчивости
- Стандартизованные данные
- Показатели асимметрии и эксцесса
- Эксцесс
- Работа с качественными переменными Количественная оценка результатов эксперимента.
- Вопросы для самопроверки:
- Сравнение двух независимых групп т критерий Стьюдента
- Критерии согласия для дисперсий
- U критерий Маана-Уитни
- Сравнение качественных признаков Критерий χ2
- Сравнение долей
- Точный тест Фишера
- Сравнение более двух независимых групп Однофакторный дисперсионный анализ Фишера
- Критерий Краскела-Уоллиса
- Сравнение двух зависимых групп Парный т критерий Стьюдента
- Парный критерий т – Вилкоксона
- Критерий x2r Фридмана
- Тест Мак-Немара
- Корреляционный анализ
- Вычисление и интерпретация параметров парной линейной корреляции
- Условия применения и ограничения корреляционно анализа
- Вычисление и интерпретация параметров парной линейной корреляции
- Измерение связи количественных признаков
- Измерение связи порядковых признаков
- Измерение связи номинальных признаков
- Относительный риск. Отношение шансов
- Статистическая оценка надежности параметров парной корреляции
- Частная корреляция
- Факторный анализ
- Вопросы для самопроверки:
- Регрессионный анализ
- Метод наименьших квадратов
- Выбор формы функциональной зависимости
- Применение парного линейного уравнения регрессии
- Корреляционно-регрессионные модели (крм) и их применение в анализе и прогнозе.
- Логистическая регрессия
- Анализ динамических изменений Применение метода наименьших квадратов при исследовании тенденции развития
- Анализ циклических изменений
- Метод обычных средних
- Метод корригирования средних
- Метод отношения фактических данных
- Ошибки, допускаемые при количественной характеристике сезонных колебаний
- Кластерный анализ
- Иерархическое дерево
- Меры расстояния
- Правила объединения или связи
- Метод k средних
- Выбор между параметрическими и непараметрическими тестами: легкая ситуация.
- Выбор между параметрическими и непараметрическими тестами: сложные случаи.
- Выбор между параметрическим и непараметрическим тестом: насколько это на самом деле влияет на результат?
- Одно или двухсторонняя p-оценка?
- Парный или непарный тест?
- Тест Фишера или хи-квадрат?
- Регрессия или корреляция?
- Вопросы для самопроверки:
- Раздел IV. Работа с программой easystatistics Общие сведения о программе EasyStatistics
- Создание новой базы данных
- Работа с файлами
- Копирование и вставка данных
- Работа с фильтрами
- Работа с переменными и строками
- Статистические методы Описательные статистики
- Частотный анализ
- Сравнение независимых выборок
- Сравнение связанных выборок
- Дисперсионный анализ
- Корреляционный анализ
- Множественная регрессия
- Проверка типа распределения эмпирических данных
- Вероятностный калькулятор
- Задания для самостоятельной работы с программой
- Список рекомендуемой литературы
- Граничные (критические) значения 2-критерия, соответствующие разным вероятностям допустимой ошибки и разным степеням свободы
- Критические значения коэффициентов корреляции для различных степеней свободы (n - 2) и разных вероятностей допустимых ошибок