logo
Теорія ймовірності-теорія

3. Означення ймовірності. Теореми додавання та множення ймовірностей Теоретичні положення

Порівнювати випадкові події за ступенем можливості їхнього настання можна попередньо пов’язавши кожну подію з певним числом, яке повинно бути тим більше, чим більш можлива подія. Це число називають імовірністю події. Існує декілька означень імовірності. Розглянемо спочатку ці означення.

1. Класичне визначення ймовірності. Нехай зі 100 однакових за зовнішнім виглядом деталей, серед яких 97 стандартних, а інші браковані, беруть навмання одну деталь. Очевидно, що події А та В, які полягають відповідно у тому, що деталь виявиться стандартною і бракованою, не рівноможливі. Подія А більш можлива, більш імовірна, ніж В.

Під імовірністю події розуміють число, яке є характеристикою ступеня можливості настання цієї події. Ймовірність події А позначатимемо Р(А) (від лат. рrobabilitas – “імовірність”).

Події називають рівноможливими, якщо жодна з них не є більш можливою, ніж інша. Наприклад, поява герба чи цифри на верхній поверхні під час кидання монети є рівноможливі події.

Нехай множина результатів випробування складається з п рівноможливих елементарних подій, тобто = {1, 2, …, п}. Нехай події А сприяють k елементарних подій. Не втрачаючи загальності, можна припустити, що події А відповідає множина А = {1, 2, …, k}. Ймовірністю події А називають відношення кількості елементарних подій, які сприяють події А, до загальної кількості всіх рівноможливих несумісних елементарних наслідків випробування, що утворюють повну групу. Тобто

. (1)

Це визначення ймовірності називають класичним.

Отже, для розглянутого на початку цього параграфа прикладу ймовірність того, що вибрана деталь виявиться стандартною,

,

оскільки поява будь-якої із 97 стандартних деталей буде означати виконання події А, чи по іншому, події А сприятиме 97 із загальної кількості 100 варіантів.

З визначення ймовірності випливають такі її властивості.

Властивість 1. Ймовірність випадкової події А є невідємним числом, яке не більше одиниці, тобто

0 Р(А)  1.

Справді, число т випадків, які сприяють будь-якій події, не може бути від’ємним і більшим, ніж їхня загальна кількість п, тобто 0  т п. Поділимо цю нерівність почленно на п, отримаємо 0  т/п  1, або, враховуючи рівність (1), 0 Р(А)  1.

Властивість 2. Ймовірність вірогідної події дорівнює одиниці, тобто Р() = 1.

Справді, якщо подія вірогідна, то кожний можливий наслідок випробування сприяє цій події. В цьому випадку т = п, тобто

Р() = т/п = п/п = 1.

Властивість 3. Ймовірність неможливої події дорівнює нулю, тобто Р(Ø) = 0.

Дійсно, події Ø не сприяє ніяка з подій. Тому т тут буде дорівнювати нулю. Звідси P(Ø) = m/= 0/n = 0.

Властивість 4. Якщо дві події А і В є несумісними, тобто А В =, то ймовірність об’єднаної події С = А В дорівнює сумі ймовірностей цих двох подій, тобто

Р(А В) = Р(А) + Р(В).

Д о в е д е н н я. Нехай несумісні події А та В містять відповідно m та k елементарних подій, тобто А = {і1, і2, …, іт} і В = {j1, j2, …, jk}. Тоді за формулою (1) імовірності цих подій будуть Р(А) = т/п, Р(D) = k/n. Подія С А  В = {і1, …, іт, j1, …, jk} містить m + k елементарних подій, оскільки за умовою теореми серед елементарних подій {і1, …, іт} немає жодної, яка б входила в набір {j1, …, jk}, тому, згідно з формулою (1) її ймовірність

.

Нехай, наприклад, у корзині є 15 троянд – 5 білого, 3 жовтого і 7 червоного кольору. Потрібно знайти ймовірність того, що навмання вийнята з корзини троянда не буде жовтою.

До розв’язування цієї задачі можна підійти з двох сторін. Оскільки всіх троянд 15, а не жовтих (білих або червоних) – 12, то шукана ймовірність, згідно її класичного визначення, дорівнює P(A) = P(Б або Ч) = 12/15 = 0,8. Тобто, ймовірність того, що вибрана троянда буде білого або червоного кольору, дорівнює 0,8.

Тепер підійдемо до знаходження шуканої ймовірності дещо з іншого боку. Знайдемо спочатку ймовірність того, що навмання вийнята з корзини троянда буде білого кольору. Згідно класичного визначення ця ймовірність дорівнює Р(Б) = 5/15 = 1/3. Ймовірність того, що навмання вийнята з корзини троянда буде червоною, дорівнює Р(Ч) = 7/15. А тепер для знаходження ймовірності того, що навмання вийнята з корзини троянда буде білого або кольору, оскільки ці події є несумісними, можна використати властивість 4. Згідно цієї властивості шукана ймовірність дорівнює P(A) = P(Б або Ч) = = 1/3 + 7/15 = 12/15 = 0,8. Знайдена обома способами ймовірність співпадає, що ще раз підтверджує правильність властивості 4.

2. Статистична ймовірність. Класичне визначення ймовірності передбачає, що кількість можливих наслідків випробування скінченна. Однак на практиці досить часто трапляються випробування, кількість елементарних подій яких нескінченна. В таких випадках застосувати класичне визначення неможливо. Це свідчить про обмеженість класичного визначення ймовірності. Крім того, дуже часто неможливо зобразити результат випробування у вигляді сукупності елементарних подій. Ще важче обгрунтувати рівноможливість елементарних подій. Переважно про рівноможливість елементарних наслідків випробування роблять висновки із міркувань симетрії (припускають, що, наприклад, монета чи гральний кубик виготовлені з однорідного матеріалу, мають форму відповідно до кола і правильного багатогранника тощо). Проте задачі, в яких можна виходити з міркувань симетрії, на практиці трапляються зрідка. Наприклад, з міркувань симетрії не можна визначити ймовірність виробництва нестандартної деталі чи ймовірність того, що чоловік носить взуття деякого заданого розміру тощо. З цієї причини поряд з класичним визначенням ймовірності використовують інші способи, зокрема, визначають невідому ймовірність випадкової події за допомогою її наближеної оцінки.

Припустимо, що ми провели п незалежних випробувань, і подія А в цих випробуваннях зявилася т разів. Відношення т/п називають відносною частотою події А в заданій серії випробувань. З визначення ймовірності і відносної частоти випливає таке: визначення ймовірності не потребує, щоб випробування проводили насправді, визначення ж відносної частоти передбачає, щоб випробування були виконані насправді. Іншими словами, ймовірність обчислюють до досліду, а відносну частоту – після досліду.

Якщо відносна частота події А в різних дослідах змінюється мало (тим менше, чим більше виконано дослідів), коливаючись навколо деякого сталого числа, то цю подію називають статистично стійкою. За наближене значення ймовірності статистично стійкої події А приймають її відносну частоту, тобто

Р(А) = т/п. (2)

Це визначення називають статистичним визначенням ймовірності.

Імовірність події А, визначена формулою (2), задовольняє властивості 1-3.

Відносна частота довільної події, імовірність якої можна обчислити, користуючись її класичним визначенням, коливається біля цієї ймовірності. Тому статистичне визначення ймовірності є узагальненням класичного.

Нехай, наприклад, за даними статистики відносну частоту народження дівчаток в області за кожен місяць року від січня до грудня характеризують такі числа: 0,486; 0,489; 0,490; 0,471; 0,478; 0,482; 0,472; 0,484; 0,485; 0,491; 0,482; 0,473.

Відносна частота коливається біля числа 0,482, яке можна прийняти за наближене значення ймовірності народження дівчаток.

3. Геометрична ймовірність. Щоб усунути недоліки класичного визначення ймовірності, описані вище (такі ситуації виникають, наприклад, у разі неперервної множини елементарних подій ), вводять геометричну ймовірність – ймовірність потрапляння точки в область (відрізок, частину площини тощо).

Розглянемо випробування, яке полягає у киданні навмання точки на відрізок [0, L]. Припустимо, що всі уявні положення точки “однаково можливі”. Простір елементарних подій для такого випробування – відрізок = [0, L]. Аналогом рівноможливості елементарних подій у цьому випадку є рівномірна густина розподілу точок (елементарних подій) на заданому відрізку [0, L]. Однак тут уже не можна побудувати ймовірнісну модель випробування, приписавши ймовірності лише його окремим можливим наслідкам, як це було у випадку експериментів зі скінченною кількістю елементарних подій. Якщо за аналогією з дискретним випадком задавати для кожного ймовірності Р(), то, оскільки всі “однаково можливі”, отримаємо Р() = 0 для кожного . Виявляється, вихід із такої ситуації можна відшукати в тому, щоб приписувати ймовірності лише деяким множинам елементарних подій, причому ймовірності потрібно задавати погоджено. Наприклад, природно вважати, що ймовірності потраплянь в інтервали [0, L/2] і [L/2, L] повинні бути однаковими (і, отже, кожна з них дорівнює 1/2); ймовірність потрапляння у відрізок [0, L/2] повинна бути більшою, ніж імовірність потрапляння у відрізок [0, L/3] і т.д.

Крім того, якщо множинам А і В приписано ймовірності, то бажано, щоб множинам АВ, А+В, ,також були приписані ймовірності.

Нехай відрізок [a, b] є частиною відрізка [0, L], тобто [a, b]  [0, L]. На відрізок [0, L] навмання поставлено точку. Це означає виконання таких припущень: поставлена точка може опинитися у довільній точці відрізка [0, L]. Ймовірність потрапляння точки на відрізок [a, b] пропорційна до довжини цього відрізка і не залежить від його розміщення щодо відрізка [0, L]. За цими припущеннями ймовірністю події А, яка полягає у потраплянні точки на відрізок [a, b] називають відношення довжини відрізка [a, b] до довжини відрізка [0, L], тобто

Р(А) =

Проаналізуємо тепер загальний випадок. Розглянемо випробування, простір рівноможливих елементарних подій якого є областю в п-вимірному координатному просторі (приклад такого випробування: точку кидають навмання в область ). Припустимо, що область має міру т() (у випадку п = 2 – площу, у тривимірному випадку – об’єм і т.д.). Елементарні події, з яких складається подія А, утворюють деяку область А, причому . Тодіймовірністю події А називають відношення міри області сприятливих подій А () до міри області всіх можливих наслідків експерименту Ω (т()), тобто

Це визначення є геометричним визначенням ймовірності.

Припущення про рівноможливість наслідків випробування означає, що ймовірність потрапляння в область А залежить лише від міри т(А) і не залежить від структури множини А. Іншими словами, якщо в області взяти будь-які дві області однакової міри, то ймовірності потрапляння в такі підмножини однакові.

Означена так ймовірність події А задовольняє всі розглянуті властивості ймовірностей.

Нехай, наприклад, на площині накреслені два концентричні кола, радіуси яких 3 і 5 см відповідно. Визначимо ймовірність того, що точка, кинута навмання у великий круг, потрапить у кільце, утворене побудованими колами. Припустимо, що ймовірність потрапляння точки в плоску фігуру пропорційна до площі цієї фігури і не залежить від її розміщення щодо великого круга. Тоді площа великого круга (фігури ) S =52=25. Площа кільця (фігури А) SA = (52-32)=16. Шукана ймовірність Р(А) = 16/(25) = 0,64.

4. Аксіоматична побудова теорії ймовірностей. Класичне, статистичне і геометричне визначення ймовірності, які ми розглянули, використовуть під час моделювання окремих типів випадкових випробувань. З розвитком теорії ймовірності як науки перед вченими постало завдання розробити таку математичну модель цієї теорії, у якій були б відображені всі можливі випадкові експерименти. Адже такі сформовані математичні науки, як геометрія, теорія множин, теоретична механіка та інші, побудовані аксіоматично. Фундамент кожної з них – це низка аксіом, які є узагальненням багатовікового досвіду людини, а подальшу науку формують на підставі чітких логічних доведень без звертання до наочних зображень.

Саме такі вимоги до побудови теорії ймовірностей були на початку ХХ ст., коли внаслідок розширення області застосування цієї теорії виникла потреба систематично вивчати основні визначення теорії ймовірностей і з’ясовувати умови використання висновків і результатів.

Розлянемо аксіоматичну побудову теорії ймовірностей. У системі аксіом Колмогорова неозначеними поняттями є елементарна подія і ймовірність. Нехай простір елементарних подій деякого стохастичного випробування. Припустимо, що F – деяка система підмножин множини . Систему F називають алгеброю, якщо виконуються такі умови:

А1) F;

А2) якщо А F, то = \А F;

А3) з того, що Аі F, І = 1, 2, … випливає, що Аі F.

Множини з F у цьому випадку називають випадковими подіями.

З умов А1, А2, А3, які визначають -алгебру, випливає таке: якщо Аі F, і = 1, 2, …, то Аі F. Отже, з множинами, що входять в F, можна виконувати будь-які операції: об’єднання, переріз, відшукання доповнення, і кожного разу будемо отримувати множини з тієї ж F. Для наочності зіставимо цю властивість із властивістю дійсних чисел: виконуючи з ними дії додавання, множення тощо, завжди отримуємо в результаті дійсні числа.

Припустимо, що кожній випадковій події А (множині з F) поставлено у відповідність число Р(А) (ймовірність випадкової події А), яке має такі властивості:

Р1) Р(А)  0 для кожного А є F;

Р2) Р() = 1;

Р3) якщо {Ai} (i = 1, 2, …) – послідовність попарно несумісних подій, тобто Ai Aj =  (i j), то

Р(Аі) = Р(Аі).

Твердження А1, А2, А3, Р1, Р2, Р3 і утворюють систему аксіом теорії ймовірностей. Зауважимо, що аксіоми Р1 і Р3 означають, що функція Р(А) множини А, визначена на F, є мірою, яка задовольняє додаткову умову Р() = 1. Таку міру називають ймовірнісною мірою. Трійку (, F, Р), де F є -алгеброю підмножин з , а Р() – ймовірнісна міра на F, називають ймовірнісним простором. Кажуть, що побудована ймовірнісна модель експерименту, якщо побудовано ймовірнісний простір (, F, Р), тобто вказано простір елементарних подій , -алгебра F випадкових подій і визначена ймовірнісна міра Р() на F.

Розглянемо, наприклад, стохастичний експеримент зі скінченною кількістю однаково можливих елементарних подій = {1, 2, …, п}. Як F візьмемо -алгебру всіх підмножин із . Приймемо Р(А) = т/п, де т – кількість елементарних подій, які входять в А. Тоді всі твердження А1, А2, А3, Р1, Р2, Р3 виконані. Отже, (, F, Р) – ймовірнісна модель розглянутого випробування.

Цей приклад свідчить, що запропонована система аксіом несуперечлива, оскільки є реальні об’єкти, які задовольяють її. Крім того, потрібно сказати, що описана система аксіом є неповною. Це випливає хоча б з того, що для одного і того ж простору елементарних подій імовірності на множині F можна вибирати різними способами. Наприклад, якщо взяти випробування, яке полягає у підкиданні грального кубика і визначенні ймовірності кількості очок, які випадуть на його верхній грані, то простір елементарних подій буде складатися з шести елементів = {1, 2, 3, 4, 5, 6}. У випадку однорідності й симетричності кубика всі ці елементарні події рівноможливі і їхні ймовірності однакові Р(і) = 1/6 (1 і  6). Коли кубик неоднорідний чи несиметричний, то ймовірності всіх цих елементарних подій не будуть однаковими. Тому неповнота системи розглянутих аксіом не є свідченням їхнього невдалого вибору, а є необхідністю.

Властивості ймовірності. Використовуючи аксіоми А1, А2, А3, Р1, Р2, Р3, визначимо низку важливих властивостей імовірності.

Теорема 1. Ймовірність події, протилежної до події А,

Р=1 – Р(А). (3)

Справді, оскільки А = , А = , то за аксіомою Р3

Р(А) + Р= Р().

Тому Р=1 – Р(А). Теорему доведено.

Наслідок 1. Ймовірність неможливої події

Р() = 0.

Справді, формула (3) справджується для кожної випадкової події А із F і, зокрема, для А=. Тоді

Р() = Р() = 1 –Р() = 0,

оскільки з Р2 маємо Р() = 1.

Теорема 2. Нехай А і В – випадкові події, такі, що А В. Тоді

Р(В\А) = Р(В) – Р(А). (4)

Д о в е д е н н я. Оскільки А В, то

В = А (В\А),

причому А (В\А) = . Тому за аксіомою Р3

Р(В) = Р(А) + Р(В\А),

а звідси випливає рівність (4).

Наслідок 2. Якщо А В, то

Р(А)  Р(В).

Справді, за аксіомою Р1 маємо Р(В\А)  0. Тоді з рівності (4) отримуємо Р(В)  Р(А).

Наслідок 3. Для кожної випадкової події А

Р(А)  1.

Справді, для кожної випадкової події А А  . Тому

Р(А) Р() = 1.

Теорема 3. Нехай А і В випадкові події. Тоді

Р(АВ) = Р(А) + Р(В) – Р(АВ). (5)

Цю теорему називають теоремою додавання. Для її доведення зазначимо, що множину АВ можна зобразити у вигляді об’єднання трьох множин, які попарно не перерізаються:

АВ = (А\АВ)  (В\АВ)  (АВ).

Тому за аксіомою Р3 і теоремою 2

Р(АВ) = Р(А\(АВ)) + Р(В\(АВ)) + Р(АВ) =

= Р(А) – Р(АВ) + Р(В) – Р(АВ) + Р(АВ) =

= Р(А) + Р(В) – Р(АВ).

Розглянемо, для прикладу, таку задачу. Є дві групи студентів по 10 осіб у кожній. Причому в першій групі 8 хлопців і 2 дівчини, а в другій – 5 хлопців і 5 дівчат. Для чергування з кожної групи навмання вибирають по одній особі. Знайти ймовірність того, що принаймні один з чергових буде хлопець.

Позначимо буквою А подію, яка полягає у тому, що з першої групи вибрали хлопця, а буквою В, – що з другої групи вибрали також хлопця. Ймовірність того, що з першої або другої групи вибрали хлопця, тобто шукану ймовірність, можна знайти за формулою (5). Добуток подій АВ означає, що як з першої, так і з другої групи вибрали хлопця. Ймовірність цієї події знайдемо за класичним її визначенням. . Оскільки з кожним навмання вибраним студентом із першої групи ми могли вибрати будь-якого студента з другої групи, то за правилом множення. Але вибрали саме двох хлопців. Тому знову, скориставшись правилом множення, отримаємо. Тобто. Таким чином шукана ймовірністьдорівнює

.

Із (5) легко вивести формулу додавання для трьох подій:

Р(А1А2А3) = Р(А1) + Р(А2) + Р(А3) – Р(А1А2) -

Р(А1А3) – Р(А2А3) + Р(А1А2А3). (6)

Узагальнення формул (5) і (6) для довільного числа подій дає така теорема.

Теорема 4. Нехай А1, А2, …, Ап – випадкові події. Тоді

Р(Аі) = Р(Аі) - + (7)

Довести цю теорему можна, наприклад, методом математичної індукції.

5. Умовна ймовірність та теорема множення ймовірностей. Нехай заданий імовірнісний простір і подіїНехай в умовах проведення експерименту, в якому ми спостерігали за подієюА, стало відомо, що відбулася подія В. В результаті цього ми спостерігаємо не всі елементарні події простору елементарних подій Ω, а лише ті, які породжують подію В. В цій ситуації, коли ми спостерігаємо за подією , то реально спостерігаємо. Ми прийшли до поняття умовної ймовірності.

Ймовірність здійснення події А за умови, що подія В відбулася, називають умовною ймовірністю події А і позначають Р(А/В) або .

Властивості умовної ймовірності.

В1) ;

В2) P/B) = 0;

В3) Якщо події інесумісні, тобтоØ, то.

В4) .

Тобто умовна ймовірність має всі властивості безумовної.

Теорема 5. Ймовірність перетину подій А та В дорівнює добутку ймовірності однієї з подій на умовну ймовірність другої за умови, що перша подія відбулася

(8)

Цю теорему називають теоремою множення ймовірностей. Для її доведення припустимо, що множина А, яка відповідає події А, містить п+т рівноможливих елементарних подій , а множина В, яка відповідає події В, містить рівноможливих елементарних подій . Усіх можливих наслідків , а подіїА∙В сприятиме т рівноможливих елементарних подій . Тому за класичним визначенням ймовірності , а,. Тому, що і треба було довести.

На підставі цієї теореми умовну ймовірність події А за умови, що подія В відбулася можна обчислити за формулою

(9)

Використовуючи цю теорему можна показати, що для довільної кількості подій справедлива формула

. (10)

Нехай, наприклад, у корзині є 10 троянд – 7 білого і 3 червоного кольору. Навмання одну за одною з корзини виймають три троянди. Яка ймовірність того, що всі вони будуть білого кольору ?

Розв’язати цю задачу можна двома способами. Спочатку розв’яжемо її, використавши формули комбінаторики. Оскільки ми могли вибрати будь-які три троянди з усіх десяти, а вибрали їх точно із білих, яких є сім, і порядок вибору не має значення, то шукана ймовірність дорівнює

.

Однак, для знаходження шуканої ймовірності можна скористатися наслідком теореми 5, а саме формулою (10). Позначимо подію, яка означає, що заі-им разом ми вибрали троянду білого кольору. Очевидно, що події є залежними. Тому

.

Однакові результати в обох випадках підтверджують правильність використаних формул.

Випадкові події А та В називаються залежними, якщо ймовірність появи однієї з них залежить від появи чи не появи іншої події.

Припустимо, що подія В відбулася. Подія А називається незалежною від події В, якщо поява події А не залежить від появи чи непояви події В. Тоді Р(А/В)=Р(А) при умові, що Р(В)>0.

Події А і В називаються незалежними, якщо ймовірність появи однієї з них не залежить від появи чи непояви іншої події. Для незалежних подій справджується формула

Властивості незалежних подій.

1) Достовірна і неможлива події незалежні від будь-якої події.

2) Якщо А і В незалежні події, то незалежними будуть такі пари подій і В; А і ; і .

3) Нехай А і В та А і С незалежні події, а В і С несумісні, то незалежними будуть А і (В∙С).

Якщо подій більше як дві то для них вводять ще одне поняття. Події називаютьсянезалежними в сукупності, якщо

для довільного набору з подій.

Якщо події є незалежними в сукупності, то ймовірність настання події А, що полягає у появи хоча б однієї з цих подій дорівнює

. (11)

Тобто, якщо , то, деЯкщо подіїмають однакову ймовірністьр, то ймовірність здійснення принаймні однієї з них дорівнює , де.