logo
Нвчально-методичний посібник-теорія ймов

Первинна обробка даних

Статистичне дослідження проводять за таким планом:

    1. Формулюється завдання дослідження і визначається об’єм, місце і час потрібної вибірки.

    2. Збираються необхідні дані та наочно подаються (аналітично, таблично, графічно).

    3. Проводиться обробка зібраних статистичних даних та формулюється висновок.

Нехай маємо вибірку: х1, х2, х3, ..., хn . Об’єм вибірки дорівнює n.

Наприклад, ці числа одержані в результаті підрахунку числа неправильних з’єднань за 1 хв. на телефонній станції чи в результаті вимірювання довжин деталей тощо.

Наступні наші дії залежать від кількості у цій вибірці різних чисел.

І випадок. Якщо різних чисел небагато, то маємо справу з дискретною величиною.

ІІ випадок. Якщо багато – з неперервною.

Відповідно до цього розглядаємо два впадки: дискретний і неперервний.

Дискретний випадок

Перший етап обробки вибірки – це складання варіаційного ряду. Його одержують таким чином: серед усіх значень хі (і=1,2,3,...,n) відбирають всі різні і розміщують у порядку зростання, отримаємо

а1, а2, а3, ..., аm де m n, т=1,2,3, ...

а1а2 а3 ... аm

Другий етап обробки вибірки – це складання дискретної таблиці частоти та відносної частоти.

аі

а1

а2

а3

...

аm

ki

k1

k2

k3

...

km

ni=

n1=

n2=

n3=

...

nm=

де ,

ki– число вимірів в яких спостерігалася ознака аі або частота,

ni= відносні частоти.

Третій етап – графічне зображення дискретної таблиці. Це можна зробити за допомогою стовпцевої діаграми та полігону частот.

Для зображення діаграми будують систему координат, на вісі абсцис відкладають значення аі, а на вісі ординатвідповідні частоти. Потім будуємо точки з координатами (аі, ki) та з них опускаємо перпендикуляри на вісь абсцис. Отримаємо:

Означення. Полігоном частот (відносних частот) називають ламану, відрізки якої з’єднують точки, абсцисами яких є значення варіант аі, а ординатами – відповідні їм частоти ki (відносні частоти ni).

Приклад 1. Результати оцінювання 56 студентів на екзамені з психології представлені такою вибіркою:

3,4,5,4,3,3,5,4,3,5,5,2,3,5,3,5,3,5,4,4,3,3,4,3,4,3,3,5,3,3,4,3,4,3,5,3,4,4,3,5,3,3,5,4,2,5,3,4,2,3,5,4,3,5,3,5.

Значення, що складають вибірку є реалізацією випадкової величини – оцінки на екзамені.

Складемо дискретну таблицю частоти

аі

2

3

4

5

ki

3

24

14

15

ni=

Стовпцева діаграма частоти матиме вигляд

Неперервний випадок

Якщо різних значень у вибірці буде багато, або всі вони будуть різними, то складена таблиця частот не демонструє особливостей вибірки. У цьому випадку поступають таким чином:

Перший етап. Увесь проміжок зміни значень вибірки від найменшого до найбільшого розбивають на інтервали або на класи. Важливе значення має вибір оптимальної величини інтервалу і правильне включення варіант у відповідний інтервал. Для цього в кожному інтервалі слід розрізняти верхню і нижню межу. Розмах всієї вибірки дорівнює . Оптимальна кількість інтервалів (т) як правило лежить у межах від 5 до 15. Нижню межу і‑го інтервалу позначають хі(min), верхню – хі(mаn), де і змінюється від 1 до т.

Величина інтервалу hi є різниця між максимальним та мінімальним значенням ознаки в кожному класі hi= хі(mаn)- хі(min)

Інтервали зазвичай беруть однакової довжини. Вона повинна бути такою, щоб ряд не був громіздкий і щоб у ньому не зникали особливості ознаки, що досліджується. Ширину рівних інтервалів визначають за формулою Стерджеса

де n – об’єм вибірки

або

, де т – кількість класів.

Другий етап. Розбивши ряд на інтервали підраховують число значень із вибірки (частоти), які потрапили в кожний інтервал, а потім відносні частоти. В результаті одержуємо інтервальну таблицю частот.

...

ki

k1

k2

k3

...

km

ni=

n1=

n2=

n3=

...

nm=

де n – об’єм вибірки,

т – число інтервалів,

ki–кількість значень, що потрапила в і-тий інтервал (частота),

ni= – відносна частота попадання в і-тий інтервал,

інтервал,

ширина інтервалу

Третій етап. Графічною ілюстрацією таблиці частоти є гістограма та полігон.

Означення. Гістограмою частот (відносних частот) називають ступінчасту фігуру, що складається з прямокутників основами яких є довжини інтервалів значень вибірки, а висоти дорівнюють .

Площа і-го стовпчика дорівнює пі , а площа усієї гістограми відносних частот дорівнює одиниці.

Полігон для інтервальної таблиці частоти легко дістати з гістограми. Для цього досить сполучити відрізками середини верхньої сторони прямокутників.

Приклад 2. 25 випускників школи писали тест з математики. Кожен учень отримав певну кількість балів: 75,145,150,180,125, 150,150,165,95,135,130,70,130,105,135,135,100,160,60,85,120,60,145,150,135

Потрібно побудувати інтервальну таблицю частот та графічно зобразити її у вигляді гістограми та полігону.

Визначаємо хmin=60, хmах=180. Всі значення вибірки знаходяться на відрізку , отже R=180-60=120. Розіб’ємо розмах варіації, наприклад, на 6 класів, маємо . Якщо використати формулу , то отримаємо, що h22.

Будуємо інтервальну таблицю частоти

ki

4

3

2

7

7

2

ni=

0,16

0,12

0,08

0,28

0,28

0,08

Відповідна гістограма та полігон частот матиме вигляд