Первинна обробка даних
Статистичне дослідження проводять за таким планом:
Формулюється завдання дослідження і визначається об’єм, місце і час потрібної вибірки.
Збираються необхідні дані та наочно подаються (аналітично, таблично, графічно).
Проводиться обробка зібраних статистичних даних та формулюється висновок.
Нехай маємо вибірку: х1, х2, х3, ..., хn . Об’єм вибірки дорівнює n.
Наприклад, ці числа одержані в результаті підрахунку числа неправильних з’єднань за 1 хв. на телефонній станції чи в результаті вимірювання довжин деталей тощо.
Наступні наші дії залежать від кількості у цій вибірці різних чисел.
І випадок. Якщо різних чисел небагато, то маємо справу з дискретною величиною.
ІІ випадок. Якщо багато – з неперервною.
Відповідно до цього розглядаємо два впадки: дискретний і неперервний.
Дискретний випадок
Перший етап обробки вибірки – це складання варіаційного ряду. Його одержують таким чином: серед усіх значень хі (і=1,2,3,...,n) відбирають всі різні і розміщують у порядку зростання, отримаємо
а1, а2, а3, ..., аm де m ≤ n, т=1,2,3, ...
а1 а2 а3 ... аm
Другий етап обробки вибірки – це складання дискретної таблиці частоти та відносної частоти.
аі | а1 | а2 | а3 | ... | аm |
ki | k1 | k2 | k3 | ... | km |
ni= | n1= | n2= | n3= | ... | nm= |
де ,
ki– число вимірів в яких спостерігалася ознака аі або частота,
ni= – відносні частоти.
Третій етап – графічне зображення дискретної таблиці. Це можна зробити за допомогою стовпцевої діаграми та полігону частот.
Для зображення діаграми будують систему координат, на вісі абсцис відкладають значення аі, а на вісі ординат – відповідні частоти. Потім будуємо точки з координатами (аі, ki) та з них опускаємо перпендикуляри на вісь абсцис. Отримаємо:
Означення. Полігоном частот (відносних частот) називають ламану, відрізки якої з’єднують точки, абсцисами яких є значення варіант аі, а ординатами – відповідні їм частоти ki (відносні частоти ni).
Приклад 1. Результати оцінювання 56 студентів на екзамені з психології представлені такою вибіркою:
3,4,5,4,3,3,5,4,3,5,5,2,3,5,3,5,3,5,4,4,3,3,4,3,4,3,3,5,3,3,4,3,4,3,5,3,4,4,3,5,3,3,5,4,2,5,3,4,2,3,5,4,3,5,3,5.
Значення, що складають вибірку є реалізацією випадкової величини – оцінки на екзамені.
Складемо дискретну таблицю частоти
аі | 2 | 3 | 4 | 5 |
ki | 3 | 24 | 14 | 15 |
ni= |
|
|
|
|
Стовпцева діаграма частоти матиме вигляд
Неперервний випадок
Якщо різних значень у вибірці буде багато, або всі вони будуть різними, то складена таблиця частот не демонструє особливостей вибірки. У цьому випадку поступають таким чином:
Перший етап. Увесь проміжок зміни значень вибірки від найменшого до найбільшого розбивають на інтервали або на класи. Важливе значення має вибір оптимальної величини інтервалу і правильне включення варіант у відповідний інтервал. Для цього в кожному інтервалі слід розрізняти верхню і нижню межу. Розмах всієї вибірки дорівнює . Оптимальна кількість інтервалів (т) як правило лежить у межах від 5 до 15. Нижню межу і‑го інтервалу позначають хі(min), верхню – хі(mаn), де і змінюється від 1 до т.
Величина інтервалу hi є різниця між максимальним та мінімальним значенням ознаки в кожному класі hi= хі(mаn)- хі(min)
Інтервали зазвичай беруть однакової довжини. Вона повинна бути такою, щоб ряд не був громіздкий і щоб у ньому не зникали особливості ознаки, що досліджується. Ширину рівних інтервалів визначають за формулою Стерджеса
де n – об’єм вибірки
або
, де т – кількість класів.
Другий етап. Розбивши ряд на інтервали підраховують число значень із вибірки (частоти), які потрапили в кожний інтервал, а потім відносні частоти. В результаті одержуємо інтервальну таблицю частот.
|
|
|
| ... |
|
ki | k1 | k2 | k3 | ... | km |
ni= | n1= | n2= | n3= | ... | nm= |
де n – об’єм вибірки,
т – число інтервалів,
ki–кількість значень, що потрапила в і-тий інтервал (частота),
ni= – відносна частота попадання в і-тий інтервал,
– інтервал,
– ширина інтервалу
Третій етап. Графічною ілюстрацією таблиці частоти є гістограма та полігон.
Означення. Гістограмою частот (відносних частот) називають ступінчасту фігуру, що складається з прямокутників основами яких є довжини інтервалів значень вибірки, а висоти дорівнюють .
Площа і-го стовпчика дорівнює пі , а площа усієї гістограми відносних частот дорівнює одиниці.
Полігон для інтервальної таблиці частоти легко дістати з гістограми. Для цього досить сполучити відрізками середини верхньої сторони прямокутників.
Приклад 2. 25 випускників школи писали тест з математики. Кожен учень отримав певну кількість балів: 75,145,150,180,125, 150,150,165,95,135,130,70,130,105,135,135,100,160,60,85,120,60,145,150,135
Потрібно побудувати інтервальну таблицю частот та графічно зобразити її у вигляді гістограми та полігону.
Визначаємо хmin=60, хmах=180. Всі значення вибірки знаходяться на відрізку , отже R=180-60=120. Розіб’ємо розмах варіації, наприклад, на 6 класів, маємо . Якщо використати формулу , то отримаємо, що h22.
Будуємо інтервальну таблицю частоти
|
|
|
|
|
|
|
ki | 4 | 3 | 2 | 7 | 7 | 2 |
ni= | 0,16 | 0,12 | 0,08 | 0,28 | 0,28 | 0,08 |
Відповідна гістограма та полігон частот матиме вигляд
- Модульний план
- Розподіл балів за виконані роботи
- Критерії оцінювання знань, вмінь та навичок студентів Лекційні заняття
- Оцінювання самостійної та індивідуальної роботи
- Модуль і. Теорія ймовірностей Змістовний модуль 1. Теоретичні основи теорії ймовірностей та комбінаторики
- Тема 1. Основні поняття теорії ймовірностей
- 1.1. Поняття "випробування" та "подія". Предмет теорії ймовірностей. Коротка історична довідка.
- Класифікація випадкових подій
- Алгебра випадкових подій
- Властивості операцій над подіями
- Запитання для самоконтролю
- Тема 2. Основні поняття та принципи комбінаторики
- Сполуки без повторень елементів
- Сполуки з повторенням елементів
- Основні принципи комбінаторики
- Запитання для самоконтролю
- Тема 3. Ймовірність подій. Основні теореми теорії ймовірностей
- Класичне означення ймовірності
- Властивості ймовірності
- 3.2. Відносна частота. Статистичне означення ймовірності.
- 3.3. Геометричне означення ймовірності
- Залежні та незалежні події. Умовна ймовірність. Теореми множення ймовірностей.
- Теорема множення ймовірностей залежних подій
- 3.5. Теореми додавання ймовірностей Теорема додавання ймовірностей несумісних подій
- 3.6. Ймовірність настання хоча б однієї події
- Теорема
- Запитання для самоконтролю
- Тема 4. Формула повної ймовірності. Формула Бейєса.
- 4.1. Формула повної ймовірності
- 4.2. Формула Бейєса
- Запитання для самоконтролю
- Тема 5. Послідовні незалежні випробування
- 5.1.Схема повторних незалежних випробувань Бернуллі.
- 5.2. Граничні теореми у схемі Бернуллі
- 5.3. Ймовірність відхилення відносної частоти від сталої ймовірності в незалежних випробуваннях
- Запитання для самоконтролю
- Практичні заняття Практичне заняття №1
- Практичне заняття №2
- Практичне заняття №3
- Практичне заняття №4
- Практичне заняття №5
- Самостійна робота
- Рівень а
- Рівень б
- Рівень в
- Рівень а
- Рівень б
- Рівень в
- Теми рефератів
- Задачі для самоперевірки
- Змістовний модуль 2. Випадкові величини
- Тема 6. Види випадкових величин та способи їх задання
- 6.1. Поняття випадкової величини. Закони розподілу випадкових величин.
- 6.1.1. Дискретні випадкові величини
- Біноміальний розподіл
- Геометричний розподіл
- Числові характеристики двв
- 6.1.2. Неперервні випадкові величини. Щільність розподілу.
- Основні закони розподілу неперервних величин
- Рівномірний розподіл
- Показниковий розподіл
- Нормальний розподіл
- Числові характеристики ннв
- Правило трьох сигм
- 6.2. Закон великих чисел та центральна гранична теорема
- Теорема
- Запитання для самоконтролю
- Практичны заняття Практичне заняття №6
- Практичне заняття №9
- Самостійна робота
- Числові характеристики основних розподілів
- Рівень а
- Рівень б
- Рівень в
- Задача 1
- Задача 2
- 10. Неперервна випадкова величина задана інтегральною функцією розподілу:
- Задачі для самоконтролю
- Модуль іі. Математична статистика Змістовний модуль 3. Теоретичні основи математичної статистики
- Тема 7. Предмет та задачі математичної статистики
- Види та способи відбору
- Первинна обробка даних
- Згрупований розподіл накопиченої частоти
- Розподіл щільності частоти і щільності відносної частоти
- Емпірична функція розподілу
- Властивості емпіричної функції розподілу
- Запитання для самоконтролю
- Тема 8. Статистичні оцінки параметрів розподілу
- 8.1. Числові характеристики статистичного розподілу
- Алгоритм методу добутків
- 8.2. Точкові та інтервальні оцінки параметрів розподілу
- Точкова оцінка математичного сподівання
- Точкова оцінка дисперсії. Виправлена дисперсія
- Інтервальні оцінки для математичного сподівання
- Знаходження об’єму вибірки
- Запитання для самоконтролю
- Практичні заняття Практичне заняття №10
- Практичне заняття №11
- Практичне заняття №12-13
- Практичне заняття №14
- Самостійна робота
- Змістовний модуль 4. Статистична перевірка гіпотез. Елементи теорії кореляції і дисперсійного аналізу
- Тема 9. Статистична перевірка гіпотез
- Статистичні гіпотези та їх класифікація
- 9.2. Статистичні критерії перевірки нульової гіпотези
- 9.3. Перевірка гіпотези про закон розподілу. Критерій згоди Пірсона.
- Перевірка гіпотези про рівність середніх двох сукупностей
- Перевірка гіпотези про рівність часток ознаки двох сукупностей
- Перевірка гіпотези про рівність дисперсій двох сукупностей
- Перевірка гіпотез про числові значення параметрів
- Запитання для самоконтролю
- Тема 10. Елементи теорії кореляції
- Запитання для самоконтролю
- Тема 11. Поняття дисперсійного аналізу. Однофакторний дисперсійний аналіз
- Запитання для самоконтролю
- Практичні заняття
- Практичне заняття №17
- Практичне заняття №18
- Самостійна робота
- Методичні рекомендації
- Список використаної та рекомендованої літератури
- Додатки
- Математична довідка
- Властивості функції
- V. Правила інтегрування функцій
- Варіанти завдань для самостійної індивідуальнї роботи