Вибіркові характеристики.
При статистичних дослідженнях вибірки важливим етапом є оцінювання її числових характеристик, які називають вибірковими характеристиками.
Розмах вибірки R — це різниця між найбільшим і найменшим значенням випадкової величини у вибірці.
Для вибірки, розглянутої в прикладі 1 попереднього пункту, маємо R = 12 - 1 = 11.
Мода вибірки МO — те значення випадкової величини, що зустрічається у вибірці найчастіше.
Для вибірки, розглянутої в прикладі 1 попереднього пункту є дві моди — це числа 7 і 8. Можна записати МO1 = 7; МO2 = 8.
Медіана вибірки Ме — серединне значення ранжованої вибірки.
Медіана ділить ранжовану вибірку на дві рівні за кількістю частини. Якщо у вибірці непарна кількість випадкових величин, то його медіаною є число, яке стоїть посередині.
Наприклад, у ранжованій вибірці:
що складається з 7 випадкових величин, медіаною є число 3. Можна записати Ме = 3.
Якщо у вибірці парне число випадкових величин, то медіана — середнє арифметичне двох чисел, що стоять посередині.
Наприклад, у ранжованій вибірці:
що складається з 8 випадкових величин, медіана — це середнє арифметичне чисел 4 і 5, що стоять посередині ряду. Отже, Ме = (4 + 5)/2.
Середнє арифметичне вибірки — це середнє арифметичне всіх її значень x1; x2; x3;…; xn.
Так, наприклад, середнє арифметичне вибірки, розглянутою у прикладі 1 попереднього пункту знаходиться наступним чином:
Розв'язування задач статистики
Приклад 1
Для з'ясування рівня
знань учнів 9-х класів у школах мікрорайону склали спеціальну контрольну роботу
з шести завдань. У школах мікрорайону навчається 710 дев'ятикласників, з яких
випадковим чином відібрали 50 учнів (обсяг вибірки n), і в алфавітному списку цих учнів біля кожного
прізвища після проведення контрольної роботи проставили кількість правильно
розв'язаних задач. Вийшов ряд даних (статистичні дані):
4; 2; 0; 6; 2; 3; 4;
3; 3; 0; 1; 5; 2; 6; 4; 3; 3; 2; 3; 1; 3; 3; 2; 6; 2; 2; 4; 3; 3; 6; 4; 2; 0;
3; 3; 5; 2; 1; 4; 4; 3; 4; 5; 3; 2; 3; 1; 6; 2; 2.
Щоб зручніше було
аналізувати інформацію, розташували ці числа в порядку їх зростання
(ранжирування ряду даних):
0; 0; 0; 1; 1; 1; 1;
2; 2; 2; 2; 2; 2; 2; 2; 2; 2; 2; 2; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3;
3; 4; 4; 4; 4; 4; 4; 4; 4; 5; 5; 5; 6; 6; 6; 6; 6.
Для кращого
сприйняття і полегшення подальшого аналізу результатів, їх подають у вигляді
таблиці, яка встановлює зв'язок між впорядкованим рядом статистичних даних і
відповідними їм частотами mі (або відносними частотами vi)
Кількість правильно
розв'язаних задач, хі
|
0
|
1
|
2
|
3
|
4
|
5
|
6
|
Частота, mi
|
3
|
4
|
12
|
15
|
8
|
3
|
5
|
Відносна частота, vi , (у %)
|
6
|
8
|
24
|
30
|
16
|
6
|
10
|
Перевірка: 1) додаємо
всі частоти ті і одержуємо обсяг вибірки n = 50;
2) додаємо всі
відносні частоти vi, і одержуємо
100%. Отже, таблиця заповнена правильно.
Для графічного подання даних на основі цієї
таблиці можна побудувати різні типи діаграм частот (або відносних частот):
1) лінійна діаграма являє собою набір відрізків, що
спираються на певні значення випадкової величини хі (статистичні
дані), а висоти їх дорівнюють відповідним частотам mі
(або відносним частотам vi,) цих величин:
2) стовпчаста
діаграма складається з окремих стовпців - прямокутників, основи яких вибирають
довільної ширини на значеннях випадкової величини хn а висоти дорівнюють відповідним частотам mi. (або відносним частотам vi) цих величин:
3) для побудови
кругової діаграми круг розбивається на сектори, центральні кути яких
пропорційні відносним частотам vi, обчисленим для кожного значення випадкової величини:
Крім діаграм для графічного представлення результатів
використовують полігони частот (або
відносних частот).
Полігон частот являє
собою ламану, відрізки якої послідовно з'єднують точки з координатами (хi; vi), де хі - значення випадкової величини, а vi. - відповідні їм частоти.
Увага!
У випадках, коли в
статистичному ряді даних однакові значення зустрічаються рідко, а кількість
різних варіантів досить велика, для обробки даних будують інтервальний ряд. Для
побудови такого ряду спочатку знаходять серед даних найбільше значення і
найменше значення і визначають розмах ряду даних. Потім весь інтервал значень ряду
даних розбивається на декілька (5 -10) однакових інтервалів і визначається,
яка кількість даних потрапляє в кожний інтервал.
Приклад 2
Для з'ясування, чи
зручно розташована школа в мікрорайоні, провели опитування учнів. Вибраних
випадковим чином 100 учнів (обсяг вибірки n) запитали, скільки часу кожен з них витрачає на
дорогу від дому до школи.
У результаті
опитування отримали ряд даних (статистичні дані):
40, 18, 31, 45, 24, 30, 37, 15, 39, 34, 48, 25, 30, 7, 27, 52, 43, 38, 47, 8, 21, 40, 32, 53, 45, 54,
35, 28, 32, 12, 26, 35, 48, 19, 33, 26, 17, 30, 42, 22, 53, 28, 42, 36, 23, 10,
34, 46, 16, 29, 35, 52, 41, 32, 21, 39, 55, 25, 29, 8, 36, 44, 26, 55, 34, 19,
42, 54, 27, 10, 45, 20, 31, 50, 18, 9, 41, 14, 38, 40, 23, 49, 33, 15, 24, 46,
36, 28, 32, 37, 51, 20, 29, 47, 33, 27, 41, 22, 39, 40.
Найбільше значення
серед даних - 55, найменше - 7, розмах вибірки: 55 - 7 = 48. Виберемо довжину
інтервалу, наприклад: 48:6 = 8. За початок кожного інтервалу прийнято брати
значення, розташоване на півінтервалу лівіше найменшого значення в ряду, тобто
7 - 4 = 3.
Тоді границі інтервалів: 3, 11, 19, 27, 35, 43, 51, 59. Визначимо, скільки
значень потрапить у кожний інтервал, тобто частоту попадання в даний інтервал.
Побудуємо таблицю:
Інтервал часу (у
хв), х,
|
3-11
|
11-19
|
19-27
|
27-35
|
35-43
|
43-51
|
51-59
|
Частота, m
|
6
|
8
|
17
|
24
|
23
|
13
|
9
|
Для інтервального ряду використовують спеціальне
графічне зображення - гістограму частот
(або відносних частот).
Гістограма частот являє собою ступінчасту фігуру, що складається із з'єднаних між
собою стовпців-прямокутників; основою кожного стовпця слугує проміжок значень
випадкової величини, а висотою - частота, з якою зустрічається ця величина.
Приклад 3.
Учні 9-го класу
проходили тестування з математики, де оцінка виставлялася за 100-бальною
шкалою. Середня оцінка 10 учнів становила 81 бал. Якою має бути середня оцінка
решти 20 учнів класу, щоб середня оцінка всього класу дорівнювала 85 балам?
Розв'язання.
Нехай оцінка одного
учня х1 балів, другого - х2 балів, тридцятого – х30
балів. Тоді середня оцінка 10 учнів становить 81 бал: (x1+ х2+...+х10):10 =
81.
Cередня оцінка решти 20
учнів нехай буде z: (x11+ х12+...+х30):20 = z , а середня оцінка всього класу дорівнює 85 балам: (x1+ х2+...+х30):30 =
85.Одержуємо систему з трьох
рівнянь:
x1+ х2+...+х10 = 810; x11+ х12+...+х30 = 20z; x1+ х2+...+х30= 2550
з якої визначаємо z:
810 + 20z = 2550,
20z = 2550 - 810,
20z =1740,
z = 87.
Відповідь: середня
оцінка решти 20 учнів класу становить 87.
Задачі для
тренування.
1. Середнє
арифметичне п'яти чисел дорівнює 300. Одне з цих чисел дорівнює 900. Знайдіть середнє арифметичне решти чотирьох чисел.
А) 250; Б) 200; В) 150;
Г) 100.
2. Середня висота 10
будинків дорівнює 60 м, а середня висота чотирьох з них - 48 м. Чому
дорівнює середня висота решти 6 будинків?
А) 60м; Б) 64 м; В) 68м; Г) 72м.
3. Учень отримав
табель з такими оцінками: 5, 6, 6, 7, 6, 5, 9, 10, 6, 6. Знайдіть середнє значення
вибірки, моду, медіану. Побудуйте полігон частот.
Немає коментарів:
Дописати коментар