пятница, 29 ноября 2019 г.

Урок 5. Частота

Частота це число, яке показує, скільки разів у вибірці зустрічається той або інший елемент.

Або

Частота це число, яке показує, скільки разів трапляється кожна варіанта.

Позначають  ni, де  i – індекс варіанти. Загальна сума частот дорівнює:

n = n1+ n2+ + … + nk.

ПРИКЛАД:

Припустимо, що в школі проходять змагання по підтягуваннях. У змаганнях бере  участь  36  школярів. Складемо таблицю, в яку заноситимемо число підтягувань, а так само число учасників, які виконали стільки підтягувань.
По таблиці можна дізнатися, скільки чоловік виконало  5, 10  або  15  підтягувань. Так, 5 підтягувань виконали чотири людини, 10  підтягувань виконали вісім чоловік, 15  підтягувань виконали три людини.
Кількість людина, підтягувань, що повторюють одно і те ж число, в даному випадку, є частотою. Тому другий рядок таблиці перейменуємо в назву <<частота>>:
Такі таблиці називають таблицями частот.
Частота має наступну властивість:

Сума частот дорівнює загальному числу даних у вибірці.

Це означає, що сума частот дорівнює загальному числу школярів, що беруть участь в змаганнях, тобто тридцяти шести. Перевіримо чи так це. Складемо частоти, приведені в таблиці:

4 + 5+ 10 + 8 + 6 + 3 = 36.

Відносна частота.

Відносна частота це частота виражена у відсотках.
Відносна частота дорівнює відношенню частоти  на загальне число елементів вибірки.

ПРИКЛАД:

Розглянемо таблицю, узяту з попереднього прикладу.
П'ять підтягувань виконали  4  людини з  36. Шість підтягувань виконали  5  чоловік з  36. Вісім підтягувань виконали  10  чоловік з  36  і так далі. Заповнимо таблицю за допомогою таких стосунків:
Виконаємо ділення в цих дробах.
Виразимо ці частоти у відсотках. Для цього помножимо їх на  100. Множення на  100  зручно виконати пересуванням коми на дві цифри управо:
Тепер можна сказати, що  5  підтягувань виконали  11%  учасників, 6  підтягувань виконали  14%  учасників, 8  підтягувань виконали  28%  учасників і так далі.

Стовпчасті діаграми у статистиці називають гістограмами (гр. iστos – стовп, γραμμα – написання)

Гістограмою називають послідовність стовпців, кожний з яких спирається на один розрядний інтервал завширшки

h = xi+1xi

а висота його  Н  обчисляється за формулою
ПРИКЛАД:

У таблиці подано розподіл кількості робітників за кількістю виготовлених ними деталей за зміну.
За даними таблиці на рисунку зображена гістограма.
h = xi+1xi = 25 – 20 = 5.

Справа значно ускладнюється, якщо досліджують масові явища, що охоплюють тисячі або й мільйони досліджуваних об'єктів.

ПРИКЛАД:

Взуттьовикам треба знати, скільки взуття слід випускати того чи іншого розміру. Як це з'ясувати ? опитати всіх, тобто десятки мільйонів чоловік і жінок, надто дорого і довго. Тому роблять вибірку: опитують вибірково всього кілька десятків чи сотень людей. Припустимо, що, опитавши  60  жінок, їх розміри взуття записали в таблицю.
Це – вибірка з  60  значень (даних). Для зручності її групують у класи (за розмірами взуття) і відмічають, скільки значень вибірки містить кожний клас.
Такі таблиці називають частотними. В них числа другого рядка – частоти; вони показують, як часто зустрічаються у вибірці ті чи інші її значення. У розглянутому прикладі частота розміру взуття  24  дорівнює  9, а відносна частота  15%, бо 

9 : 60 = 0,15 = 15%.

За частотною таблицею можна побудувати гістограму.
Вона наочно показує, яку частину взуття бажано випускати того чи іншого розміру.


Зрозуміло, що одержані таким способом висновки тільки ймовірні, наближені. Але для потреб практики цього досить.

Полігоном частот називають ламану, відрізки якої сполучають точки

(x1; n1), (x2; n2), … , (xk; nk),

де  xi – варіанти, і  ni – частоти (або частотності).
Для побудови полігону частот на осі абсцис відкладають варіанти  xi, а на осі ординат – відповідні їм частоти  ni. Точки (xi; ni) сполучають відрізками прямих.

ПРИКЛАД:

Графічне зображення розподілу цивільних справ у суді за терміном їх розгляду
ілюструє полігон розподілу, зображений на рисунку:
Завдання до уроку 5

Урок 5. Частота

Частота это число, которое показывает, сколько раз в выборке встречается тот или иной элемент.

Или

Частота это число, которое показывает, сколько раз случается каждая варианта.

Обозначают  ni, где  i – индекс варианты. Общая сумма частот равняется:

n = n1+ n2+ + … + nk.

ПРИМЕР:

Предположим, что в школе проходят соревнования по подтягиваниям. В соревнованиях участвует  36  школьников. Составим таблицу, в которую будем заносить число подтягиваний, а так же число участников, которые выполнили столько подтягиваний.
По таблице можно узнать, сколько человек выполнило  5, 10  или  15  подтягиваний. Так, 5 подтягиваний выполнили четыре человека, 10  подтягиваний выполнили восемь человек, 15  подтягиваний выполнили три человека.
Количество человек, повторяющих одно и то же число подтягиваний в данном случае, является частотой. Поэтому вторую строку таблицы переименуем в название <<частота>>:
Такие таблицы называют таблицами частот.
Частота обладает следующим свойством:

Сумма частот равна общему числу данных в выборке.

Это означает, что сумма частот равна общему числу школьников, участвующих в соревнованиях, то есть тридцати шести. Проверим так ли это. Сложим частоты, приведённые в таблице:

4 + 5 + 10 + 8 + 6 + 3 = 36.

Относительная частота.

Относительная частота это частота выраженная в процентах.
Относительная частота равна отношению частоты  на общее число элементов выборки.

ПРИМЕР:

Рассмотрим таблицу, взятую из предыдущего примера.
Пять подтягиваний выполнили  4  человека из  36. Шесть подтягиваний выполнили  5  человек из  36. Восемь подтягиваний выполнили  10  человек из  36  и так далее. Заполним таблицу с помощью таких отношений:
Выполним деление в этих дробях.
Выразим эти частоты в процентах. Для этого умножим их на  100. Умножение на  100  удобно выполнить передвижением запятой на две цифры вправо:
Теперь можно сказать, что  5  подтягиваний выполнили  11%  участников, 6  подтягиваний выполнили  14%  участников, 8  подтягиваний выполнили  28%  участников и так далее.

Гистограммой называют последовательность столбцов, каждый из которых опирается на один разрядный интервал в ширину

h = xi+1xi

а высота его  Н  вычисляется по формуле
ПРИМЕР:

В таблице подано распределение количества рабочих за количеством изготовленных ими деталей за изменение.
По данным таблицы на рисунку изображенна гистограмма.
h = xi+1xi = 25 – 20 = 5.

Дело значительно усложняется, если исследуют массовые явления, которые охватывают тысячи или и миллионы исследуемых объектов.

ПРИМЕР:


Обувщикам надо знать, сколько обуви следует выпускать того или другого размера. Как это выяснить ? Опросить всех, то есть десятки миллионов человек и женщин, слишком дорого и долго. Поэтому делают выборку: опрашивают избирательно всего несколько десятков или сотен людей. Допустимо, что, опросив  60  женщин, их размеры обуви записали в таблицу.
Это – выборка из  60  значений (данных). Для удобства ее группируют в классы (за размерами обуви) и отмечают, сколько значений выборки содержит каждый класс.
Такие таблицы называют частотными. В них числа второй строки – частоты; они показывают, как часто встречаются в выборке те или другие ее значения. В рассмотренном примере частота размера обуви  24  равняется  9, а относительная частота  15%, потому что 

9 : 60 = 0,15 = 15%.


По частотной таблице можно построить гистограмму.
Она наглядно показывает, какую часть обуви желательно выпускать того или другого размера.


Понятно, что получены таким способом выводы только вероятные, приближенные. Но для потребностей практики этого достаточно. 

Полигоном частот называют ломаную, отрезки которой соединяют точки

(x1; n1), (x2; n2), … , (xk; nk),

где  xi – варианты, и  ni – частоты (или частотности).
Для построения полигона частот на осе абсцисс откладывают варианты  xi, а на осе ординат – соответствующие им частоты  ni. Точки (xi; ni) соединяют отрезками прямых.

ПРИМЕР:

Графическое изображение распределения гражданских дел в суде за сроком их рассмотрения
иллюстрирует полигон распределения, изображенный на рисунку:

четверг, 28 ноября 2019 г.

Урок 4. Медіана

ПРИКЛАД:

Розглянемо вибірку:
Семеро спортсменів, а так само їх зростання в сантиметрах.
Упорядкуємо дані в таблиці так, щоб зростання спортсменів йшло за збільшенням. Іншими словами, побудуємо спортсменів по зростанню.
Випишемо зростання спортсменів окремо:

180, 182, 183, 184, 185, 188, 190.

У вибірці, що вийшла, 7  елементів. Посередині цієї вибірки розташовується елемент  184. Ліворуч і праворуч від нього по три елементи. Такий елемент як  184  називають медіаною впорядкованої вибірки.

Медіаною впорядкованої вибірки називають елемент, розташований посередині.

Або

Медіаною вибірки називають число, яке поділяє навпіл упорядковану (у порядку зростання чи спадання ознаки) сукупність усіх значень вибірки. 

Позначають  Ме.

ПРИКЛАД:

Медіана групи значень:

5, 7, 11, 13, 19 

буде  11.


Ме = 11.

Це визначення справедливе у разі, якщо кількість елементів впорядкованої вибірки є непарною.
У розглянутому вище прикладі, кількість елементів впорядкованої вибірки була непарною. Це дозволило швидко вказати медіану.
Середнім значенням (середнім арифметичним) називають таке число
яке отримують діленням суми всіх даних вибірки на кількість цих даних  n:
Відхиленням  li  кожного значення  xi  від середнього арифметичного
називають різницю між цим значенням і середнім арифметичним, тобто
Відхилення може бути як додатним, так і від’ємним.

Але можливі випадки, коли кількість елементів вибірки парна.

ПРИКЛАД:

Розглянемо вибірку, в якій не семеро спортсменів, а шестеро:
Побудуємо цих шестеро спортсменів по зростанню:
Випишемо зростання спортсменів окремо:

180, 182, 184, 186, 188, 190.

У цій вибірці не виходить вказати елемент, який знаходився б по середині. Якщо вказати елемент  184  як медіану, то зліва від цього елементу розташовуватимуться два елементи, а справа – три. Якщо як медіану вказати елемент  186, то зліва від цього елементу розташовуватимуться три елементи, а справа – два.
У таких випадках для визначення медіани вибірки, треба узяти два елементи вибірки, що знаходяться посередині і знайти їх середнє арифметичне. Отриманий результат буде медіаною.
Повернемося до спортсменів. У впорядкованій вибірці

180, 182, 184, 186, 188, 190

посередині розташовуються елементи

184  і  186.
Знайдемо середнє арифметичне елементів


184  і  186
Елемент  185  є медіаною вибірки, попри те, що цей елемент не є членом початкової і впорядкованої вибірки. Спортсмена із зростанням  185 см  немає серед інших спортсменів. Зростання в  185 см  використовується в даному випадку для статистики, щоб можна було сказати про те, що середній зріст спортсменів складає  185 см.

ПРИКЛАД:

Медіана групи значень:

3, 4, 8, 16, 17, 19 

дорівнює

12((8 + 16) : 2 = 12).


Ме = 12.

Точніше визначення медіани залежить від кількості елементів у вибірці.

Якщо кількість елементів впорядкованої вибірки непарно, то медіаною вибірки називають елемент, розташований посередині.

Якщо кількість елементів впорядкованої вибірки парна, то медіаною вибірки називають середнє арифметичне двох чисел, розташованих посередині цієї вибірки.

Медіана і середнє арифметичне по суті є <<близькими родичами>>, оскільки і те і інше використовує для визначення середнього значення.

ПРИКЛАД:

Для впорядкованої вибірки:

180, 182, 184, 186, 188, 190

медіана рівна  185.
Цей же результат можна отримати шляхом визначення середнього арифметичного елементів

180, 182, 184, 186, 188, 190
Але медіана в деяких випадках відбиває реальнішу ситуацію.

ПРИКЛАД:

Було підраховано кількість наявних очок у кожного спортсмена. В результаті вийшла наступна вибірка:

0, 1, 1, 1, 2, 1, 2, 3, 5, 4, 5, 0, 1, 6, 1.

Визначимо середнє арифметичне для цієї вибірки – отримаємо значення  2,2
.По цьому значенню можна сказати, що в середньому у спортсменів  2,2  очка.
Тепер визначимо медіану для цієї ж вибірки. Упорядкуємо елементи вибірки і вкажемо елемент, що знаходиться посередині:

0, 0, 1, 1, 1, 1, 1, 1, 2, 2, 3, 4, 5, 5, 6.

У цьому прикладі медіана краще відбиває реальну ситуацію, оскільки половина спортсменів мають не більше за одне очко.

Середнє геометричне  mc  для  n  додатних чисел
x1,  x2, … ,  xn

Визначають за формулою
Дисперсією  D  називають середнє арифметичне суми квадратів усіх відхилень випадкової величини:
Середнє квадратичне відхилення  σ  дорівнює кореню квадратному із дисперсії:

σ = √͞͞͞͞͞D.

Завдання до уроку 4