Статистика Потужність від даних! Дисперсія та стандартне відхилення

Публікації

Статистика: живлення з даних!

Заходи поширення

  • Вітальна сторінка
  • Ареал і квартилі
  • Дисперсія та стандартне відхилення
  • П’ятизначні зведення
  • Побудова ділянок коробки та вусів
  • Вправи
  • Відповіді

Архівний вміст

Інформація, ідентифікована як заархівована, надається для довідкових цілей, досліджень або ведення діловодства. Він не підпадає під дію веб-стандартів уряду Канади і не змінювався та не оновлювався з моменту архівування. Будь ласка, зв’яжіться з нами, щоб попросити формат, відмінний від наявного.

  • Властивості середньоквадратичного відхилення
  • Дискретні змінні
  • Приклад 1 - Стандартне відхилення
  • Таблиця частот (дискретні змінні)
  • Приклад 2 - Стандартне відхилення, розраховане за допомогою таблиці частот
  • Приклад 3 - Стандартне відхилення з використанням згрупованих змінних (безперервних або дискретних)
  • Приклад 4 - Стандартне відхилення
  • Приклад 5 - Стандартне відхилення

На відміну від діапазону та квартилів, дисперсія поєднує всі значення в наборі даних, щоб отримати міру поширення. Дисперсія (символізується символом S 2 ) та стандартне відхилення (квадратний корінь з дисперсії, символізований символом ) є найбільш часто використовуваними заходами поширення.

Ми знаємо, що дисперсія є мірою того, наскільки розподілений набір даних. Він обчислюється як середнє квадратичне відхилення кожного числа від середнього значення набору даних. Наприклад, для чисел 1, 2 та 3 середнє значення дорівнює 2, а дисперсія - 0,667.

[(1 - 2) 2 + (2 - 2) 2 + (3 - 2) 2] ÷ 3 = 0,667

[квадратичне відхилення від середнього] ÷ кількість спостережень = дисперсія

Дисперсія (S 2) = середнє квадратичне відхилення значень від середнього

Обчислення дисперсії передбачає квадратичні відхилення, тому воно не має тієї самої одиниці виміру, як вихідні спостереження. Наприклад, довжини, виміряні в метрах (м), мають дисперсію, виміряну в метрах у квадраті (м 2).

Беручи квадратний корінь з дисперсії, ми отримуємо одиниці виміру, що використовуються у вихідному масштабі, і це стандартне відхилення.

Стандартне відхилення (S) = квадратний корінь дисперсії

Стандартне відхилення - це показник поширення, який найчастіше використовується в статистичній практиці, коли середнє значення використовується для обчислення центральної тенденції. Таким чином, він вимірює розподіл середнього значення. Через його тісний зв’язок із середнім значенням на стандартне відхилення може сильно вплинути, якщо середнє дає поганий показник центральної тенденції.

На середньоквадратичне відхилення також впливають викиди, одне значення може в значній мірі сприяти результатам стандартного відхилення. У цьому сенсі середньоквадратичне відхилення є хорошим показником наявності відхилень. Це робить середньоквадратичне відхилення дуже корисною мірою поширення для симетричних розподілів без відхилень.

Стандартне відхилення також корисно при порівнянні розподілу двох окремих наборів даних, які мають приблизно однакове середнє значення. Набір даних із меншим стандартним відхиленням має більш вузький розподіл вимірювань навколо середнього значення, і тому, як правило, має порівняно менше високих або низьких значень. Елемент, вибраний випадковим чином із набору даних, стандартне відхилення якого є низьким, має більше шансів бути близьким до середнього, ніж елемент із набору даних, стандартне відхилення якого вище.

Як правило, чим ширше поширені значення, тим більшим є стандартне відхилення. Наприклад, уявімо, що ми маємо відокремити два різні набори результатів іспитів від класу з 30 студентів, перший іспит має оцінки від 31% до 98%, інші - від 82% до 93%. Враховуючи ці діапазони, стандартне відхилення було б більшим для результатів першого іспиту.

Стандартне відхилення може бути важко інтерпретувати з точки зору того, наскільки великим воно має бути, щоб врахувати широко поширені дані. Розмір середнього значення набору даних залежить від величини стандартного відхилення. Коли ви вимірюєте щось у мільйонах, наявність показників, "близьких" до середнього значення, не має того самого значення, як коли ви вимірюєте вагу двох людей. Наприклад, показник двох великих компаній з різницею в річному доході 10 000 доларів вважається досить близьким, тоді як показник двох осіб з різницею у вазі 30 кілограмів - далеко один від одного. Ось чому в більшості ситуацій корисно оцінити розмір стандартного відхилення відносно середнього значення набору даних.

Хоча стандартне відхилення менш сприйнятливе до екстремальних значень, ніж діапазон, стандартне відхилення все ще є більш чутливим, ніж напівквартильний діапазон. Якщо існує можливість високих значень (відхилень), тоді стандартне відхилення слід доповнити діапазоном напівквартилів.

Властивості середньоквадратичного відхилення

При використанні стандартного відхилення враховуйте наступні властивості.

  • Стандартне відхилення використовується лише для вимірювання розповсюдження або дисперсії навколо середнього значення набору даних.
  • Стандартне відхилення ніколи не є негативним.
  • Стандартне відхилення чутливе до викидів. Один окремий випадок може підвищити стандартне відхилення і, в свою чергу, спотворити картину поширення.
  • Для даних із приблизно однаковим середнім значенням, чим більший розкид, тим більше стандартне відхилення.
  • Якщо всі значення набору даних однакові, стандартне відхилення дорівнює нулю (оскільки кожне значення дорівнює середньому).

При аналізі нормально розподілених даних можна використовувати стандартне відхилення разом із середнім значенням для обчислення інтервалів даних.

Якщо = середнє, = стандартне відхилення і х = значення в наборі даних, тоді

  • близько 68% даних лежить в інтервалі: - S 2).
  • Використовуйте додатний квадратний корінь (стандартне відхилення, ).
  • потужність

Приклад 1 - Стандартне відхилення

Курка несе вісім яєць. Кожне яйце зважували та реєстрували наступним чином: