Статистичні гіпотези. Критерій перевірки нульової гіпотези

Статистичною називають гіпотезу щодо невідомого розподілу випадкових величин або про параметри відомих розподілів.

Наприклад, статистичними є такі гіпотези:

1. Генеральна сукупність розподіляється за законом Пуассона.

2. Дисперсії двох нормальних сукупностей рівні між собою.

Нульовою (основною) називають висунуту гіпотезу Н₀.

Альтернативною називають гіпотезу Н₁, яка суперечить нульовій.

Наприклад, якщо нульовою є гіпотеза про те, що математичне сподівання нормального розподілу дорівнює 10, то альтернативною може бути гіпотеза, що воно не дорівнює10.

Коротко це можна записати так:

Н₀: а = 10,

Н₁: а ≠ 10.

Простою називають гіпотезу, що містить лише одне припущення.

Складноюназивають гіпотезу, яка включає скінченну або нескінченну кількість простих гіпотез. Наприклад, Н₀: а = 10 – це проста гіпотеза, Н₁: а ≠ 10 буде складною гіпотезою, бо в її межах існує безліч припущень: а = 1, а = 5, а = 1,8 та ін.

Висунута гіпотеза може бути правильною або ні. Тому виникає необхідність її перевірки. У результаті перевірки можуть бути такі ситуації:

1. Гіпотеза Н₀правильна і приймається.

2. Гіпотеза Н₀ неправильна і приймається.

3. Гіпотеза Н₀ неправильна і відкидається.

4. Гіпотеза Н₀ правильна і відкидається.

У випадках 1 та 3 помилки не буде. Випадки 2 та 4 свідчать про помилкові ситуації. У математичній статистиці прийнято розрізняти ці помилки.

Помилка першого роду – полягає у тому, що буде відкинуто правильну гіпотезу.

Помилка другого роду – означає прийняття неправильної гіпотези.

Результати (наслідки) цих помилок можуть бути дуже різними за своїм значенням. Наприклад, проводиться дослідження безпечності для здоров’я нового медичного препарату. За результатами випробувань можуть бути висунуті такі гіпотези: «препарат є небезпечним для здоров’я» й «препарат безпечний». Якщо за нульову взяти гіпотезу «препарат є небезпечним для здоров’я», то помилка першого роду буде полягати в тому, що ми вважатимемо безпечним шкідливий для людини препарат. Ціна такої помилки – здоров’я і життя людей. Помилка другого роду буде означати, що безпечний препарат визнано небезпечним, а тому його направили на доробку. Ціна такої помилки – матеріальні збитки. Вочевидь, помилка першого роду має більшу ціну. Якщо ми поміняємо місцями нульову та альтернативну гіпотези, то відповідно зміняться й наслідки помилок. Прийнято, що при формулюванні задачі про перевірку статистичних гіпотез, нульову гіпотезу вибирають таким чином, щоб помилка першого роду мала більшу ціну.

Для перевірки нульової гіпотези використовують спеціально вибрану випадкову величину, точне або наближене значення якої відоме. Залежно від виду розподілу, ця випадкова величина позначається по-різному.

Позначимо її літерою К (з метою узагальнення).

Статистичним критерієм називають випадкову величину К, яка використовується для перевірки нульової гіпотези.

Спостережуваним значенням критерію К_спост називають його величину, обчислену за вибіркою.

Після вибору критерію, множину всіх його можливих значень розбивають на дві підмножини; одна з них містить значення критерію, при яких нульова гіпотеза відкидається, інша – ті, при яких вона приймається.

Критичною областю називають сукупність значень критерію, при яких нульову гіпотезу відхиляють.

Областю прийняття гіпотези (областю допустимих значень) називають сукупність значень критерію, при яких гіпотезу приймають.

Головний принцип перевірки статистичних гіпотез можна сформулювати так: якщо спостережуване значення критерію належить критичній області – гіпотезу відкидають, коли ж спостережуване значення критерію належить області прийняття гіпотези – гіпотезу приймають.

Критичними точками k_кр називають точки, що відділяють критичну область від області прийняття гіпотези.

Розрізняють однобічну (правобічну або лівобічну) та двобічну критичні області.

Правобічною називають критичну область, яка визначається рівністю К > k_кр, де k_кр – додатне число (рис. 9.1, а).

Лівобічною називають критич-ну область, яка визначається рівністю К < k_кр, де k_кр – від’ємне число (рис. 9.1, б).

Двобічною називають критич-ну область, яка визначається нерівностями K < k₁, K > k₂, де k₂ > k₁ (рис. 9.1, в).

Рис.9.1. Види критичної області:

а – правобічна, б –лівобічна, в – двобічна.

Для того, щоб визначити критичну область, нам необхідно знайти критичну точку (або точки, якщо область двобічна).

Для цього задаються малою ймовірністю – рівнем значущості a. Потім відшукують критичну точку k_кр, виходячи із вимоги, що коли нульова гіпотеза правильна, то ймовірність того, що критерій К набуде значення, яке належить критичній області, буде дорівнювати прийнятому рівню значущості.

Для правобічної критичної області це означає, що

Р(К > k_кр) = a.

Для лівобічної

Р(К < k_кр) = a.

І для двобічної

Р(К < k_1кр)+ Р(К > k_2кр) = a.

Отже, рівень значущості – це ймовірність помилки першого роду.

Для кожного критерію є відповідні таблиці, за якими і знаходять критичні точки, що задовольняють ці вимоги.

Потужністю критерію називають імовірність його попадання в критичну область за умови правильності альтернативної гіпотези.

Чим більша потужність критерію, тим менша ймовірність зробити помилку другого роду.

Таким чином, якщо рівень значущості вже вибрано, то критичну область необхідно визначити таким чином, щоб потужність критерію була максимальною.

Зауважимо, що в межах даного обсягу вибірки одночасно зменшити ймовірність помилки першого та другого роду неможливо. Отже, єдиний спосіб одночасного зменшення ймовірності помилок першого та другого роду полягає у збільшенні обсягу вибірок.

⇐ Предыдущая 30 31 32 333435 36 37 38 39 Следующая ⇒