Уравнение линии регрессии.
Регрессия. – св, определенные на 1 вероятностном пространстве, К- класс функций. Будем называть св представленную в виде регрессией Y на X если выполнено Уравнение линии регрессии. тогда уравнение линии регрессии Y на X: ; X на Y:
Элементы мат статистики. По данным наблюдений определяются вероятности определенных случайных событий, делаются вывод о характеристиках наблюдаемых величин, проверяются гипотезы о распределениях наблюдаемой величины и о характеристике зависимости между разными случайными величинами. 1) X –нсв, тогда выборкой объема n из Х назовем , где – независимая случайная величина, имеющая то же распределение, что и Х. 2) Th об эмпирической функции распределения – выборка из св Х. эмпирическая функция распределения построенная по данной выборке, тогда для Доказательство: Возьмем в качестве А взять событие {X<x}, то Р – вероятность события А. Если произведено n независимых испытаний, то относительная частота наступления где m- число Xi для которых Xi<x тогда 3) – выборка из св Х , ϴ - некий параметр распределения Х, тогда оценкой ϴ будем называть св 4) – выборка , ϴ - некий параметр распределения , будем называть оценку не смещенной, если 5) – выборка , ϴ - некий параметр распределения , будем называть оценку самостоятельной, если 6) – выборка , ϴ - некий параметр распределения, не смещенная, тогда ее можно назвать эффективной, если она имеет наименьшую Dϴ среди других. 7) – выборка из св Х, тогда выборочным средним назовем 8)Th о выборочном среднем Х – случайная величина имеющая МХ=а тогда будет не смещенная, самостоятельная и эффективная оценка параметра а. Доказательство: Не смещенность Самостоятельность , независимы, поэтому по закону больших чисел, если Х имеет DX или по Th Хинчина, если ее нет, мы получим т.е. 9) – выборка из св Х, тогда выборочной дисперсией данной выборки назовем 10) Th о выборочной дисперсии X – св, имеющая DX= тогда S2 будет самостоятельной и смещенной оценкой. 11) – выборка из св Х, тогда исправленной выборочной дисперсией данной выборки назовем 12) Th о исправленной выборочной дисперсии X – св, будет самостоятельной и несмещенной оценкой. 13) – выборка из св Х, а=MX, тогда уточненной выборочной дисперсией назовем 14) Соответствие между эмпирическими и теоретическими св.
Специальные распределения статистики 1) , имеющие стандартное нормальное распределение, тогда св –распределение по закону кхи квадрат с n степенями свободы. Плотность распределения имеет вид
2) , с независимым стандартным нормальное распределение, тогда св распределена по закону Стьюдента с n степенями свободы
при n ∞это распределение близко к стандартному нормальному распределению.
Интервальные оценки 1) - параметр распределения Х 0<P<1, тогда доверительным интервалом для параметра ϴ с доверительной вероятностью Р построенной по выборке из Х Называется интервал с границами α и такой что p{ α p назовем доверительной вероятностью. *не всегда удается достичь точного равенства, поэтому как правило p{ α 2) - параметр распределения св Х, а –выборка из Х. Тогда достаточной статистикой для параметра ϴ построенной по выборке св распределение, которое известно и не зависит от ϴ. 3) Построение доверительного интервала для а при известном –выборка, Х распределена нормально с параметрами а и . Тогда достаточной статистикой для «а» назовем где – исправленная выборочная дисперсия Y будет иметь распределение Стьюдента с n-1 степенью свободы. Ру(х) является четной => можно выбрать симметричный интервал ,так что р={-b<Y<b} число b определяется по таблице в Гмурмане. Доверительный интервал будет иметь вид Построение доверительного интервала для при известном а –выборка –уточненная выборочная дисперсия тогда достаточной статистикой будем считать которая имеет хи квадрат распределение. Числа а и b, для которых выполнено р={a<Y<b} можно подобрать так, что это будет эквивалентно q по Гмурмону взяв в расчет P и число степеней свободы. Построение доверительного интервала для при неизвестном а тогда оценка будет иметь вид
Проверка статистических гипотез 1) Статистическая гипотеза – любое предположение о виде распределения Х или о ее параметрах. Она будет простой, если при ее выполнение, распределение Х становится однозначным. 2) Ошибка 1 рада: непринятие правильной гипотезы. 3) Ошибка 2 рода: принятие не верной гипотезы. 4) Проверка гипотеза:
5) Для того что бы принять или отвергнуть выдвинутую гипотезу, по выборке Составляется св , которая при истинности гипотезы имеет какое-то известное распределение. Задается 0<α<1 называемый уровнем значимости, как правило выбирают α близким к 0. По известному закону распределения для ϴ находится критическая область такая что Если выбранное значение ϴ оказывается в критической области, то гипотеза отвергается, а если не попадает, то считается, что гипотеза не противоречит данным. 6) Правило, по которому принимается или отвергается называется Критерием. 7) Вероятность ошибки 1 рода назовем Уровнем значимости для данного критерия, а вероятность совершить ошибку 2 рода называется мощностью. Проверка гипотезы о виде распределения: 1) Критерий (Пирсона) Имеется вариационный ряд (дискретный\интервальный) и проверяется гипотеза о том, что Х имеет функцию распределения . Для применения критерия Пирсона исходный вариационный ряд записывают в интервальной форме. Для каждого интервала [αi,βi] вычисляются теоретические вероятности попадания Х в интервал по формуле После вычисления производят вычисление теоретических частот попадания n – общее число наблюдений после составляется св –эмпирическая частота. Если гипотеза верна, то данная св имеет χ2 распределение с m-k-1 степенями свободы. Где m – число интервалов, k – число параметров распределения определенной по выборке. По числу степеней свободы и заданному уровню значимости α определяется число . Условия применения: 1) В каждом интервале должно быть не менее 5 значений (если меньше, то соединяются соседние) 2) Общее число набл не <30. 3)Интервал должны быть от -∞ до + ∞ (см на стр. 2)
Критерий Колмогорова Для применения кк по результатам наблюдения составляют , после находится св Th Колмогорова Для любой св Х и >0 будет выполняться Если гипотеза отвергается. Иначе не противоречит данным.
©2015 arhivinfo.ru Все права принадлежат авторам размещенных материалов.
|