Здавалка
Главная | Обратная связь

Дискретный ряд распределения.

Тема:27 Применение ЭВМ для обработки медико-биологической информации. Основные статистические характеристики дискретного статистического ряда распределения.

1. Цель занятия: Изучить основные понятия теории вероятности, дискретные случайные величины, способы задания, числовые характеристики дискретной случайной величины.

2. Основные вопросы темы:

1. Статистика

2. Математическая статистика

3. Непрерывные и дискретные случайные величины.

4. Вероятность события?

5. Частота события.

4. Условие нормировки вероятности.

5. Генеральная совокупность и выборка.

6. Закон распределения дискретной случайной величины.

7. Дискретный статистический ряд распределения.

8. Вариационный ряд.

9. Числовые характеристики дискретного статистического распределения: выборочное среднее, выборочная дисперсия, среднее квадратическое отклонение, мода, медиана.

10. Полигон частот и относительных частот, кумулята, огнива.

Краткая теория

1. Статистика – это наука, изучающая методы обработки результатов наблюдений массовых случайных явлений, обладающих закономерностью с целью выявления этих закономерностей. (это наука о методах изучения массовых явлениях).

2. Задачи статистики: изучение структуры взаимосвязей и динамики массовых явлений. Статистика исследует не отдельные факты, а массовые явления и процессы, выступающие как множество факторов, обладают как индивидуальными так и общими признаками.

3. Математическая статистика – наука изучающая, методы сбора и обработки числовых данных для повышения эффективности их интерпретации.

1. Случайной называют величину, которая в результате опыта может

принять то или иное значение в зависимости от различных случайных обстоятельств.

Например: число вызовов врача на дом, число заболевших гриппом за месяц, скорость ветра в момент замера.

Случайные величины обозначаются заглавными буквами латинского алфавит А, В, С,…….Х, Y. Изучение случайных величин является предметом статистических исследований.

Случайные величины можно разделить на дискретные и непрерывные.

2.. Случайная величина называется дискретной (прерывной), если она принимает некоторые определенные числовые значения, число значений которой счетное. Например: число зерен в колосе, количество студентов на лекции.

Задать дискретную случайную величину можно с помощью таблицы, в которой перечислены все возможные значения случайной величины и соответствующие им вероятности

3. Непрерывные случайные величины принимают любые значения внутри некоторого интервала. Например: температура тела человека, давление крови, вес тела и.т.д.

4.. Количественной оценкой возможности появления данного случайного события является вероятность.

Если в nопытах данная случайная величина m раз приняла определенное значение, то величина ν = m/n называется статистической вероятностью или частотой данного события.

Количественной оценкой возможности появления данного случайного события является вероятность.

Классической вероятностью Р(А) события А называется отношение числа исходов m, благоприятствующих наступлению ожидаемого события А, к числу всех возможных в данном испытании исходов n. P(А)=m/n.

Вероятность любого события А подчиняется условию нормировки:

0≤Р(А)≤1.

В математической статистике изучение случайной величины связано с выполнением ряда независимых опытов, в которых она принимает определенные значения. Полученные значения случайной величины представляют собой простую статистическую совокупность или простой статистический ряд.

5. Статистическая совокупность - это множество объектов, отличающихся друг от друга, но сходных относительно некоторого качественного или количественного признака, характеризующего эти объекты.

Пример: серия таблеток лекарственного вещества. Качественный признак-стандартность таблетки. Количественный признак – контролируемая масса таблеток.

Каждый отдельный элемент,входящий в совокупность, называется членом статистической совокупности.

Общее число членов совокупности называется ее объемом(N).

Если у данной статистической совокупности изучается некоторый признак, который изменяется при переходе от одного члена совокупности к другому, то изменение этого признака называется вариацией.

Значение признака у данного члена статистической совокупности называется его вариантой.

Бесконечно большая группа всех членов, которые могут быть к ней отнесены к данной совокупности, называется генеральной.

Множество объектов, случайно отобранных из генеральной совокупности, называется выборочной совокупностью или выборкой.

Число объектов выборки называется ее объемом (n).

Выборка должна достаточно хорошо отражать свойства генеральной совокупности, должна быть репрезентативной (представительной).

Набор значений случайной величины Х, полученных в результате nопытов, обозначают Х1, Х2,…..Хi .

Вероятности случайных величин обозначаются Р(Х1)=Р1, Р(Х2)=Р2………

6. Законом распределения случайной величины называется всякое соотношение, устанавливающее связь между возможными значениями случайной величины Xi и соответствующими им вероятностями Pi того, что случайная величина Х принимает значение Xi.

Закон распределения случайной величины может быть задан:

рядом распределения, функцией распределения и кривой распределения (для непрерывных величин).

Дискретный ряд распределения.

Таблица, содержащая значения вариант и их частоты или относительной частоты, называется статистическим дискретным рядом распределения или статистическим распределением выборки.

Последовательность вариант, записанная в возрастающем порядке называется вариационным рядом.

Вариационный ряд называется ранжированным, если варианты его расположен в определенном порядке по возрастающим или убывающим значениям.

Ряд может быть построен как по дискретному, так и по непрерывному признаку.

Чтобы задать дискретную случайную величину надо перечислить ее возможные значения и вероятности, с которыми они достигаются.

Пусть из генеральной совокупности извлечена выборка объемом n. Количественное значение изучаемого признака

Х1 - появилось m1 раз,

Х2 - появилось m2 раз

Х3 - появилось m3 раз,

Х4 - появилось m4 раз,

………………………

Хк - появилось mк раз,

Числа m1, m2, m3, m4, m5…. mк - называются частотами, их отношение к объему n выборки относительными частотами.

Таблица 1.1

Х X1 X2 X3     Xk
m m1 m2 m3     mk
P1 P2 P3     Pk

Построенная таблица называется законом распределения дискретной случайной величины или дискретным вариационным рядом.

Пример 1:

В результате отдельных испытаний активности тетрациклина гидрохлорида получены значения Хi( в ЕD/мг): 925,940,760,905, 995, 965, 940, 925, 940, 940, 905. Построить дискретный вариационный ряд.[3]

 

 

Хi
Частота - n
Относительная Частота Рi 0,1 0,2 0,2 0,3 0,1 0,1

Сумма относительных частот должна быть ∑Pi= 1

0,1+0,2+0,2+0,3+0,1+0,1= 1

Для графического изображения статистического распределения дискретного ряда используются полигон, кумуляту, огиву, интервального ряда- гистограммы.

 

Полигон.

Для построения полигона на оси Ох откладывают значения вариант Х, на оси Оу – значения частот m( или относительных частот- рi). Построенную таким образом ломаную линию, отрезки которой соединяют точки (Xi;mi) или (Хi;pi) называют полигоном частот (относительных частот).

(рис 1.1,1.2).

Рис.1.1 Полигон частот Рис.1.2 Полигон частот относительных частот

Для построения кумулятыпо оси абсцисс откладываются значения вариант, а по оси ординат – накопленные частоты. Соединяя затем соответствующие точки в системе координат, получается график, называемый кумулятой (пример 2).

Накопленные частотыполучаются последовательным суммированием или кумуляцией (от лат. Cumulo- накапливаю) частот в направлении от минимальной варианты до конца вариационного ряда.Полный ряд накопленных частот обозначается через S (пример3).

Если ряд накопленных частот нанести на ось абсцисс, а значения вариант расположить по оси ординат и построить график, получаетсяогива. Огива есть не что иное как кумулята, перевернутая на 1800.[5]

 

Пример 2

Пример 3 (Si- накопленные частоты)

 

Хi
mi
Si

8.Закон распределения полностью описывает дискретную случайную величину. Однако во многих случаях он неизвестен или достаточно бывает указать отдельные числа, выражающие в сжатой форме наиболее существенные особенности распределения. Эти числа называются числовыми характеристиками случайной величины.

Числовые характеристики дискретного статистического распределения: выборочное среднее, взвешенная средняя арифметическая, математическое ожидание, выборочная дисперсия, среднее квадратическое отклонение, мода, медиана.

Характеристики статистического распределения выборки применяется для оценки неизвестных параметров теоретического распределения вероятностей.

Пусть изучается генеральная совокупность объемом N относительно количественного признака Х.

Для изучения качественного признака генеральной совокупности извлечена выборка значений признака Х123,…Хn.

Средняя величина, вычисленная на основании ряда чисел, каждое из которых встречается один раз, называется простой средней арифметической .

(1.1)

 

 

Для того, чтобы охарактеризовать рассеяние значений изучаемого признака выборки около выборочной средней Х, вводят понятие выборочной дисперсии.

( 1.2)

4)Среднее квадратичное отклонение (стандартное отклонение) равно корню квадратному из дисперсии:

 

Доверительным интерваломназывается интервал значений случайной величины, в котором с заданной вероятностью заключена средняя арифметическая генеральной совокупности.

 

Медианой (Ме) называется такое среднее значение, которое делит совокупность значений величины Хi на две равные по количеству членов части, причем в одной из них все значения Хi меньше медианы, а в другой – больше.

Для ранжированного вариационного ряда при нечетном числе членов,

т.е. при n= 2m+1 медианой будет значение среднего ряда, т.е. Меm+1,

Например, для ряда: 3,6,7,9, 11,12,13,15,17. Ме=11

Для ряда: 6,12,7,8,11,10,7,9,12,9,13,14,15 Ме=10, т.к. если все данные ранжировать, то получится ряд:

6,7,7,8,9,9,10,11,12,12,13,14,15

Если же число членов ряда четное, т.е. n=2m, то за медиану принимается среднее арифметическое двух значений хm и хm+1, находящихся в середине ряда, т.е. .

Например, для ряда 2,4,5,7,11,14,15,18 Ме=(7+11)/2=18/2=9

Для ряда: 6,7,7,8,9,10,11,12,12,13,14 Ме=(9+10)/2=4,5

Модой (Мо) называется наиболее вероятное значение случайной величины или то его значение этой величины, частота которого наибольшая.

Пример 4.Распределение лейкоцитов по числу поглощенных ими бактерий приведено в таблице.

Число поглощенных бактерий
Количество лейкоцитов

 

Наибольшая частота 241 отвечает признаку, равному 2, следовательно Mо=2





©2015 arhivinfo.ru Все права принадлежат авторам размещенных материалов.