Оглавление:
Центральным понятием теории вероятностей является понятие случайной величины, формализующее в рамках принятых выше соглашений возможность численной фиксации результатов эксперимента. Как уже отмечалось, пространство элементарных событий, описывающее эксперимент, отождествляется с совокупностью всех возможных исходов, случайная же величина представляется как совокупность чисел, которые экспериментатор с тем или иным исходом связывает. Каждому исходу эксперимента ставится в соответствие число (или несколько чисел), являющееся результатом измерения одного показателя (или нескольких), описывающего течение эксперимента. При этом однократное проведение эксперимента (испытания) дает возможность получить одно измерение каждого из показателей. Отметим, что значения измеряемых показателей являются «случайными» в том смысле, что зависят от исхода, реализовавшегося в данном испытании. Есть смысл наряду с множеством возможных значений «случайной» величины характеризовать измеряемый параметр вероятностью, с которой может быть получено то или иное значение в ряду всех возможных. Любая такая характеристика носит название закона распределения вероятностей на множестве значений случайной величины. Обсуждению этих понятий и изучению свойств связанных с ними конструкций посвящена настоящая глава.
Случайная величина
Пусть — вероятностное пространство некоторого эксперимента, — список элементарных исходов, F — список случайных событий, Р — правило вычисления вероятностей для событий из списка F. Пусть каждому элементарному исходу поставлено в соответствие действительное число .
Определение:
Будем называть случайной величиной, если для любого полуинтервала множество тех , для которых , является случайным событием.
Пример:
Игрок бросает монету — при выпадении герба он выигрывает 1 рубль, решки — проигрывает 1 рубль. Случайная величина — выигрыш игрока будет принимать значения +1 или —1 в зависимости от того, чем закончился эксперимент — гербом или решкой.
Пример:
Эксперимент — одновременное бросание двух игральных кубиков, случайная величина — сумма выпавших очков, может принимать все целые значения от 2 до 12, в зависимости от выпавшей комбинации.
Пример:
Эксперимент — n-кратное повторение эксперимента с бросанием монеты, случайная величина — количество выпавших гербов — может принимать все целые значения от 0 до n.
Пример:
Эксперимент — извлечение шара из урны, содержащей равное количество белых и черных шаров, с возвращением шара в урну после каждого извлечения, случайная величина — количество извлечений до первого появления белого шара. Эта случайная величина может принимать все целые положительные значения: 1, 2, 3,…, n, … .
Пример:
Эксперимент — случайный выбор точки из отрезка [0, 1]. Случайная величина — координата точки. Эта случайная величина может принимать любые значения от 0 до 1.
Пример:
Эксперимент — наблюдение за временем безотказной работы некоторого устройства: от момента включения до первого выхода из строя. Случайная величина — время безотказной работы — может принимать все действительные значения от 0 до
Подчеркнем, что если обозначить через полный прообраз полуинтервала [а, b) при отображении будет случайной величиной в том случае, когда и, следовательно, можно говорить о вероятности этого случайного события. Для любого полуинтервала [а, b) числовой прямой в этом случае будет определена функция
которую в дальнейшем будем называть вероятностной функцией случайной величины . Рис. 1 иллюстрирует данные выше определения; жирная пунктирная кривая изображает плотность вероятности, речь о которой пойдет ниже, в п. 2.1; горизонтальная разрывная линия условно показывает прообраз ; вероятность равна площади закрашенной серым фигуры.
Во всех указанных примерах легко установить, что события являются случайными событиями, т. е. элементами списка F.
Заметим, что если — случайная величина, то ,
являются случайными событиями и, как следствие, прообраз любого множества на числовой прямой, полученного из интервалов не более чем счетным числом операций объединения, пересечения и дополнения (борелевское множество), будет случайным событием. Доказательство немедленно следует из очевидных соотношений
и т.д.
Это позволяет говорить о вероятности попадания случайной величины в полупрямую, интервал (а, b), отрезок [а, b], точку а и т. п. Вообще, если М — борелевское множество на прямой, то осмысленным является высказывание: «вероятность попадания случайной величины в множество М равна р», так как множество тех , для которых , является случайным событием, и, следовательно, можно говорить о вероятности этого случайного события
Законом распределения вероятностей на множестве значений случайной величины , (коротко — законом распределения) будем называть любое правило, позволяющее вычислять вероятности (1).
Закон распределения может быть задан в произвольной форме, однако наиболее употребительными являются следующие:
— функция распределения вероятностей;
— плотность распределения вероятностей;
— ряд распределения вероятностей.
Функция распределения
Функцией распределения вероятностей на множестве значений случайной величины (коротко: функцией распределения случайной величины ) будем называть функцию такую, что
Отметим, что определение (2) корректно и действительно определена во всех точках числовой прямой, так как множество является случайным событием и ему можно приписать вероятность.
Свойства функции распределения
1. Функция ограничена на всей числовой прямой
2.
◄ Если а < b, то события несовместны и
Поэтому
С учетом определения (2) последнее равенство можно переписать так
или
3. Функция монотонно не убывает на всей числовой прямой
◄ С учетом неотрицательности вероятности следует из соотношения (4). ►
4.
◄ В силу монотонности и ограниченности функции на у нее существуют пределы при Пусть
Заметим, что
В силу непрерывности вероятности
что возможно лишь если
5. Функция имеет не более чем счетное число точек разрыва, при этом в каждой точке существуют односторонние пределы
Звмечвние:
Функция распределения непрерывна слева в каждой точке числовой прямой
◄ Как и выше, в силу монотонности это утверждение легко получить из непрерывности вероятности
6. Если — точка непрерывности функции , то
если же — точка разрыва, то
(рис. 2).
Для дальнейшего важным является то обстоятельство, что функция распределения есть универсальная форма задания закона распределения — у любой
случайной величины существует функция распределения. Не менее важно и то, что функция распределения не дает исчерпывающей информации о случайной величине — разные случайные величины могут обладать одинаковыми законами (в частности, функциями) распределения.
Действительно, пусть — случайная величина, описывающая выигрыш при игре в орлянку (см. пример 1). Легко установить, что
Пусть — случайная величина, определенная в эксперименте со случайным выбором точки из отрезка [0, 1] так, что
Функция распределения случайной величины тождественна функции
У этой случайной величины , определенной в таком же эксперименте, что и , следующим образом
та же функция распределения:
Рассмотренные примеры показывают, что каждая функция распределения описывает, вообще говоря, много различных случайных величин. Правда, эти случайные величины, если так можно выразиться, «не очень разные» — в реальном эксперименте у нас нет никакой возможности различить случайные величины потому что реальный эксперимент, как правило, дает нам возможность произвести измерения значений случайной величины, но не дает возможности установить, как эти значения связаны с элементарными исходами, которые в подавляющем большинстве реальных экспериментов остаются «вещью в себе». Поэтому на практике экспериментатор имеет дело с функцией распределения вероятностей на множестве значений случайной величины, а не с функцией от элементарных исходов на пространстве элементарных исходов.
Интересно поэтому выяснить, какие функции могут быть функциями распределения и как, зная функцию распределения, указать по крайней мере одну из случайных величин, описываемых этой функцией. Оказывается, что любая монотонно-неубывающая на Ж функция F(x), непрерывная слева в каждой точке и такая, что
может служить функцией распределения. Точнее, имеет место
Теорема:
Пусть F(x) — функция, определенная на всей числовой прямой и обладающая указанными выше свойствами. Тогда существует вероятностное пространство и случайная величина такие, что F(x) является функцией распределения случайной величины ,
◄ Укажем одну из возможных конструкций требуемого пространства. Пусть эксперимент состоит в случайном выборе точки из R так, что . В качестве наблюдаемых случайных событий рассмотрим наименьшую -алгебру, порожденную полуинтервалами [а, b) (борелевскую -алгебру на прямой), т. е. совокупность всех множеств, полученных из полуинтервалов с помощью не более чем счетного количества объединений, пересечений и дополнений. Определим вероятности на множестве случайных событий следующим образом:
1. Если то
2. Если то
Можно показать, что определенное соотношениями (8) и (9) правило вычисления вероятностей удовлетворяет всем требованиям, предъявляемым к вероятности: условию неотрицательности , нормировки (P{Q} = 1) и счетной аддитивности.
В качестве вероятностного пространства возьмем пространство , где -алгебра борелевских множеств, Р — правило вычисления вероятностей, порожденное соотношениями (8) и (9).
Положим теперь на
Легко видеть, что
чем и завершается доказательство. ►
Рассмотрим несколько примеров.
1. Равномерное распределение на отрезке [а, b]. Случайную величину будем называть равномерно распределенной на отрезке [а, b], если вероятность попадания значений этой случайной величины в любой подпромежуток отрезка [а, b] не зависит от его положения на [a, b] и пропорциональна длине этого промежутка:
Условие нормировки позволяет легко определить значение k —
Функция распределения дается соотношением
Равномерную на отрезке [a, b] случайную величину будем обозначать . Числа а и b называются параметрами равномерного распределения.
2. Распределение аргумента и длины радиус-вектора случайной точки в круге радиуса r. Пусть эксперимент состоит в извлечении случайной точки из круга радиуса г с центром в начале координат, так, что вероятность точке быть извлеченной из некоторого борелевского множества D пропорциональна площади этого множества
Пусть — угол, образованный радиус-вектором точки М с положительным направлением оси Ох, — длина радиус-вектора точки М. Отметим, что в рассматриваемом эксперименте являются случайными величинами, и для их функций распределения получаем (см. рис. 3)
так, что
Заметим, что — равномерная на случайная величина.
3. Распределение Коши. Пусть L — прямая и А — точка, расположенная на расстоянии a > 0 от прямой L (рис. 4) Выберем начало отсчета в точке O, являющейся основанием перпендикуляра, опущенного из А на L. Пусть — угол, отсчитываемый от АО вправо или влево и составленный прямой, проходящей через точку А, и отрезком АО.
Эксперимент состоит в следующем: случайным образом выбирается направление прямой, проходящей через точку А, и фиксируется координата точки М пересечения прямых AM и L.
Случайная величина — координата точки М на прямой L — называется случайной величиной, распределенной по Коши, и обозначается следующим образом:
По определению функции распределения
Предположение о случайности выбора направления прямой AM дает основание для заключения о равномерности распределения угла на промежутке, при этом последняя вероятность будет равна
так что
Число а называется параметром распределения Коши.
4. Экспоненциальное распределение. Эксперимент состоит в наблюдении за временем безотказной работы некоторого агрегата. Известно, что вероятность выхода агрегата из строя в любой промежуток времени длины t одна и та же и не зависит от расположения этого промежутка на временной оси. Это свойство носит название свойства отсутствия последействия и означает, что только что включенный прибор и этот же прибор, уже проработавший некоторое время Т, имеют одинаковую вероятность выйти из строя в течение времени от 0 до t и от Т до Т +1 соответственно.
Пусть — время безотказной работы агрегата. Тогда свойство отсутствия последействия означает, что
Предполагая, что и используя формулу условной вероятности, получаем
Если ввести функцию распределения F((t) времени безотказной работы агрегата, то соотношение (15) примет вид
Это уравнение относительно функции распределения F((t), которая дополнительно к (16) обладает тем свойством, что
Предположим, что — непрерывная функция. Тогда уравнение (16) имеет своим решением функцию
Случайная величина , имеющая распределение (17), называется экспоненциальной случайной величиной с параметром и будет в дальнейшем обозначаться так —
Для доказательства формулы (17), заметим, что любая непрерывная на функция , удовлетворяющая уравнению (16), является дифференцируемой. Действительно, пусть — произвольная дифференцируемая функция, обращающаяся в нуль вне некоторого промежутка Умножая обе части соотношения (16) на и интегрируя на полупрямой от 0 до , получаем
или, полагая в первом из интегралов Т +t = u, —
где
— постоянные. В силу дифференцируемости и непрерывности интеграл в соотношении (18) — дифференцируемая по переменной t функция. Следовательно, — дифференцируемая функция.
Продифференцируем теперь (16), например, по переменной Т. Положив Т = 0, получим
— обыкновенное дифференциальное уравнение первого порядка относительно с начальным условием . Для завершения доказательства формулы (17) заметим, что в силу неубывания функции распределения
Плотность распределения
Плотностью распределения вероятностей на множестве значений случайной величины (коротко: плотностью распределения случайной величины) будем называть функцию такую, что
Не всякую случайную величину можно описать плотностью — существуют случайные величины, для которых функция , обладающая свойством (19), не может быть определена. Тем не менее, если плотность у случайной величины существует, то она обладает следующими свойствами:
1.
◄ Легко следует из определения (19). ►
Замечание:
Отметим, что в тех точках — непрерывна, имеет место соотношение
Вообще же, функция распределения непрерывна на всей числовой прямой, что немедленно следует из (20).
2. Если — точка непрерывности , то
или
Замечание. Последнее соотношение означает, что «плотность» распределения вероятностей действительно плотность- «количество вероятности», приходящееся на единицу длины.
◄ Оба соотношения (22) и (23) следуют из определения (19). ►
3. Условие нормировки плотности
◄ Следует из (20) и соответствующего свойства функции распределения. ►
Так же, как и функция распределения (и любая другая форма, в которой может быть задан закон распределения), плотность не определяет однозначно случайную величину — разные случайные величины могут иметь одну и ту же плотность.
Любая неотрицательная интегрируемая на R функция, удовлетворяющая условию нормировки (20), может быть плотностью некоторой случайной величины. Примером такой случайной величины служит случайная величина функция распределения которой дается соотношением (20),
◄ Действительно, монотонно не убывает (в силу неотрицательности непрерывна на всей числовой прямой и принимает на концах значения 0 и 1 соответственно. Поэтому , как это следует из теоремы предыдущего пункта, является функцией распределения некоторой случайной величины, для которой будет плотностью. ►
Пример:
Нормальная (гауссова) случайная величина. Случайная величина называется нормальной, или гауссовой случайной величиной, если ее плотность распределения задается соотношением ( > 0, т — произвольное действительное число)
◄ Отметим, что формула (25) действительно задает плотность распределения при любых значениях параметра m и любых положительных значениях параметра , так как
График функции , описываемой соотношением (25), приведен на рис. 5. При любых значениях параметров это симметричная (относительно х = m) колоколообразная кривая, быстро убывающая при Исходя из вероятностного смысла плотности, случайная величина, подчиненная нормальному закону, с большей вероятностью принимает значения, лежащие около х = m, и с меньшей вероятностью — значения, заметно отличающиеся от х = m. Параметр т показывает расположение оси симметрии распределения
а параметр — степень «размазанности» вероятности по числовой прямой (рис. 6).
Нормальное распределение характеризует следующую тенденцию в поведении случайной величины: в эксперименте с высокой вероятностью реализуются значения, близкие к m, причем чем меньше значение , тем меньше могут отклоняться наблюдаемые в эксперименте значения от m. Этому качественному утверждению можно придать количественную форму.
Правило З. В подавляющем большинстве случаев значения, принимаемые случайной величиной, имеющей нормальное распределение с параметрами m и , отличаются от m не более чем на З. Точнее
Рассмотрим
где
— функция Лапласа, таблица значений которой приведена на с. 69. В силу симметрии
и, так как Р(3) = 0,99865, то для искомой вероятности получаем
Ниже будет показано (см. Центральную предельную теорему), что при достаточно широких предположениях случайные величины, являющиеся суммой большого числа независимых слагаемых, будут иметь распределение, близкое к нормальному.
Нормальную случвйную величину с пврвметрами m, будем обозначать так:
В заключение отметим, что рассмотренные выше равномерная на промежутке [а, b] случайная величина, экспоненциальная случайная величина и величина, распределенная по Коши, обладают плотностями, графики которых изображены на рис. 7.
Распределение, обладающее плотностью, будем называть абсолютно непрерывным распределением, а соответствующую случайную величину — непрерывной случайной величиной.
Если случайная величина непрерывна, то каждое свое значение она принимает с нулевой вероятностью,
Это, очевидно, следует из соотношения (19). Не следует, однако, считать, что подобное свойство присуще лишь непрерывным случайным величинам — существуют (см. п. 2.1.4, пример 1) случайные величины, не являющиеся непрерывными, однако также обладающие этим свойством.
Ряд распределения
Определение:
Рядом распределения случайной величины называется такая форма задания закона распределения, когда перечисляются все возможные значения случайной величины с указанием положительных вероятностей, с которыми случайная величина эти значения принимает.
Ряд распределения может быть задан таблицей вида
где все различны, и
При помощи подобного ряда можно задать закон распределения только такой случайной величины, которая принимает с положительными вероятностями не более чем счетное множество значений. Такие случайные величины называются дискретными.
Отметим следующие очевидные соотношения:
1.
2.
первое из которых показывает, что ряд (*) является законом распределения, а второе дает выражение для функции распределения дискретной случайной величины.
Пример:
Распределение Бернулли. Случайная величина, принимающая значение 1 с вероятностью р и значение 0 с вероятностью q = 1 — р, называется бернуллиевой случайной величиной. Ее ряд распределения дается таблицей
Функция распределения бернуллиевой случайной величины имеет вид
(рис 8).
Бернуллиева случайная величина обычно появляется в приложениях как индикатор (характеристическая случайная величина) некоторого события если в эксперименте выделить событие Y, интересующее исследователя, а все прочие события объединить в , так, что , то случайная величина , будет индикатором события У
Пример:
Биномиальное распределение.
Определение:
Случайная величина называется биномиальной случайной величиной с параметрами (n,р), если она описывает количество успехов в серии из n независимых испытаний, в каждом из которых вероятность успеха одна и та же и равна р.
Обозначение:
Ряд распределения биномиальной случайной величины (см. биномиальный эксперимент) может быть задан соотношением
Функция распределения биномиальной случайной величины имеет вид
Отметим, что если вероятность изображать вертикальным отрезком с абсциссой в точке то распределение биномиальных вероятностей будет изображаться графической схемой, приведенной на рис. 9.
Если то легко видеть,
что
поэтому
Отсюда ясно, что вероятности монотонно растут от , а затем монотонно убывают от k = М до k = n. Значение называется наиболее вероятным. Заметим, что наиболее вероятных значений у биномиальной случайной величины не более двух и по крайней мере одно всегда есть.
Пример:
Распределение Пуассона. Рассматривается последовательность п независимых экспериментов с постоянной вероятностью успеха р в каждом испытании. Будем предполагать, что вероятность успеха р крайне мала, так что успех — событие в отдельном испытании редкое, однако количество испытаний n настолько велико, что — постоянная величина. Тогда получим
Последнее дает основание для следующего определения:
Определение:
Пуассоновой случайной величиной с параметром будем называть дискретную случайную величину, ряд распределения которой дается соотношениями
Обозначение:
Определение корректно, так как
Таким образом, пуассонова случайная величина описывает количество успехов в серии из неограниченно большого количества испытаний в предположении, что вероятность успеха в каждом отдельном испытании исчезающе мала. Пуассоновым распределением хорошо описываются такие случайные величины, как количество вызовов, поступающих на АТС в единицу времени, количество звезд, наблюдающихся в заданном объеме Галактики;
количество деревьев, приходящихся на единицу площади леса; количество радиовктивных частиц, регистрируемых счетчиком Гейгера в единицу времени, и другие. Даже такая экзотическая величина, как количество лиц, убитых ударом копыта в прусском армейском корпусе в течение года, — и та подчиняется пуассоновому распределению.
Графически распределение пуассоновых вероятностей на множестве целых неотрицательных чисел изображено на рис.
Теорема Лебега. Обобщенные плотности
Пусть — случайная величина, — ее функция распределения (являющаяся, напомним, универсальной формой задания закона распределения вероятностей на множестве значений случайной величины). В некоторых случаях, наряду с функцией распределения, можно указать и другие формы задания закона распределения: плотность распределения или ряд распределения. В первом из указанных случаев функция распределения должна быть абсолютно непрерывной, т. е.
во втором функция распределения должна быть кусочно постоянной. Ясно, что совокупность функций , которые могут служить функциями распределения этими двумя классами не исчерпывается (см. теорему раздела 2.1.1). Например, кусочно абсолютно непрерывные функции описывают случайные величины, являющиеся смесью дискретных и непрерывных. Однако помимо довольно широкого класса подобных случайных величин (о них ниже) существуют еще случайные величины, не являющиеся ни дискретными, ни непрерывными, ни смешанными.
Пример Канторова лестница:
Пусть С — канторово множество на отрезке [0,1]. Определим функцию следующим образом: На отрезке положим , на отрезках и положим соответственно. На отрезках припишем значения и соответственно, и так далее, до бесконечности (рис. 11).
Отметим следующие свойства определенной таким образом функции
- монотонно не убывает,
2. принимает все значения из промежутка [0,1],
3. непрерывна на R,
4. постоянна в окрестности любой точки, не принадлежащей множеству С.
Пусть теперь — случайная величина, для которой — функция распределения. не является дискретной, так как — непрерывна, и следовательно, также не является непрерывной, так как в этом случае функция должна была бы восстанавливаться по своей производной, но по свойству 4 производная почти всюду (во всех точках отрезка [0, 1] за исключением точек канторова множества) равна нулю.
Этот пример является в некотором смысле исчерпывающим: оказывается любая случайная величина — это «смесь» дискретной, непрерывной и сингулярной (подобной рассмотренной в примере 1 случайных величин. Точнее, имеет место следующая теорема.
Теорема Лебега:
Если — случайная величина с функцией распределения , то существуют функции такие, что единственным образом представима в виде
и при этом
1.
2.
3. — непрерывна на R, монотонно не убывает и постоянна почти всюду, имеет изменение, равное 0 < r < 1, так что р + q + r = 1.
Если сингулярная компонента отсутствует, то случайная величина является «смесью» дискретной и непрерывной компонент
В дальнейшем в этом случае нам будет удобно использовать следующее соглашение: если через обозначить дельта-функцию Дирака, обладающую тем свойством, что
то обобщенной плотностью распределения (37) будем называть формальное выражение вида
где
так что
и
Последнее соотношение является формальным аналогом соотношения (20), дающего выражение функции распределения через плотность. В дальнейшем мы будем понимать обобщенную плотность как условную форму записи интегральных соотношений (40).
Пример:
Пусть Найдем закон распределения случайной величины
По определению не принимает значений, больших 1. Поэтому
в то же время откуда
Для получим
(рис. 12). Это распределение является распределением описанного выше типа. Обобщенная плотность может быть представлена здесь в виде
Системы случайных величин — случайные векторы
Пусть — вероятностное пространство и каждому элементарному исходу поставлена в соответствие упорядоченная совокупность n действительных чисел
Определение:
Будем называть случайным вектором, или системой n случайных величин, если для любого параллелепипеда
множество тех , для которых , является случайным событием.
В этом случае легко показать, что случайными событиями будут и все события вида , где А — произвольное борелевское множество в и тем самым можно определить вероятностную функцию
определенную на -алгебре борелевских множеств в .
Понятие случайного вектора формализует в теории вероятностей возможность в одном эксперименте зафиксировать несколько различных числовых показателей.
Пример:
Эксперимент состоит в случайном выборе точки М из круга на плоскости . Пусть — абсцисса, а — ордината выбранной точки. Тогда — случайный вектор.
◄ В силу случайности выбора точки из круга К можно считать, что для любого борелевского множества вероятность выбора точки М пропорциональна площади этого множества
Вектор — радиус-вектор точки М. Для любого борелевского получаем
(рис. 13), и тем самым для произвольного борелевского множества определена вероятностная функция
Легко установить, что компоненты случайного вектора — случайные величины. Несколько менее очевидно, но столь же легко устанавливается, что если — случайные величины в некотором эксперименте, и А — борелевское множество из , то событие — является случайным событием в этом эксперименте и, следовательно, — случайный вектор.
С компонентами случайного вектора можно производить различные операции, и в подавляющем большинстве случаев результат этих операций является осмысленным с рассматриваемой — вероятностной — точки зрения, т. е. случайной величиной. Точнее, имеет место следующая
Теорема:
Пусть , — случайный вектор, — борелевская функция в . Тогда является случайной величиной.
◄ То обстоятельство, что — борелевская функция, означает, что прообраз полуинтервала является борелевским множеством в , а это, в свою очередь, означает, что — случайная величина, так как
Особо отметим, что сумма, разность, произведение, частное (если знаменатель «почти всегда» не нуль) пары случайных величин будут случайными величинами. Случайными величинами будут также результаты применения любых непрерывных, кусочно непрерывных или монотонных функций к случайным величинам.
Законы распределения случайных векторов
Пусть — случайный вектор, и А — произвольное борелевское множество в . Законом распределения , будем называть любое правило, позволяющее вычислять вероятности
Как и в случае одномерных случайных величин, закон распределения случайного вектора может быть задан в произвольной форме. Универсальной формой задания закона распределения случайного вектора является функция распределения, определяемая соотношением
Как и выше (см. п. 2.1.1), легко устанавливаются следующие свойства функции (3).
1. Ограниченность
2. — закон распределения.
Чтобы не загромождать изложение выкладками, приведем в качестве примера формулу нахождения вероятностей через значения для n = 2 (рис. 14):
3. «Монотонность» таких, что
4. Существование пределов
5. Непрерывность слева
Аналог теоремы п. 2.1.1 справедлив и в этой ситуации.
Отметим, что знание функции распределения случайного вектора позволяет определить функцию распределения любого подвектора, в том числе и функции распределения отдельных компонент. Действительно, пусть — подвектор случайного вектора Тогда
в частности,
Знание законов распределения компонент вектора , не позволяет, вообще говоря, восстановить функцию распределения вектора. Впрочем, это понятно — индивидуальные законы распределения компонент не учитывают информацию о возможном их взаимодействии. Подробнее этот вопрос мы обсудим ниже.
Определение:
Плотностью распределения случайного вектора , назовем такую функцию , что для любого борелевского
Отсюда же ясно, что плотность чаще всего действительно имеет механический смысл «плотности» — это «количество вероятности», приходящееся на единицу меры (длины, площади, объема, n-мерного объема). В самом деле, в каждой точке непрерывности функции получаем, что существует предел
Ясно, что
и
Во всех точках непрерывности плотности имеем дифференциальный аналог соотношения (7):
Случайные векторы, обладающие плотностью распределения, называются непрерывными. Всякий подвектор непрерывного случайного вектора является непрерывным случайным вектором, плотность распределения которого можно найти из соотношения
В частности, плотность i-ой компоненты дается формулой
Обратное неверно, т. е. непрерывность компонент не гарантирует непрерывности случайного вектора.
Как и в случае с функцией распределения, индивидуальные плотности не позволяют находить совместную плотность распределения случайного вектора, так как в общем случае не содержат информации о возможном взаимодействии компонент.
Если случайный вектор принимает не более чем счетное множество значений, то его закон распределения может быть задан в форме ряда распределения, в котором перечислены возможные значения вектора с вероятностями, соответствующими этим значениям
Все точки в этой таблице различны и
Очевидным образом имеем:
1.
для любого борелевского множества
2.
Неравенство в последнем соотношении понимается как покомпонентное
Такие случайные векторы называются дискретными. Всякий подвектор дискретного вектора также является дискретным случайным вектором. Его ряд распределения задается таблицей
где — подвектор вектора , а вероятности
причем суммирование в последней сумме ведется по всем значениям вектора содержащим в качестве подвектора вектор
Ряд распределения i-й компоненты представлен в таблице
Здесь — значения i-х компонент векторов-значений случайного вектора , т. е. , где суммирование ведется по всем r таким, что векторы имеют одинаковую i-ю компоненту
Этими двумя классами случайных векторов (т. е. непрерывными и дискретными) многообразие возможных систем случайных величин, конечно, не исчерпывается. Отметим, в частности, еще два важных для приложений класса — это, во-первых, «смеси» дискретных и непрерывных случайных векторов, в том числе случайные векторы, у которых часть компонент дискретна, а часть — непрерывна; а во-вторых, абсолютно непрерывные распределения, сосредоточенные на множествах, размерность которых меньше размерности объемлющего пространства. Существуют и другие случайные векторы, на особенностях распределения которых мы останавливаться не будем, ввиду их «экзотичности». В реальной ситуации они, как правило, не встречаются.
Что касается перечисленных, то для единообразного описания их законов распределения воспользуемся, как и выше (п. 2.1.4), символической формой представления обобщенных плотностей, выразив последние через дельта-функцию множества.
Пусть 7 — некоторое множество точек . Дельта-функцией множества назовем функцию , определенную в всюду, кроме точек множества , обращающуюся в нуль во всех точках и обладающую тем свойством, что для любой непрерывной функции f(х)
Определение:
Обобщенной плотностью распределения случайного вектора будем называть формальное выражение вида
где
1. функция неотрицательна, , интегрируема и
2. — дельта-функция точки
3. для любого j функции неотрицательны, интегрируемы на соответствующем множестве и
При этом для любого борелевского множества получаем, что
Именно в смысле равенства (15) мы и будем в дальнейшем понимать формальное выражение (14) для «обобщенной плотности».
Рассмотрим несколько примеров, иллюстрирующих введенные понятия.
Пример:
Пусть в эксперименте выделена полная система несовместных событий таких, что . Случайный вектор j-я компонента которого — количество осуществлений события в серии из n независимых испытаний, носит название полиномиального случайного вектора. Легко убедиться в том, что полиномиальный случайный вектор дискретен. Его ряд распределения дается соотношением
или, в векторной записи,
Пример:
Равномерное распределение в круге. Пусть — координаты случайной точки в круге радиуса 1 с центром в начале координат. «Случайность» точки в круге понимается так, что вероятность ее попадания в любую область внутри круга пропорциональна площади этой области
Заметим, что в каждой точке существует предел (см. соотношение (6))
где — окрестность точки х. Поэтому определена функция
являющаяся плотностью распределения случайного вектора , так что для любого борелевского
Тем самым, случайный вектор — непрерывен.
Пример:
Пусть — случайный вектор единичной длины. В данном случае случайность понимается так: вероятность того, что напрввление на плоскости задается диапазоном углов от до , пропорциональному диапазону:
Множество значений вектора совпадает с множеством точек единичной окружности . Следовательно не является дискретным. Не является он и непрерывным, так как легко установить, что для всех точек, лежащих на единичной окружности, предел
не существует, а во всех прочих точках плоскости равен нулю.
Эта случайная величина может быть описана обобщенной плотностью , задаваемой соотношением
где — -функция окружности.
Действительно, для любого борелевского получаем
(см. рис. 15).
Независимость случайных величин. Условные законы распределения
Как уже было отмечено выше, знание индивидуальных законов распределения компонент случайного вектора не дает полной информации о совместном их законе распределения. Дело в том, что индивидуальные законы не позволяют учесть возможное взаимодействие компонент.
Пример:
Пусть — равномерная на [0,1] случайная величина. Тогда — также равномерна на [0, 1], а совместное распределение сосредоточено на отрезке
и может быть описано обобщенной плотностью вида
В то же время двумерная случайная величина , равномерно распределенная на квадрате описывается плотностью
и ее компоненты, как следует из соотношения (10}
также равномерны на [0, 1]. Таким образом, при одном и том же характере распределения компонент совместные распределения (17) и (18) совершенно различны.
Одно из центральных понятий теории вероятностей — независимой случайной величины — проливает свет на описанную выше ситуацию и позволяет внести ясность в рассматриваемый вопрос.
Определение:
Случайные величины называются независимыми, если для любых борелевских множеств на прямой случайные события и независимы.
Как мы знаем (см. гл. XXXVIII), для независимости событий необходимо и достаточно, чтобы выполнялось соотношение
для любых , а это, в свою очередь, имеет место тогда и только тогда, когда для любых полуинтервалов справедлив аналог соотношения (19),
Соотношение (19) показывает, что в случае независимости двух случайных величин совместный закон их распределения полностью и однозначно восстанавливается по индивидуальным законам распределения компонент. В частности, легко устанавливается следующая теорема.
Теорема:
Случайные величины независимы тогда и только тогда, когда имеет место равенство
т. е. совместная функция распределения равна произведению индивидуальных.
◄ Необходимость немедленно следует из (19), если только
Для доказательства достаточности воспользуемся формулой (4). Пусть равенство (21) имеет место. Тогда
откуда в силу сделанного выше замечания о равенствах (19) и (20) следует искомое.
► Аналогичные утверждения можно установить и для специальных классов распределений: дискретных, описываемых рядами распределения, непрерывных, описываемых плотностями, а также более сложных, описываемых обобщенными плотностями. А именно, имеют место следующие утверждения.
Утверждение:
Если — дискретные независимые случайные величины с рядами распределения соответственно то двумерный случайный вектор дискретен и его ряд распределения дается соотношением
Верно и обратное: если компоненты двумерного дискретного вектора таковы, что
то они независимы.
◄ Доказательство немедленно следует из определения независимости и соотношения (20). ►
Утверждение:
Если случайные величины непрерывны и независимы, то двумерный случайный вектор непрерывен и его плотность равна произведению индивидуальных плотностей
Верно и обратное: если совместная плотность распределения представима в виде (22), то компоненты вектора — независимые случайные величины.
Замечание:
Если компоненты случайного вектора непрерывны, то это, как показывает рассмотренный выше пример, не гарантирует непрерывности собственно вектора как двумерной случайной величины. Поэтому утверждение о непрерывности вектора является не менее важным, чем формула (22). Оба же эти утверждения оказываются справедливыми в силу независимости случайных величин
◄ Пусть, — плотность распределения случайной величины — случайной величины . Из независимости заключаем, что
Значит, для любого прямоугольника функция такова, что
Отсюда следует справедливость аналогичного соотношения для любого борелевского А, что и завершает доказательство необходимости соотношения (22).
Так же просто убеждаемся в обратном
Утверждение:
Если случайные величины — независимы и обладают обобщенными плотностями (см. соотношения (18)), то двумерный случайный вектор обладает обобщенной плотностью (14) и имеет место равенство
◄ Доказательство повторяет формальные выкладки из предыдущего утверждения с учетом следующих технических замечаний:
Суммируя вышеизложенное, отметим, что независимость двух случайных величин содержательно эквивалентна отсутствию влияния одной из случайных величин на другую: изменение одной из них не влияет на закон распределения другой. Если же это не так, т. е. информация о значениях, принятых одной из случайных величин, меняет наши представления о законе распределения другой случайной величины, то мы говорим, что случайные величины зависимы. В этом случае разумно описывать влияние случайных величин друг на друга системой условных вероятностей, образующих так называемые условные распределения, к рассмотрению которых мы и перейдем.
Рассмотрим пару случайных величин совместный закон распределения которых
Пусть
Определение:
Условным законом распределения компоненты (случайной величины) относительно события назовем любое правило, позволяющее вычислять условные вероятности для произвольных борелевских
По определению условной вероятности получаем, что
В частности, если для некоторого , то можно определить условную функцию распределения относительно
она будет определена при всех
Если — независимы, то
Из соотношения (23) получаем аналог «правила умножения» (21) функций распределения для зависимых случайных величин
Аналогично определяются условные законы для относительно
Пример:
Пусть — равномерная на [-1, 1] случайная величина и . Индивидуальные функции распределения компонент даются в этом случае соотношениями:
Совместный закон распределения может быть описан обобщенной плотностью где Распределение вектора с компонентами сосредоточено на отрезке прямой (рис. 16). Функция распределения вектора
Условные законы имеют, очевидно, следующий вид (рис. 17):
Отметим, что несмотря на непрерывность компонент , вектор непрерывным не является, так как непрерывность компонент случайного вектора — условие, лишь необходимое для непрерывности вектора; оно становится и достаточным только при условии независимости компонент.
Предположим теперь, что случайный вектор непрерывен, т. е. обладает плотностью распределения . В этом случае, как мы знаем (см. (10)), компоненты также непрерывны с плотностями
Если в некоторой окрестности точки выполняется неравенство то можно определить условный закон распределения случайной величины относительно события
Последнее соотношение дает основание для следующего определения.
Определение:
Условной плотностью распределения вероятностей случайной величины , относительно события называется функция такая, что для любого борелевского выполняется соотношение
Сравнивая (26) и (27), заключаем, что у каждой компоненты двумерного непрерывного вектора существует условная плотность относительно значений другой компоненты, принимаемой с положительной вероятностью (например, относительно тех значений , для которых . Она дается равенством
Отсюда получаем правило умножения плотностей
В случае независимости компонент £1 и £2 из (28) следует
т. е. информация о значениях, принятых компонентой , не меняет закона распределения компоненты .
Определение (27) и соотношение (28) позволяют в рассматриваемой ситуации получить континуальные аналоги формул полной вероятности и Бейеса (см. гл. XXXVIII).
Теорема:
Формула полной вероятности. Пусть — непрерывный двумерный случайный вектор. Тогда
◄ Действительно, соотношение (10) дает
Остается только воспользоваться второй частью правила умножения (29). ►
Теорема (формула Бейеса). Пусть — непрерывный двумерный случайный вектор. Тогда
◄ Доказательство следует из (28) с использованием правила умножения (29) и формулы полной вероятности (30). ►
Рассмотрим пример, иллюстрирующий введенные понятия.
Пример:
Пусть — двумерный вектор, равномерно распределенный в круге Для любого
борелевского
Следовательно, плотность распределения случайной величины дается соотношением:
Плотности компонент соответственно равны (рис. 18)
Для условных плотностей из (28) получаем
где — длина хорды MN
где — длина хорды KL.
Заметим, что при фиксированном значении компонента равномерно распределена на хорде MN, аналогично равномерно распределена на KL при фиксированном . В то же время, частные распределения равномерными не являются.
Очевидна зависимость компонент — изменение значений одной из компонент вызывает изменение диапазона возможных значений другой и, следовательно, ее закона распределения: если принимает значение, скажем, 1, то может принять только нулевое значение, если же может принять любое значение в диапазоне от -1 до +1.
Наконец, если — дискретный вектор с рядом распределения
и , то компоненты , также дискретны с рядом распределения
и — возможные значения соответствующей компоненты (т. е. просто различные первые — — или вторые — — координаты векторов ). При этом
где суммирование ведется по всем таким точкам , первые (вторые) координаты которых совпадают с .
Если , то условный ряд распределения компоненты относительно события можно определить так
Как и выше, из (32) можно получить правило умножения рядов распределения для зависимых компонент, а также дискретные аналоги соотношений (30) и (31), являющиеся обобщением формул полной вероятности и Бейеса на случай не более чем счетного числа гипотез.
Что такое случайные величины
1 Случайной величиной (СВ) называется величина, которая в результате испытания может принять различные числовые значения в зависимости от случая. Случайные величины обозначают заглавными буквами X,Y…..а принимаемые ими значения — соответствующими строчными буквами х,у,….
2 Соотношение, устанавливающее связь между возможными значениями случайной величины и их вероятностями, называется законом распределения случайной величины
3 Пусть X — случайная величина и х — произвольное число. Тогда вероятность того, что X примет значение, меньшее, чем х, называется функцией распределения вероятностей данной случайной величины X: F(x) = р(Х < х).
Основными свойствами функции распределения являются:
1) если а < b, то
2) F(x) — неубывающая функция;
Дискретные случайные величины. Основные законы распределения
1°. Дискретной случайной величиной (ДСВ) называется величина X, принимающая отдельные (изолированные) возможные значения с вероятностями соответственно.
Множество значений ДСВ — конечное или счетное, a
2°. Под законом распределения ДСВ будем понимать зависимость вероятностей k = 1,2, …, того, что X принимает значения , от самих значений
Закон распределения ДСВ может быть задан при помощи: а)таблицы:
б) формулы, функции (аналитически):
в) графика: ломаная, соединяющая точки называется многоугольником (или полигоном) распределения.
г) функции распределения вероятностей если задана ДСВ то F(x) кусочно-постоянна и имеет вид:
Стрелки на графике F(x) (рис. 7.1) обозначают одностороннюю непрерывность F(x) слева в каждой точке
3°. ДСВ называется распределенной по биномиальному закону, или по закону Бернулли, если она принимает конечное число значений
0, 1,2, …. n с вероятностями, соответствующими формуле:
где р — некоторое неизвестное число, 0 < р < 1.
Если А — случайное событие с вероятностью р = р(А), то число наступлений события А в n независимых испытаниях есть случайная величина, распределенная по биномиальному закону.
Биномиальный закон определяется двумя параметрами n и р.
4°. ДСВ X называется распределенной по закону Пуассона с параметром , если она принимает счетное количество значений с вероятностями
5°. Случайная величина X распределена по геометрическому закону, если она принимает счетное количество значений k = 1,2,… с вероятностями
Геометрическое распределение определяется одним параметром р и описывает случайную величину X, определяющую число испытаний до наступления события, при условии, что его вероятность равна р.
6°. Случайная величина X называется распределенной по гипер-геометрическому закону с тремя параметрами M, N и n, если X принимает конечное число значений k, где с вероятностями
Задачи с решениями
Задача:
Дискретная случайная величина X принимает возможные значения 1, 2, 3, 4 с вероятностями соответственно 0,25; 0,35; 0,3 и р. Найти р, составить таблицу распределения и построить полигон распределения.
Решение:
Число р находим из условия 0,25 + 0,35 + 0,3 + р = 1. Получаем р = 0,1. Полигон представлен на рис. 7.2, а таблица имеет вид:
Задача:
Составить биномиальный закон распределения с параметрами n = 5 и р = 0,6.
Решение:
ДСВ X может принимать 6 значений: 0, 1, …, 5. Вероятности этих значений вычислим по формуле Бернулли:
Задача:
Написать первые 4 члена распределения Пуассона с параметром
Решение:
Имеем
Примечание:
Распределение Пуассона может служить хорошим приближением для биномиального закона, если n велико, а р мало; при этом
Распределение Пуассона затабулировано для некоторых значений .
Задача:
Баскетболист бросает мяч в кольцо. Вероятность попадания при одном броске равна 0,6. Составить закон распределения вероятностей числа бросков, если баскетболист прекращает броски, как только попадет в кольцо.
Решение:
Число бросков X до первого попадания в кольцо есть случайная величина, принимающая возможные значения 1, 2, 3, ….
X = 1 означает, что баскетболист попал первым броском. Вероятность этого значения равна 0,6, т.е. р(Х =1) = 0,6. X = 2 означает, что баскетболист произвел два броска, а значит, при первом броске было непопадание, при втором — попадание. Поэтому р(X = 2) = 0,4 • 0,6 = 0,24. X = 3 означает, что было произведено три броска, причем первые два — непопадания, третий — попадание.
Значит,
так как это означает к бросков, (k — 1) из которых были непопадания, а последний, k-й — попадание. Таблица, или ряд распределения, значений X имеет вид:
Задача:
В урне находятся 9 шаров, из них 5 белых и 4 черных. Из урны наугад вынимаются 4 шара. Пусть X — число белых шаров среди вынутых. Построить закон распределения ДСВ X.
Решение:
Подобная задача в более общем виде рассмотрена. VI (см. задачу 6): N = 9, М = 5, n = 4, k = 0, 1, 2, 3, 4.
Поскольку то знаменатели всех 5 дробей равны 126. Результаты округлим до трех цифр после запятой:
Закон распределения имеет вид:
Числовые характеристики дискретных случайных величин
1°. Математическим ожиданием ДСВ X, принимающей значения с вероятностями соответственно, называется величина
Если X принимает бесконечное множество значений, то над знаком суммы вместо n пишется а в правой части этого равенства имеем бесконечный ряд, сходящийся или расходящийся.
М(Х) — вероятностное среднее значений X — выражает «центр» ДСВ X. Если считать, что в точка сосредоточены соответственно массы , то М(Х) задает центр масс (центр тяжести) этой системы материальных точек. Значения X распределены около М(Х).
2°. Математическое ожидание М(Х) обладает свойствами:
1) если С — постоянная, то М(С) = С;
2) М(СХ) = С • М(Х) ;
3) М(Х + Y) = М(Х) + М(У);
4) если X и Y — независимые ДСВ, то М(Х • Y) = М(Х) • М(У).
3°. Математическое ожидание случайной величины, распределенной по известному закону, выражается через параметры этого закона.
Если случайная величина X распределена по закону:
— Бернулли с параметрами р и n, то М(Х) = рn;
— Пуассона с параметром , то
— геометрическому с параметром р, то М(Х) = 1/р;
— гипергеометрическому с параметрами N, М, n, то
4°. Если М(Х) — математическое ожидание X, то величина называется отклонением X от своего математического ожидания. Разность
X — М(Х) есть случайная величина, принимающая как положительные, так и отрицательные значения. Нетрудно заметить, что
М[Х — М(Х)] = 0.
Дисперсией ДСВ X называется математическое ожидание квадрата отклонения X от своего математического ожидания:
Величину D(x) можно вычислить по формуле:
вытекающей из определения дисперсии.
Основные свойства дисперсии выражаются равенствами:
1) D(C) = 0;
3) D(X + Y) = D(X) + D(Y);
4) если X и Y — независимые, то D(XY) = D(X) • D(Y).
Величина называется средним квадратическим
отклонением и выражает степень разброса X около М(Х). Дисперсия случайной величины, распределенной по известному закону, выражается через параметры этого закона.
Если случайная величина X распределена по закону:
— Бернулли, то D(X) — npq;
— Пуассона, то
— геометрическому, то D(X) = 1 /р — р;
— гипергеометрическому, то
5° Начальным моментом порядка k ДСВ X называется математическое ожидание k-й степени этой величины (рассматривают 4 момента):
В частности,
6°. ДСВ X — М(Х) называется также центрированной ДСВ. Центральным моментом порядка к ДСВ X называется начальный момент порядка к ДСВ X — М(Х):
В частности,
Имеют место формулы:
7°. Асимметрией и эксцессом ДСВ X называются соответственно величины
As(X) называется также нормированным третьим центральным моментом, а Еk(Х) — нормированным четвертым центральным моментом ДСВ X. Знаки As(Х) и Еk(Х) указывают на отклонения графика закона распределения X от нормального распределения, для которого As = 0, Ек = 0 (рис. 73-7.8).
Задачи с решениями
Задача:
Вычислить математическое ожидание случайной величины X, распределенной по биномиальному закону с параметрами р = 0,6 и n = 5.
Решение:
Составим ряд распределения X:
Значения и поместим в таблицу (с. 305), к которой присоединим еще одну строку для произведений Сумма чисел этой строки составляет М(Х).
Заметим, что М(Х) = 3,0 = 5 • 0,6 = р«.
Ответ. 3,0.
Задача:
Вычислить дисперсию и среднее квадратическое отклонение случайной величины X, распределенной по закону Бернулли с параметрами р = 0,6 и n = 5.
Решение:
Ряд распределения получен в задаче 1. Воспользуемся формулой
Для вычисления составим строку для т.е. умножим поэлементно третью строку таблицы из задачи 1 на строку X.
Имеем
Сумма всех чисел этой строки равна 10,2, т.е. Тогда
Заметим, что D(X) = 1,2 = 5 • 0,6 • 0,4 = npq.
Задача:
Случайная величина X задана законом распределения
Полигон распределения представлен на рис. 7.9. Вычислить начальные и центральные моменты первых четырех порядков величины X и дать соответствующую интерпретацию
Решение:
Вычисления удобнее провести по столбцам таблицы (с. 306). В нижней строке указаны суммы чисел соответствующих столбцов.
Получили (округляем до двух цифр после запятой):
По формулам п. 6° вычислим центральные моменты:
Имеем
также
Ответ. Математическое ожидание М(Х) = 1,35. Дисперсия D(X) = 0,9; среднее квадратическое отклонение, т.е. средний разброс асимметрия As = 0,94, показывающая скошенность графика распределения вправо; эксцесс Еk(Х) = — 0,004, что означает слабо выраженную низковершинность.
Задача:
Независимые случайные величины X и У заданы законами распределения
Составить закон распределения случайной величины Z = 2Х — У. Найти математические ожидания и дисперсии величин X, Y, Z и убедиться в том, что M(Z) = 2М(Х) — М(У), D(Z) = 4D(X) + D(Y). Вычислить также
М(ЗХ + 2Y) и D(3X + 2У).
Решение:
1) Случайная величина Z = 2X -Y принимает всевозможные значения z = 2х — у, где
Соответствующие им вероятности p(Z = z) вычисляются путем умножения вероятностей, с которыми получаются частные значения X = х и У = у p(Z = 2х — у) = р(Х = х) • p(Y = у). Например, Z принимает значения z = 3 только при х = 2 и у = 1. Поэтому Аналогично,
Если же Z принимает свое значение при различных комбинациях значений X и У, то вероятность p(Z = z) получается сложением вероятностей отдельных комбинаций хну, для которых z = 2х — у.
Например, Z принимает значение z = 5 при х = 2, у = -1 или х = 3, у = 1. В таком случае р(Z = 5) = р(Х = 2) • р(У = -1) + р(Х = 3) • (У = 1) = 0,1 • 0,6 + 0,9 • 0,1 =0,15.
Таким образом, получаем (недостающие вычисления предлагаем выполнить самостоятельно) закон распределения величины
Z = 2Х — Y:
Правильность полученного закона подтверждается тем, что
2) Величина X принимает лишь два значения, поэтому М(Х) и D(X) вычисляем согласно определению (см. п. 1° и 4°): М(Х) =
Величина Z — более сложная (принимает 5 значений), поэтому M(Z) и D(Z) вычислим при помощи следующей рабочей таблицы:
Искомые величины определим при помощи последнего столбца:
(здесь применили формулу из п. 4°).
Величины М(У) и D(Y) предлагаем вычислить самостоятельно одним из способов, использованных выше. В любом случае должно получиться:
3) Равенства, входящие в условие задачи:
М(2Х — У) = 2М(Х) — M(Y), D(2Х — У) = 4D(X) + D(Y)
выражают свойства математического ожидания и дисперсии, приведенные в п. 4°. Они сводятся к числовым равенствам:
5,7 = 2 • 2,9 — 0,1; 2,25 = 4 • 0,09 + 1,89.
4) Математическое ожидание и дисперсию случайной величины
U = ЗХ + 2У можно найти, используя вычисления, выполненные выше,и свойства математического ожидания и дисперсии, приведенные в п. 2° и п. 4°. Получаем:
Непрерывные случайные величины
1°. Непрерывной случайной величиной (НСВ) называется случайная величина X, принимающая значения, сплошь заполняющие некоторый промежуток (а, b), конечный или бесконечный.
2°. Функцией распределения случайной величины X называется функция F(x), определяющая для каждого х вероятность того, что величина X принимает значение, меньшее, чем х:
Функция F(x), называемая также функцией вероятностей X, или интегральной функцией распределения, обладает следующими свойствами.
1) Свойство ограниченности:
2) Свойство монотонности: если
в частности,
4) Если X принимает значения из интервала (а; b), то F(x) = 0 при и F(x) = 1 при
В общем случае имеют место предельные равенства:
5) Функция F(x) непрерывна на всей прямой, и график у = F(x) имеет горизонтальные асимптоты у = 0 (влево) и у = 1 (вправо).
3°. Плотностью распределения, или плотностью вероятности случайной величины X называется производная функция вероятности:
При этом
Функция плотности обладает свойствами:
1) неотрицательности:
Задачи с решениями
Задача:
Случайная величина X задана плотностью распределения при и f(х) = 0 при
Определить параметр а и функцию распределения F(x). Найти также вероятность того, что в четырех испытаниях X ровно три раза примет значения, принадлежащие интервалу (0,25; 0,75).
Решение:
Значение параметра а определим из условия
Мы учли, что f(х) = 0 при Отсюда а = 3. Итак, имеем и f(x) = 0 , (рис. 7.10, а). Далее, Если то
а если х > 1, то
Таким образом,
Определим теперь
Наконец, по формуле Бернулли вычисляем
Задача:
Случайная величина X задана интегральной функцией распределения
Требуется: а) найти значение параметра а; б) найти плотность вероятности f(х); в) построить графики функций у = F(x) и у = f(х);
г) найти вероятность того, что X принадлежит интервалу
Решение:
а) Функция F(x) непрерывна на всей прямой (см. свойство 5) п. 2°), в частности, непрерывна при значении х = е. Следовательно,
а тогда
Тем самым
б) Согласно определению (см. п. 3°) f(х) = F'(x), Следовательно,
в) Графики функций у = F(x) и у = f(х) изображены соответственно на рис. 7.11, а и 7 11, б.
г) Требуемую вероятность вычислим при помощи функции F(x) согласно свойству 3) п. 2°:
Числовые характеристики непрерывных случайных величин
Числовые характеристики НСВ аналогичны числовым характеристикам ДСВ и имеют тот же смысл, что и для ДСВ. Соответствующие формулы содержат интегралы вместо сумм.
1) Математическое ожидание — среднее значение X — равно
2) Дисперсия — математическое ожидание квадрата отклонения величины X от своего математического ожидания — равна
Имеет место формула
3) Среднее квадратическое отклонение X от математического ожидания равно
4) Начальный момент порядка k НСВ равен
5) Центральный момент порядка k НСВ равен
6) Асимметрия
7) Эксцесс НСВ равен
8) Центральные моменты выражаются через начальные моменты при помощи формул:
9) Модой Мо (Х) НСВ X называется возможное значение X = х, соответствующее локальному максимуму плотности f(х). Если f(х) имеет два локальных максимума, то X называется бимодальной, а если f(х) максимума не имеет, то X не имеет моды.
10) Медианой Ме(Х) НСВ X называется возможное значение X = х, такое, что
Числовые характеристики непрерывных случайных величин
Числовые характеристики НСВ аналогичны числовым характеристикам ДСВ и имеют тот же смысл, что и для ДСВ. Соответствующие формулы содержат интегралы вместо сумм.
Задачи с решениями
Задача:
Для случайной величины X, заданной функцией распределения F(x) = 0 при х < 2, при и F(x) = 1 при х > 4, определить: значение параметра а, функцию плотности f(х), начальные и центральные моменты первых четырех порядков, а также асимметрию и эксцесс. Построить графики f(x) и
Решение:
Имеем
Отсюда а = 0,25. Далее, f(х) = F'(x) = 0,5(х — 2), Тем самым (см. рис. 7.12 и 7.13)
Вычисление начальных моментов:
Центральные моменты будем вычислять при помощи интегралов (некоторые детали опускаем):
Отдельно выделим
Таким образом, среднее значение X — центральное значение равно среднееквадратичное отклонение — разброс — равно 0,47, распределение имеет скошенность влево и расположено ниже нормального распределения
Задача:
Плотность распределения вероятностей непрерывной случайной величины X имеет график, представленный на рис. 7.14. Требуется найти: а) неизвестное число m; б) функцию распределения случайной величины X и построить ее график; в) математическое ожидание М(х); г) дисперсию D(x)
Решение:
а) Дифференциальная функция f(х) удовлетворяет равенству Так как f(x)=0 при и при x >8
это равенство примет более простой вид
Вспомним геометрический смысл определенного интеграла: он численно равен площади криволинейной трапеции, ограниченной сверху графиком функции у = f(х), а снизу — отрезком интегрирования В нашей задаче такой криволинейной трапецией является треугольник AGC. Следовательно,
откуда или
Таким образом, и, значит, G(4, 1/3).
б) Составляем уравнение прямой AG:
Составляем уравнение прямой GC:
Записываем дифференциальную функцию f(х) непрерывной случайной величины X:
Используя формулу найдем функцию распределения
Если то f(х) = 0, следовательно,
Если
Если то
Итак, искомая функция распределения имеет вид:
График функции распределения изображен на рис 7. 15.
в) Найдем математическое ожидание случайной величины X:
г) Вычислим дисперсию
Основные законы распределения непрерывных случайных величин
Равномерным называется распределение, функции плотности и вероятности которого имеют вид (рис. 7.16 и 7.17).
Для равномерного распределения имеют место равенства:
2° Показательным называется распределение, функции плотности и вероятности которого имеют вид (рис. 7.18 и 7.19):
Для показательного распределения имеют место равенства:
Показательное распределение характеризуется одним параметром Оно находит применение в задачах, связанных с качеством производства, в теории надежности и др.
3°. Функции плотности и распределения нормального закона имеют вид (рис. 7.20 и 7.21):
Нормальное распределение определяется двумя параметрами а = М(Х) — математическое ожидание и — среднее квадратическое отклонение, где
При a = 0 и нормальное распределение называется стандартным.
При этом
— дифференциальная функция Лапласа;
— интегряльная функция Лапласа.
Для нормального распределения имеют место равенства:
Нормальное распределение применяется в задачах, связанных с теорией измерений, теорией ошибок и пр.
Задачи с решениями
Задача:
Случайная величина X распределена равномерно в интервале (-4; 6). Написать функции плотности и распределения X и вычислить вероятности
Решение:
Имеем а = — 4, b = б, b — а = 10. Следовательно,
Поэтому
Задача:
Случайная величина X распределена по показательному закону с параметром Написать функции плотности и распределения X и вычислить вероятность
Решение:
Имеем при х > 0 и f(х) = 0 при Далее, при х > 0 и F(x) = 0 при Наконец,
Задача:
Величина X распределена нормально с параметрами Вычислить вероятности того, что:
Решение:
Воспользуемся равенством 2) из п. 3°. Напомним, что Ф(—х) = —Ф(х), и значения Ф(х) находим в табл. 1 приложения.
а) Здесь Следовательно,
б) Здесь
в) Здесь используем равенство 3) из п.
Задача:
Плотность распределения нормально распределенной случайной величины X имеет вид:
Требуется найти:
а) неизвестный параметр
б) математическое ожидание M(х) и дисперсию D(x);
в) вероятность выполнения неравенства — 5 < х < -3,5;
г) вероятность выполнения неравенства где
Решение:
а) Так как
Сравнивая последнее выражение с канонической записью f(х) =
плотности нормально распределенной случайной величины X, устанавливаем, что
Отсюда
б) Математическое ожидание М(Х) = а = 2,5; дисперсия D(X) =
в) Согласно равенству
г) По формуле 3) при а = —2,5; вычисляем
Закон больших чисел
1°. В определенных условиях событие А можно считать практически невозможным, если (р близко к нулю) или практически достоверным, если Под, законом больших чисел понимается совокупность предложений, утверждающих с вероятностью, близкой к 1, что наступит некоторое событие, зависящее от большого числа случайных факторов, каждый из которых оказывает на это событие незначительное влияние.
2°. К закону больших чисел относятся, в частности, следующие утверждения.
Неравенства Чебышева
Для любой случайной величины X, имеющей конечную дисперсию D(X), при любом имеют место неравенства:
Теорема Чебышева:
Если — система n независимых случайных величин, имеющих ограниченные дисперсии
то для любого числа имеет место неравенство:
Теорема Бернулли:
Пусть т — число наступлений события А в п независимых испытаниях, р = р(А) — одна и та же вероятность наступления А в каждом испытании. Тогда для любого имеет место неравенство.
Задачи с решениями
Задача:
При изготовлении костюмов брак составляет 2%. Вычислить вероятность того, что при осмотре партии из 800 костюмов выявится отклонение от установленного процента брака меньше, чем на 1%
Решение:
Необходимо оценить вероятность где m — число бракованных костюмов из 800, а — доля бракованных костюмов. По теореме Бернулли требуемую вероятность оцениваем снизу числом
Ответ. Искомая вероятность не меньше, чем 0,755.
Задача:
Средняя урожайность данной сельскохозяйственной культуры составляет 30 ц с гектара. Какую урожайность можно ожидать с вероятностью, не меньшей, чем 0,75?
Решение:
Известно математическое ожидание М(Х) = 30 (СВ X — урожайность). По смыслу задачи, имеем дело с третьим неравенством Чебышева: Следовательно, необходимо найти из равенства Имеем откуда Тем самым можно написать оценку т.е. ожидаемая урожайность может быть до 120 ц с гектара.
Задача:
Количество воды, необходимое предприятию в течение суток, является случайной величиной X с математическим ожиданием Найти вероятность того, что в ближайшие сутки расход воды превысит
Решение:
Воспользуемся первым неравенством Чебышева с М(Х) — 200 и Искомая вероятность удовлетворяет неравенству
Ответ
Задача:
Дана последовательность случайных величин причем ДСВ может принимать три значения: 0 и (— постоянная) с вероятностями соответственно Применим ли к данной последовательности закон больших чисел (теорема Чебышева)?
Решение:
Необходимо проверить лишь условие ограниченности последовательности дисперсий. Имеем:
Итак, дисперсии одинаковы, т.е. последовательность ограничена. Теорема Чебышева применима, с вероятностью, сколь угодно близкой к 1, среднее арифметическое достаточно большого числа случайных величин будет сколь угодно мало (так как )
Случайные величины и их распределения
Смотрите также:
Предмет теория вероятностей и математическая статистика
Переходные вероятности | Многомерные распределения |
Теорема о предельных вероятностях | Независимость случайных величин |
Случайные величины и их законы распределения
В разделе курса, посвященном основным понятиям теории вероятностей, мы уже ввели в рассмотрение чрезвычайно важное понятие случайной величины. Здесь мы дадим дальнейшее развитие этого понятия и укажем способы, с помощью которых случайные величины могут быть описаны и характеризованы.
Ряд распределения. Многоугольник распределения
Как уже было сказано, случайной величиной называется величина, которая в результате опыта может принять то или иное значение, неизвестно заранее — какое именно. Мы условились также различать случайные величины прерывного (дискретного) и непрерывного типа. Возможные значения прерывных величин ‘ могут быть заранее перечислены. Возможные значения непрерывных величин не могут быть заранее перечислены и непрерывно заполняют некоторый промежуток.
Примеры прерывных случайных величин: 1) число появлений герба при трех бросаниях монеты (возможные значения 0, 1, 2, 3); 2) частота появления герба в том же опыте (возможные значения ); 3) число отказавших элементов в приборе, состоящем из пяти элементов (возможные значения 0, 1, 2, 3, 4, 5); 4) число попаданий в самолет, достаточное для вывода его из строя (возможные значения 1, 2, 3, …. n, …); 5) число самолетов, сбитых в воздушном бою (возможные значения 0, 1, 2, N, где N—общее число самолетов, участвую- участвующих в бою).
Примеры непрерывных случайных величин: 1) абсцисса (ордината) точки попадания при выстреле; 2) расстояние от точки попадания до центра мишени; 3) ошибка измерителя высоты; 4) время безотказной работы радиолампы.
Условимся в дальнейшем случайные величины обозначать большими буквами, а их возможные значения— соответствующими малыми буквами. Например, X — число попаданий при трех выстрелах; возможные значения:
Рассмотрим прерывную случайную величину X с возможными значениями . Каждое из этих значений возможно, но не достоверно, и величина X может принять каждое из них с некоторой вероятностью. В результате опыта величина Х примет одно из этих значений, т. е. произойдет одно из полной группы несовместных событий:
(5.1.1)
Обозначим вероятности этих событий буквами р с соответствую- соответствующими индексами:
Так как несовместные события (5.1.1) образуют полную группу, то
т. е. сумма вероятностей всех возможных значений случайной вели- величины равна единице. Эта суммарная вероятность каким-то образом распределена между отдельными значениями. Случайная величина будет полностью описана с вероятностной точки зрения, если мы зададим это распределение, т. е. в точности укажем, какой вероятностью обладает каждое из событий (5.1.1). Этим мы установим так называемый закон распределения случайной величины.
Законом распределения случайной величины называется всякое соотношение, устанавливающее связь между возможными значениями случайной величины и соответствующими им вероятностями. Про случайную величину мы будем говорить, что она подчинена данному закону распределения.
Установим форму, в которой может быть задан закон распределения прерывной случайной величины X. Простейшей формой задания этого закона является таблица, в которой перечислены возможные значения случайной величины и соответствующие им вероятности:
Такую таблицу мы будем называть рядом распределения случайной величины X.
Чтобы придать ряду распределения более наглядный вид часто прибегают к его графическому изображению: по оси абсцисс откладываются возможные значения случайной величины, а по оси ординат — вероятности этих значений. Для наглядности полученные точки соединяются отрезками прямых. Такая фигура называется многоугольником распределения (рис. 5.1.1). Многоугольник распределения, так же как и ряд распределения, полностью характеризует случайную величину; он является одной из форм закона распределения.
Иногда удобной оказывается так называемая «механическая» интерпретация ряда распределения. Представим себе, что некоторая масса, равная единице, распределена по оси абсцисс так, что в n отдельных точках, сосредоточены соответственно массы Тогда ряд распределения интерпретируется как система материальных точек с какими-то массами, расположенных на оси абсцисс.
Рассмотрим несколько примеров прерывных случайных величин с их законами распределения.
Пример:
Производится один опыт, в котором может появиться или не появиться событие А. Вероятность события А равна 0,3. Рассматривается случайная величина X—число появлений события А в данном опыте (т. е. характеристическая случайная величина события А, принимающая значение 1, если оно появится, и 0, если не появится). Построить ряд распределения и многоугольник распределения величины X.
Решение:
Величина X имеет всего два значения: 0 и 1, Ряд распре- распределения величины X имеет вид:
Многоугольник распределения изображен на рис. 5.1.2.
Пример:
Стрелок производит три выстрела по мишени. Вероятность попадания в мишень при каждом выстреле равна 0,4. За каждое попадание стрелку засчитывается 5 oчков . Построить ряд распределения числа выбитых очков.
Решение:
Обозначим X число выбитых очков. Возможные значения величины X:
Вероятности этих значений находим по теореме о повторении опытов:
Ряд распределения величины X имеет вид:
Многоугольник распределения изображен на рис. 5.1.3.
Пример:
Вероятность появления события А в одном опыте равна р. Производится ряд независимых опытов, которые продолжаются до первого появления события А, после чего опыты прекращаются. Случайная величина Х— число произведенных опытов. Построить ряд распределения величины X.
Решение:
Возможные значения величины Х: 1, 2, 3, … (теоретически они ничем не ограничены). Для того чтобы величина X приняла значение 1, необходимо, чтобы событие А произошло в первом же опыте; вероятность этого равна р. Для того чтобы величина X приняла значение 2, нужно, чтобы в первом опыте событие А не появилось, а во втором — появилось; вероятность этого равна qр, где q = 1 — р, и т. д. Ряд распределения величины X имеет вид:
Первые пять ординат многоугольника распределения для случая p = q = 0,5 показаны на рис. 5.1.4.
Пример:
Стрелок ведет стрельбу по мишени до первого попадания, имея боезапас 4 патрона. Вероятность попадания при каждом выстреле равна 0,6. Построить ряд распределения боезапаса, оставшегося неизрасходованным.
Решение:
Случайная величина X — число неизрасходованных патронов — имеет четыре возможных значения: 0, 1, 2 и 3. Вероятности этих значений равны соответственно:
Ряд распределения величины X имеет вид:
Многоугольник распределения показан на рис. 5.1.5.
Пример:
Техническое устройство может применяться в различных условиях и в зависимости от этого время от времени требует регулировки. При однократном применении устройства оно может случайным образом попасть в благоприятный или неблагоприятный режим. В благоприятном режиме устройство выдерживает три применения без регулировки; перед четвертым его приходится регулировать. В неблагоприятном режиме устройство приходится регулировать после первого же применения. Вероятность того, что устройство попадает в благоприятный режим,— 0,7, что в неблагоприятный, — 0,3. Рассматривается случайная величина X—число применений устройства до регулировки. Построить ее ряд распределения.
Решение:
Случайная величина X имеет три возможных значения: 1, 2 и 3. Вероятность того, что Х=1, равна вероятности того, что при первом же применении устройство попадет в неблагоприятный режим, т. е. p1 = 0,3. Для того чтобы величина X приняла значение 2, нужно, чтобы при первом применении устройство попало в благоприятный режим, а при втором — в неблагоприятный; вероятность этого р2 = 0,7 • 0,3 = 0,21. Чтобы величина X приняла значение 3, нужно, чтобы два первых раза устройство попало в благоприятный режим (после третьего раза его все равно придется регулировать). Вероятность этого равна р3 = 0,7*0,7 = 0,49. Ряд распределения величины X имеет вид:
Многоугольник распределения показан на рис. 5.1.6.
Функция распределения
В предыдущем п° мы ввели в рассмотрение ряд распределения как исчерпывающую характеристику (закон распределения) прерывной случайной величины. Однако эта характеристика не является универсальной; она существует только для прерывных случайных величин. Нетрудно убедиться, что для непрерывной случайной величины такой характеристики построить нельзя. Действительно, непрерывная случайная величина имеет бесчисленное множество возможных значений, сплошь заполняющих некоторый промежуток (так называемое «несчетное множество»). Составить таблицу, в которой были бы перечислены все возможные значения такой случайной величины невозможно. Кроме того, как мы увидим в дальнейшем, каждое отдельное значение непрерывной случайной величины обычно не обладает никакой отличной от нуля вероятностью. Следовательно, для непрерывной случайной величины не существует ряда распределения в том смысле, в каком он существует для прерывной величины. Однако различные области возможных значений случайной величины все же не являются одинаково вероятными, и для непрерывкой величины существует «распределение вероятностей», хотя и не в том смысле, как для прерывной.
Для количественной характеристики этого распределения вероятностей удобно воспользоваться не вероятностью события X = х, а вероятностью события X < х, где х — некоторая текущая переменная. Вероятность этого события, очевидно, зависит от х, есть некоторая функция от х. Эта функция называется функцией распределения случайной величины X и обозначается F(x):
(5.2.1)
Функцию распределения F(х) иногда называют также интегральной функцией распределения или интегральным законом распределения.
Функция распределения — самая универсальная характеристика случайной величины. Она существует для всех случайных величин: как прерывных, так и непрерывных. Функция распределения полностью характеризует случайную величину с вероятностной точки зрения, т. е. является одной из форм закона распределения.
Сформулируем некоторые общие свойства функции распределения.
- Функция распределения F(x) есть неубывающая функция своего аргумента, т. е. при
- На минус бесконечности функция распределения равна нулю:
- На плюс бесконечности функция распределения равна единиц
Не давая строгого доказательства этих свойств, проиллюстрируем их с помощью наглядной геометрической интерпретации. Для этого будем рассматривать случайную величину X как случайную точку X на оси Ох (рис. 5.2.1), которая в результате опыта может занять то или иное положение. Тогда функция распределения F (х) есть вероятность того, что случайная точка X в результате опыта попадет левее точки х.
Будем увеличивать х, т. е. перемещать точку х- вправо по оси абсцисс. Очевидно, при этом вероятность того, что случайная точка X попадет левее х, не может уменьшиться; следовательно, функция распределения F (х) с возрастанием х убывать не может.
Чтобы убедиться в том, что , будем неограниченно перемещать точку х влево по оси абсцисс. При этом попадание случайной точки X левее х в пределе становится невозможным событием; естественно полагать, что вероятность этого события стремится к кулю, т. е.
Аналогичным образом, неограниченно перемещая точку х вправо, убеждаемся, что , так как событие X < x становится в пределе достоверным.
График функции распределения F (х) в общем случае представляет собой график неубывающей функции (рис. 5.2.2), значения которой начинаются от 0 и доходят до 1, причем в отдельных точках функция может иметь скачки (разрывы).
Зная ряд распределения прерывной случайной величины, можно легко построить функцию распределения этой величины. Действительно,
. где неравенство xі < x под знаком суммы указывает, что суммирование распространяется на все те значения xі, которые меньше х.
Когда текущая переменная х проходит через какое-нибудь из возможных значений прерывной величины X, функция распределения меняется скачкообразно, причем величина скачка равна вероятности этого значения.
Пример:
Производится один опыт, в котором может появиться или не появиться событие А. Вероятность события А равна О,3 Случайная величина X—число появлений события А в опыте (характеристическая случайная величина события А). Построить ее функцию распределения.
Решение:
Ряд распределения величины Х имеет вид:
Построим функцию распределения величины X:
График функции распределения представлен на рис. 5.2.3. В точках разрыва функция F (X) принимает значения, отмеченные на чертеже точками (функция непрерывна слева).
Пример:
В условиях предыдущего примера производится 4 независимых опыта. Построить функцию распределения числа появлений события А.
Решение:
Обозначим X—число появлений события А в четырех опытах. Эта величина имеет ряд распределения
Построим функцию распределения случайной величины X:
График функции распределения представлен на рис. 5.2.4.
Функция распределения любой прерывной случайной величины всегда есть разрывная ступенчатая функция, скачки которой происходят в точках, соответствующих возможным значениям случайной величины, и равны вероятностям этих значений. Сумма всех скачков функции F(x) равна единице.
По мере увеличения числа возможных значений случайной вели- величины и уменьшения интервалов между ними число скачков становится больше, а сами скачки — меньше; ступенчатая кривая становится более плавной (рис. 5.2.5); случайная величина постепенно приближается к непрерывной величине, а ее функция распределения—к непрерывной функции (рис. 5.2.6).
На практике обычно функция распределения непрерывной случайной величины представляет собой функцию, непрерывную во всех точках, как это показано на рис. 5.2.6. Однако можно построить примеры случайных величин, возможные значения которых непрерывно заполняют некоторый промежуток, но для которых функция распределения не везде является непрерывной, а в отдельных точках терпит разрывы (рис. 5.2.7). Такие случайные величины называются смешанными. В качестве примера смешанной величины можно привести площадь разрушений, наносимых цели бомбой, радиус разрушительного действия которой равен R (рис. 5.2.8). Значения этой случайной величины непрерывно заполняют промежуток от 0 до но при этом крайние значения промежутка 0 и осуществляющиеся при положениях бомбы типа / и //, обладают определенной конечной вероятностью, и этим значениям соответствуют скачки функции распределения, тогда как в промежуточных значениях (положение типа III) функция распределение непрерывна. Другой пример смешанной случайной величины — время Т безотказной работы прибора, испытываемого в течение времени t. Функция распределения этой случайной величины непрерывна всюду, кроме точки t.
Вероятность попадания случайной величины на заданный участок
При решении практических задач, связанных со случайными вели- величинами, часто оказывается необходимым вычислять вероятность того, что случайная величина примет значение, заключенное в некоторых пределах, например, от а до .Это событие мы будем называть «попаданием случайной величины X на участок от а до ».
Условимся для определенности левый конец а включать в уча- участок , а правый—не включать. Тогда попадание случайной величины X на участок равносильно выполнению неравенства:
Выразим вероятность этого события через функцию распределения величины X. Для этого рассмотрим три события:
событие А, состоящее в том, что
событие В, состоящее в том, что
событие С, состоящее в том, что
Учитывая, что А = В + С, по теореме сложения вероятностей имеем:
или
откуда
(5.3.1)
т. е. вероятность попадания случайной величины на заданный участок равна приращению функции распределения на этом участке.
Будем неограниченно уменьшать участок полагая, что В пределе вместо вероятности попадания на участок получим вероятность того, что величина примет отдельно взятое значение а:
Значение этого предела зависит от того, непрерывна ли функция F(x) в точке х — а или же терпит разрыв. Если в точке a функция F (х) имеет разрыв, то предел (5.3.2) равен значению скачка функции F (х) в точке а. Если же функция F (х) в точке а непрерывна, то этот предел равен нулю.
В дальнейшем изложении мы условимся называть «непрерывными» только те случайные величины, функция распределения которых везде непрерывна. Имея это в виду, можно сформулировать следующее положение:
Вероятность любого отдельного значения непрерывной случайной величины равна нулю.
Остановимся на этом положении несколько подробнее. В данном курсе мы уже встречались с событиями, вероятности которых были равны нулю: это были невозможные события. Теперь мы видим, что обладать нулевой вероятностью могут не только невозможные, но и возможные события. Действительно, событие X = а, состоящее в том, что непрерывная случайная величина Х примет значение а, возможно; однако вероятность его равна нулю. Такие события — возможные, но с нулевой вероятностью—появляются только при рассмотрении опытов, не сводящихся к схеме случаев.
Понятие о событии «возможном, но обладающем нулевой вероятностью» кажется на первый взгляд парадоксальным. В действительности оно не более парадоксально, чем представление о теле, имеющем определенную массу, тогда как ни одна из точек внутри тела определенной конечной массой не обладает. Сколь угодно малый объем, выделенный из тела, обладает определенной конечной массой; эта масса приближается к нулю по мере уменьшения объема и в пределе равна нулю для точки. Аналогично при непрерывном распределении вероятностей вероятность попадания на сколь угодно малый участок может быть отлична от нуля, тогда как вероятность попадания в строго определенную точку в точности равна нулю.
Если производится опыт, в котором непрерывная случайная вели- величина X должна принять одно из своих возможных значений, то до опыта вероятность каждого из таких значений равна нулю; однако, в исходе опыта случайная величина X непременно примет одно из своих возможных значений, т. е. заведомо произойдет одно из событий, вероятности которых были равны нулю.
Из того, что событие Х = а имеет вероятность, равную нулю, вовсе не следует, что это событие не будет появляться, т. е. что частота этого события равна нулю. Мы знаем, что частота события при большом числе опытов не равна, а только приближается к вероятности. Из того, что вероятность события X =а равна нулю, следует только, что при неограниченном повторении опыта это событие будет появляться сколь угодно редко.
Если событие А в данном опыте возможно, но имеет вероятность, равную нулю, то противоположное ему событие имеет вероятность, равную единице, но не достоверно. Для непрерывной случайной величины X при любом а событие . имеет вероятность, равную единице, однако это событие не достоверно. Такое событие при неограниченном повторении опыта будет происходить почти всегда, но не всегда.
В п°5.1 мы познакомились с «механической» интерпретацией прерывной случайной величины как распределения единичной массы, сосредоточенной в нескольких изолированных точках на оси абсцисс. В случае непрерывной случайной величины механическая интерпретация сводится к распределению единичной массы не по отдельным точкам, а непрерывно по оси абсцисс, причем ни одна точка не обладает конечной массой.
Плотность распределения
Пусть имеется непрерывная случайная величина X с функцией распределения F(x), которую мы предположим непрерывной и дифференцируемой. Вычислим вероятность попадания этой случайной величины на участок от х до
т. е. приращение функции распределения на этом участке. Рассмотрим отношение этой вероятности к длине участка,- т. е. среднюю вероятность, приходящуюся на единицу длины на этом участке, и будем приближать к нулю. В пределе получим производную от функции распределения:
(5.4.1)
Введём обозначение:
(5.4.2)
Функция f (х) — производная функции распределения — характеризует как бы плотность, с которой распределяются значения случайной величины в данной точке. Эта функция называется плотностью распределения (иначе— «плотностью вероятности») непрерывной случайной величины X. Иногда функцию f(x) называют также «дифференциальной функцией распределения» или «дифференциальным законом распределения» величины X.
Термины «плотность распределения», «плотность вероятности» становятся особенно наглядными при пользовании механической интерпретацией распределения; в этой интерпретации функция f(x) буквально характеризует плотность распределения масс по оси абсцисс (так называемую «линейную плотность»). Кривая, изображающая плотность распределения случайной величины, называется кривой распределения (рис. 5.4.1).
Плотность распределения, так же как и функция распределения, есть одна из форм закона распределения. В противоположность функции распределения эта форма не является универсальной: она существует только для непрерывных случайных величин.
Рассмотрим непрерывную случайную величину X с плотностью распределения f (х) и элементарный участок dx, примыкающий к точке х (рис. 5.4.2). Вероятность попадания случайной величины X на этот элементарный участок (с точностью до бесконечно малых высшего порядка) равна f(x)dx. Величина f(x)dx называется элементом вероятности . Геометрически это есть площадь элементарного прямоугольника, опирающегося на отрезок dx (рис. 5.4.2).
Выразим вероятность попадания величины X на отрезок от а до (рис. 5.4.3) через плотность распределения. Очевидно, она равна сумме элементов вероятности на всем этом участке, т. е. интегралу: (5.4.3)
Геометрически вероятность попадания величины X на участок равна площади кривой распределения, опирающейся на этот участок (рис. 5.4.3).
Формула (5.4.2) выражает плотность распределения через функцию распределения. Зададимся обратной задачей: выразить функцию распределения через плотность. По определению
откуда по формуле (5.4.3) имеем:
(5.4.4)
‘) Так как вероятность любого отдельного значения непрерывной случайной величины равна нулю, то можно рассматривать здесь отрезок , не включая в него левый конец, т. е. отбрасывая знак равенства в
Геометрически F(x) есть не что иное, как площадь кривой распределения, лежащая левее точки х (рис. 5.4.4).
Укажем основные свойства плотности распределения.
- Плотность распределения есть неотрицательная функция:
Это свойство непосредственно вытекает из того, что функция распределения F {х) есть неубывающая функция.
2.Интеграл в бесконечных пределах от плотности распределения равен единице:
Это следует из формулы (5.4.4) и из того, что
Геометрически основные свойства плотности распределения означают, что:
1) вся кривая распределения лежит не ниже оси абсцисс; 2) полная площадь, ограниченная кривой распределения и осью абсцисс, равна единице.
Выясним размерности основных характеристик случайной величины — функции распределения и плотности распределения. Функция распределения F(x), как всякая вероятность, есть величина безразмерная. Размерность плотности распределения f(x), как видно из формулы (5.4.1), обратна размерности случайной величины.
Пример:
Функция распределения непрерывной случайной величины X задана выражением
а) Найти коэффициент а. б) Найти плотность распределения f (х). в) Найти вероятность попадания величины X на участок от 0,25 до 0,5.
Решение:
а) Так как функция распределения величины X непрерывна, то при х = 1 = 1, откуда а = 1.
в) По формуле (5.3.1) имеем:
Пример:
Случайная величина X подчинена закону распределения с плотностью:
а) Найти коэффициент а. б) Построить график плотности распределения f (х). в) Найти функцию распределения F(x) и построить ее график. г) Найти вероятность попадания величины X на участок от 0 до
Решение:
а) Для определения коэффициента а воспользуемся свойством плотности распределения:
откуда
б) График плотности f(х) представлен на рис. 5.4.5.
в) По формуле (5.4.4) получаем выражение функции распределения:
График функции F(x) изображен на рис. 5.4.6.
г) По формуле (5/3,1) имеем:
Тот же результат, но несколько более сложным путем можно получить по формуле (5.4.3)
Пример:
Плотность распределения случайной величины X задана формулой:
а) Построить график плотности f (х). б) Найти вероятность того, что величина X попадет на участок (—1, +1).
Решение:
а) График плотности дан на рис. 5.4.7. б) По формуле (5.4.3) имеем:
Числовые характеристики случайных величин. Их роль и назначение
В данной главе мы познакомились с рядом полных, исчерпываю- исчерпывающих характеристик случайных величин—так называемых законов распределения. Такими характеристиками были: для дискретной случайной величины а) функция распределения; б) ряд распределения (графически — многоугольник распределения); для непрерывной величины а) функция распределения; б) плотность распределения (графически — кривая распределения).
‘) Так называемый закон Коши.
Каждый закон распределения представляет собой функцию, и указание этой функции полностью описывает случайную величину с вероятностной точки зрения.
Однако во многих вопросах практики нет необходимости характеризовать случайную величину полностью, исчерпывающим образом. Зачастую достаточно бывает указать только отдельные числовые параметры; до некоторой степени характеризующие, существенные черты распределения случайной величины: например, какое-то среднее значение, около которого группируются возможные значения случайной величины; какое-либо число, характеризующее степень разбросанности этих значений относительно среднего, и т. д. Пользуясь такими характеристиками, мы хотим все существенные сведения относительно случайной величины, которыми мы располагаем, выразить наиболее компактно с помощью минимального числа числовых параметров. Такие характеристики, назначение которых — выразить в сжатой форме наиболее существенные особенности распределения, называются числовыми характеристиками случайной величины.
В теории вероятностей числовые характеристики и операции с ними играют огромную роль. С помощью числовых характеристик существенно облегчается решение многих вероятностных задач. Очень часто удается решить задачу до конца, оставляя в стороне законы распределения и оперируя одними числовыми характеристиками. При этом весьма важную роль играет то обстоятельство, что когда в задаче фигурирует большое количество случайных величин, каждая из которых оказывает известное влияние на численный результат опыта, то закон распределения этого результата в значительной мере можно считать независимым от законов распределения отдельных случайных величин (возникает так называемый нормальный закон распределения). В этих случаях по существу задачи для исчерпывающего суждения о результирующем законе распределения не требуется знать законов распределения отдельных случайных величин, фигурирующих в задаче; достаточно знать лишь некоторые числовые характеристики этих величин.
В теории вероятностей и математической статистике применяется большое количество различных числовых характеристик, имеющих различное назначение и различные области применения. Из них в настоящем курсе мы введем только некоторые, наиболее часто применяемые.
Характеристики положения (математическое ожидание, мода, медиана)
Среди числовых характеристик случайных величин нужно прежде всего отметить те, которые характеризуют положение случайной величины\ на числовой оси, т. е. указывают некоторое среднее, ориентировочное значение, около которого группируются все возможные значения случайной величины.
Среднее значение случайной величины есть некоторое число, являющееся как бы ее «представителем» н заменяющее ее при грубо ориентировочных расчетах. Когда мы говорим: «среднее время работы лампы равно 100 часам» или «средняя точка попадания смещена относительно цели на 2 м вправо», мы этим указываем определенную числовую характеристику случайной величины, описывающую ее местоположение на числовой оси, т. е. «характеристику положения».
Из характеристик положения в теории вероятностей важнейшую роль играет математическое ожидание случайной величины, которое иногда называют просто средним значением случайной величины.
Рассмотрим дискретную случайную величину X, имеющую возможные значения с вероятностями Нам требуется охарактеризовать каким-то числом положение значений случайной величины на оси абсцисс с учетом того, что эти значения имеют различные вероятности. Для этой цели естественно воспользоваться так называемым «средним взвешенным» из значений , причем каждое значение при осреднении должно учитываться с «весом», пропорциональным вероятности этого значения. Таким образом, мы вычислим среднее значение случайной величины X, которое мы обозначим М{Х]:
или, учитывая что
(5.6.1)
Это среднее взвешенное значение и называется математическим ожиданием случайной величины. Таким образом, мы ввели в рассмотрение одно из важнейших понятий теории вероятностей — понятие математического ожидания.
Математическим ожиданием случайной величины называется сумма произведений всех возможных значений случайной величины на вероятности этих значений.
Заметим, что в вышеприведенной формулировке определение математического ожидания справедливо, строго говоря, только для дискретных случайных величин; ниже будет дано обобщение этого понятия на случай непрерывных величин.
Для того чтобы сделать понятие математического ожидания более наглядным, обратимся к механической интерпретации распределения дискретной случайной величины. Пусть на оси абсцисс расположены точки с абсциссами в которых сосредоточены соответственно массы , причем Тогда, очевидно, математическое ожидание М[Х\, определяемое формулой (5.6.1), есть не что иное, как абсцисса центра тяжести данной системы материальных точек.
Математическое ожидание случайной величины X связано свое- своеобразной зависимостью со средним арифметическим наблюденных значений случайной величины при большом числе опытов, Эта зависимость того же типа, как зависимость между частотой и вероятностью,, а именно: при большом числе опытов среднее арифметическое наблюденных значений случайной величины приближается (сходится по вероятности) к ее математическому ожиданию. Из наличия связи между частотой и вероятностью можно вывести как следствие наличие подобной же связи между средним арифметическим и математическим ожиданием.
Действительно, рассмотрим дискретную случайную величину X, характеризуемую рядом распределения:
где
Пусть производится N независимых опытов, в каждом из которых величина X принимает определенное значение. Предположим, что значение появилось раз, значение появилось
раз, вообще значение появилось раз. Очевидно,
Вычислим среднее арифметическое наблюденных значений вели- величины X, которое в отличие от математического ожидания М [X] мы обозначим М*[Х]:
Но есть не что иное, как частота (или статистическая вероятность) события эту частоту можно обознаxить Тогда
т. е. среднее арифметические наблюденных значений случайной величины равно сумме произведений всех возможных значений случайной величины на частоты этих значений.
При увеличении числа опытов N частоты будут приближаться (сходиться по вероятности) к соответствующим вероятностям Следовательно, и среднее арифметическое наблюденных значений случайной величины М* [X] при увеличении числа опытов будет приближаться (сходиться по вероятности) к ее математическому ожиданию М [X] .
Сформулированная выше связь между средним арифметическим и математическим ожиданием составляет содержание одной из форм закона больших чисел. Строгое доказательство этого закона будет дано нами в главе 13.
Мы уже знаем, что все формы закона больших чисел констатируют факт устойчивости некоторых средних при большом числе опытов. Здесь речь идет об устойчивости среднего арифметического из ряда наблюдений одной и той же величины. При небольшом числе опытов среднее арифметическое их результатов случайно; при достаточном увеличении числа опытов оно становится «почти не случайным» и, стабилизируясь, приближается к постоянной величине — математическому ожиданию.
Свойство устойчивости средних при большом числе опытов легко проверить экспериментально. Например, взвешивая какое-либо тело в лаборатории на точных весах, мы в результате взвешивания полу- получаем каждый раз новое значение; чтобы уменьшить ошибку наблюдения, мы взвешиваем тело несколько раз и пользуемся средним арифметическим полученных значений. Легко убедиться, что при дальнейшем увеличении числа опытов (взвешиваний) среднее арифметическое реагирует на это увеличение все меньше и меньше и при достаточно большом числе опытов практически перестает меняться.
Формула (5.6.1) для математического ожидания ‘соответствует случаю дискретной случайной величины. Для непрерывной величины X математическое ожидание, естественно, выражается уже не суммой, а интегралом:
(5.6.2)
где f(x) — плотность распределения величины X.
Формула (5.6.2) получается из формулы (5.6.1). если в ней заменить отдельные значения непрерывно изменяющимся параметром х, соответствующие вероятности — элементом вероятности f(x)dx, конечную сумму — интегралом. В дальнейшем мы часто будем пользоваться таким способом распространения формул, выведенных для прерывных величин, на случай непрерывных величин.
В механической интерпретации математическое ожидание непрерывной случайной величины сохраняет тот же смысл — абсциссы центра тяжести в случае, когда масса распределена по оси абсцисс непрерывно, с плотностью f(x). Эта интерпретация часто позволяет найти математическое ожидание без вычисления интеграла (5.6.2), из простых механических соображений.
Выше мы ввели обозначение М [X] для математического ожидания величины X. В ряде случаев, когда величина М [X] входит в формулы как определенное число, ее удобнее обозначать одной буквой. В этих случаях мы будем обозначать математическое ожидание величины X через
Обозначения и М [X] для математического ожидания будут в дальнейшем применяться параллельно в зависимости от удобства той или иной записи формул. Условимся также в случае надобности сокращать слова «математическое ожидание» буквами м. о.
Следует заметить, что важнейшая характеристика положения — математическое ожидание — существует не для всех случайных величин. Можно составить примеры таких случайных величин, для которых математического ожидания не существует, так как соответствующая сумма или интеграл расходятся.
Рассмотрим, например, прерывную случайную величину X с рядом распределения:
Нетрудно убедиться в том, что ряд распределения имеет смысл; однако сумма B данном случае расходится и, следовательно, математического ожидания величины X не существует. Однако для практики такие случаи существенного интереса не представляют. Обычно случайные величины, с которыми мы имеем дело, имеют ограниченную область возможных значений и безусловно обладают математическим ожиданием.
Выше мы дали формулы (5.6.1) и (5.6.2), выражающие математическое ожидание соответственно для прерывной и непрерывной случайной величины X.
Если величина X принадлежит к величинам смешанного типа, то ее математическое ожидание выражается формулой вида:
где сумма распространяется на нее точки в которых функция распределения терпит разрыв, а интеграл — на все участки, на которых функция распределения непрерывна.
Кроме важнейшей из характеристик положения—математического ожидания, — на практике иногда применяются и другие характеристики положения, в частности мода и медиана случайной величины.
Модой случайной величины называется ее наиболее вероятное значение. Термин «наиболее вероятное значение», строго говоря, применим только к прерывным величинам; для непрерывной величины модой является то значение, в котором плотность вероятности максимальна. Условимся обозначать моду буквой На рис. 5.6.1 и 5.6.2 показана мода соответственно для прерывной и непрерывной случайных величин.
Веля многоугольник распределения (кривая распределения) имеет более одного максимума, распределение называется полимодальным» (рис. 5.6.3 и 5.6.4).
Иногда встречаются распределения, обладающие посередине не максимумом, а минимумом (рис. 5.6.5 и 5.6.6). Такие распределения называются «антимодальными». Примером антимодального распределения может служить распределение, полученное в примере 5, п° 5.1.
В общем случае мода и математическое ожидание случайной величины не совпадают. В частном случае, когда распределение является симметричным и модальным (т. е. имеет моду) и существует математическое ожидание, то оно совпадает с модой и центром симметрии распределения.
Часто применяется еще одна характеристика положения — так называемая медиана случайной величины. Этой характеристикой пользуются обычно только для непрерывных случайных величин, хотя формально можно ее определить и для прерывной величины.
Медианой случайной величины X называется такое ее значение , для которого
т. е. одинаково вероятно, окажется ли случайная величина меньше или больше . Геометрическая медиана — это абсцисса точки, в которой площадь, ограниченная кривой распределения, делится пополам (рис. 5.6.7). В случае симметричного модального распределения медиана совпадает с математическим ожиданием и модой.
Моменты. Дисперсия. Среднее квадратическое отклонение
Кроме характеристик положения — средних, типичных значений случайной величины,—употребляется еще ряд характеристик, каждая из которых описывает то или иное свойство распределения. В качестве таких характеристик чаще всего применяются так называемые моменты.
Понятие момента широко применяется в механике для описания распределения масс (статические моменты, моменты инерции и т. д.). Совершенно теми же приемами пользуются в теории вероятностей для описания основных свойств распределения случайной величины. Чаще всего применяются на практике моменты двух видов: начальные и центральные.
Начальным моментом s-го порядка прерывной случайной величины X называется сумма вида:
(5.7.1)
Очевидно, это определение совпадает с определением начального момента порядка s в механике, если на оси абсцисс в точках сосредоточены массы Для непрерывной случайной величины X начальным моментом s-ro порядка называется интеграл
(5.7.2)
Нетрудно убедиться, что введенная в предыдущем п° основная характеристика положения — математическое ожидание — представляет собой не что иное, как первый начальный момент случайной величины X.
Пользуясь знаком математического ожидания, можно объединить две формулы (5.7.1) и (5.7.2) в одну. Действительно, формулы (5.7.1) и (5.7.2) по структуре полностью аналогичны формулам (5.6.1) и (5.6.2), с той разницей, что в них вместо и х стоят, соответственно, и Поэтому можно написать общее определение начального момента s-ro порядка, справедливое как для прерывных, так и для непрерывных величин:
(5.7.3)
т. е. начальным моментом s-го порядка случайной величины X называется математическое ожидание s-й степени этой случайной величины
Перед тем как дать определение центрального момента, введем новое понятие «центрированной случайной величины».
Пусть имеется случайная величина X с математическим ожиданием Центрированной случайной величиной, соответствующей величине X, называется отклонение случайной величины X от ее математического ожидания:
(5.7.4)
Условимся в дальнейшем везде обозначать центрированную случайную величину, соответствующую данной случайной величине, той же буквой со значком ° наверху.
‘) Понятие математического ожидания функции от случайной величины будет уточнено далее (см. главу 10).
Нетрудно убедиться, что математическое ожидание центрирован- центрированной случайной величины равно нулю. Действительно, для прерывной величины
аналогично и для непрерывной величины.
Центрирование случайной величины, очевидно, равносильно пере- переносу начала координат в среднюю, «центральную» точку, абсцисса которой равна математическому ожиданию.
Моменты центрированной случайной величины носят название центральных моментов. Они аналогичны моментам относительно центра тяжести в механике.
Таким образом, центральным моментом порядка s случайной величины X называется математическое ожидание s-й степени соответствующей центрированной случайной величины: (5.7.6)
Для прерывной случайной величины s-й центральный момент вы- выражается суммой
(5.7.7)
а для непрерывной — интегралом
(5.7.8)
В дальнейшем в тех случаях, когда не возникает сомнений, к какой случайной величине относится данный момент, мы будем для краткости вместо и писать просто и
Очевидно, для любой случайной величины центральный момент первого порядка равен нулю:
(5.7.9)
так как математическое ожидание центрированной случайной вели- величины всегда равно нулю.
Выведем соотношения, связывающие центральные и начальные моменты различных порядков. Вывод мы проведем только для прерывных величин; легко убедиться, что точно те же соотношения справедливы и для непрерывных величин, если заменить конечные суммы интегралами, а вероятности — элементами вероятности.
Рассмотрим второй центральный момент:
Аналогично для третьего центрального момента получим:
Выражения для р4, р.5 и т. д. могут быть получены аналогичным путем.
Таким образом, для центральных моментов любой случайной величины Х справедливы формулы:
(5.7.10)
Вообще говоря, моменты могут рассматриваться не только относительно начала координат (начальные моменты) или математического ожидания (центральные моменты), но и относительно произвольной точки а:
(5.7.11)
Однако центральные моменты имеют перед всеми другими преимущество: первый центральный момент, как мы видели, всегда равен нулю, а следующий за ним, второй центральный момент при этой системе отсчета имеет минимальное значение. Докажем это. Для прерывной случайной величины X при s = 2 формула (5.7.11) имеет вид:
(5.7.12)
Преобразуем это выражение:
Очевидно, эта величина достигает своего минимума, когда т. е. когда момент берется относительно точки .
Из всех моментов в качестве характеристик случайной величины чаще всего применяются первый начальный момент (математическое ожидание) и второй центральный момент
Второй центральный момент называется дисперсией случайной величины. Ввиду крайней^ важности этой характеристики среди других моментов введем для нее специальное обозначение D[X]:
Согласно определению центрального момента
(5.7.13)
т. е. дисперсией случайной величины X называется математическое ожидание квадрата соответствующей центрированной величины.
Заменяя в выражении (5.7.13) величину ее выражением, имеем также:
(5.7.14)
Для непосредственного вычисления дисперсии служат формулы:
— соответственно для прерывных и непрерывных величин.
Дисперсия случайной величины есть характеристика рассеивания, разбросанности значений случайной величины около ее математического ожидания. Само слово «дисперсия» означает «рассеивание».
Если обратиться к механической интерпретации распределения, то дисперсия представляет собой не что иное, как момент инерции заданного распределения масс относительно центра тяжести (математического ожидания).
Дисперсия случайной величины имеет размерность квадрата случайной величины; для наглядной характеристики рассеивания удобнее пользоваться величиной, размерность которой совпадает с размерностью случайной величины. Для этого из дисперсии извлекают квадратный корень. Полученная величина называется средним квадратическим отклонением (иначе—«стандартом») случайной величины X. Среднее квадратическое отклонение будем обозначать
(5.7.17)
Для упрощения записей мы часто будем пользоваться сокращен- сокращенными обозначениями среднего квадратического отклонения и дисперсии: и Dx. В случае, когда не возникает сомнения, к какой случайной величине относятся эти характеристики, мы будем иногда опускать значок х у и Dx и писать просто и D. Слова «среднее квадратическое отклонение» иногда будем сокращенно заменять буквами с. к. о.
На практике часто применяется формула, выражающая дисперсию случайной величины через ее второй начальный момент (вторая из формул (5.7.10)). В новых обозначениях она будет иметь вид: (5.7.18)
Математическое ожидание и дисперсия Dx (или среднее квадратическое отклонение ) — наиболее часто применяемые характеристики случайной величины. Они характеризуют наиболее важные черты распределения: его положение и степень разбросанности. Для более подробного описания распределения применяются моменты высших порядков.
Третий центральный момент служит для характеристики асимметрии (или «скошенности») распределения. Если распределение симметрично относительно математического ожидания (или, в механической интерпретации, масса распределена симметрично относительно центра тяжести), то все моменты нечетного порядка (если они существуют) равны нулю. Действительно, в сумме
при симметричном относительно законе распределения и нечет- нечетном s каждому положительному слагаемому соответствует равное ему по абсолютной величине отрицательное слагаемое, так что вся сумма равна нулю. То же, очевидно, справедливо и для интеграла
который равен нулю, как интеграл в симметричных пределах от нечетной функции.
Естественно поэтому в качестве характеристики асимметрии рас- распределения выбрать какой-либо из нечетных моментов. Простейший из них есть третий центральный момент. Он имеет размерность куба случайной величины; чтобы получить безразмерную характеристику, третий момент делят на куб среднего квадратического отклонения, Полученная величина носит название «коэффициента асимметрии» или просто «асимметрии»; мы обозначим ее Sk:
(5.7.19)
Ha рис. 5.7.1 показано два асимметричных распределения; одно из них (кривая /) имеет положительную асимметрию (Sk>0), другая (кривая //) —отрицательную (Sk < 0).
Четвертый центральный момент служит для характеристики так называемой «крутости», т. е. островершинности или плосковершинности распределения. Эти свойства распределения описываются с помощью так называемого эксцесса. Эксцессом случайной величины X называется величина
(5.7.20)
Число 3 вычитается из отношения потому, что для весьма важного и широко распространенного в природе нормального закона распределения (с которым мы подробно познакомимся в дальнейшем) Таким образом, потому, что для весьма для нормального распределения эксцесс равен нулю; кривые, более островершинные по сравнению с нормальной, обладают положительным эксцессом; кривые более плосковершинные — отрицательным эксцессом.
На рис. 5.7.2 представлены: нормальное распределение (кривая /), распределение с положительным эксцессом (кривая //) и распределение с отрицательным эксцессом (кривая ///).
Кроме рассмотренных выше начальных и центральных моментов, на практике иногда применяются так называемые абсолютные моменты (начальные и центральные), определяемые формулами
Очевидно, абсолютные моменты четных порядков совпадают с обычными моментами.
Из абсолютных моментов наиболее часто применяется первый абсолютный центральный момент
(5.7.21)
называемый средним арифметическим отклонением. Наряду с дисперсией и средним квадратическим отклонением среднее арифметическое отклонение иногда применяется как характеристика рассеивания.
Математическое ожидание, мода, медиана, начальные и центральные моменты и, в частности, дисперсия, среднее квадратическое отклонение, асимметрия и эксцесс представляют собой наиболее употребительные числовые характеристики случайных величин. Во многих задачах практики полная характеристика случайной величины — закон распределения — или не нужна, или не может быть получена. В этих случаях ограничиваются приблизительным описанием случайной величины с помощью числовых характеристик, каждая из которых выражает какое-либо характерное свойство распределения.
Математическое ожидание, мода, медиана, начальные и центральные моменты и, в частности, дисперсия, среднее квадратическое отклонение, асимметрия и эксцесс представляют собой наиболее употребительные числовые характеристики случайных величин. Во многих задачах практики полная характеристика случайной величины — закон распределения — или не нужна, или не может быть получена. В этих случаях ограничиваются приблизительным описанием случайной величины с помощью числовых характеристик, каждая из которых выражает какое-либо характерное свойство распределения.
Пример:
Производится один опыт, в результате которого может появиться или не появиться событие А, вероятность которого равна Рассматривается случайная величина X — число появлений события А (характеристическая случайная величина события А). Определить ее характеристики: математическое ожидание, дисперсию, среднее квадратическое отклонение.
Решение:
Ряд распределения величины имеет вид:
где q = I — р — вероятность непоявления события А. По формуле (5.6.1) находим математическое ожидание величины X:
Дисперсию величины X определим по формуле (5.7.15):
откуда
(Предлагаем читателю получить тот же результат, выразив дисперсию через второй начальный момент.)
Пример:
Производится три независимых выстрела по мишени, вероятность попадания при каждом выстреле равна 0,4. Случайная величина X — число попаданий. Определить характеристики величины X — математическое ожидание, дисперсию, с. к. о., асимметрию.
Решение:
Ряд распределения величины X имеет вид:
Вычисляем числовые характеристики величины X:
Заметим, что те же характеристики могли бы быть вычислены значительно проще с помощью теорем о числовых характеристиках функций (см. главу 10).
Пример:
Производится ряд независимых опытов до первого по- появления события А (см. пример З п°5.1). Вероятность события А в каждом опыте равна р. Найти математическое ожидание, дисперсию и с. к. о. числа опытов, которое будет произведено.
Решение:
Ряд распределения величины X имеет вид:
Математическое ожидание величины X выражается суммой ряда
Нетрудно видеть, что ряд, стоящий в скобках, представляет собой результат дифференцирования геометрической прогрессии:
Следовательно
откуда
Для определения дисперсии величины X вычислим сначала ее второй начальный момент:
Для вычисления ряда, стоящего в скобках, умножим на q ряд:
Получим:
Дифференцируя этот ряд по q, имеем:
Умножая на р = 1 —q получим:
По формуле (5.7.18) выразим дисперсию:
откуда
Пример:
Непрерывная случайная величина X подчинена закону распределения с плотностью:
(рис. 5.7.3). Найти коэффициент А. Определить м. о., дисперсию, с. к. о., асимметрию, эксцесс величины X.
Решение:
Для определения А воспользуемся свойством плотности распределения:
отсюда
Так как функция нечетная, то м. о. величины Х равно нулю:
Дисперсия и с. к. о. равны, соответственно:
Так как распределение симметрично, то Sk = 0. Для вычисления эксцесса находим
откуда
Пример:
Случайная величина X подчинена закону распределения, плотность которого задана графически на рис. 5.7.4.
Написать выражение плотности распределения. Найти м. о., дисперсию, с. к. о. и асимметрию распределения.
Решение:
Выражение плотности распределения имеет вид:
Пользуясь свойством плотности распределения, находим а = 2. Математическое ожидание величины X:
Дисперсию найдем через второй начальный момент:
отсюда
Третий начальный момент равен
Пользуясь третьей из формул (5.7.10), выражающей через начальные моменты, имеем:
откуда
Закон равномерной плотности
В некоторых задачах практики встречаются непрерывные случайные величины, о которых заранее известно, что их возможные значения лежат в пределах некоторого определенного интервала; кроме того, известно, что в пределах этого интервала все значения случайной величины одинаково вероятны (точнее, обладают одной и той же плотностью вероятности). О таких случайных величинах говорят, что они распределяются по закону равномерной плотности.
Приведем несколько примеров подобных случайных величин.
Пример:
Произведено взвешивание тела на точных весах, но в распоряжении взвешивающего имеются только разновески весом не менее 1 г; результат взвешивания показывает, что вес тела заключен между k и (k+1) граммами. Вес тела принят равным граммам. Допущенная при этом ошибка X, очевидно, есть случайная величина, распределенная с равномерной плотностью на участке
Пример:
Вертикально поставленное симметричное колесо (рис. 5.8.1) приводится во вращение и затем останавливается вследствие трения. Рассматривается случайная величина 0 — угол, который после остановки будет составлять с горизонтом фиксированный радиус колеса ОА. Очевидно, величина 0 распределена с равномерной плотностью на участке
Пример:
Поезда метрополитена идут с интервалом 2 мин. Пассажир выходит на платформу в некоторый момент времени. Время Т, в течение которого ему придется ждать поезда, представляет собой случайную величину распределенную с равномерной плотностью на участке (0, 2) минут.
Рассмотрим случайную величину X, подчиненную закону равномерной плотности на участке от а до (рис. 5.8.2), и напишем для нее выражение плотности распределения f(x) . Плотность f(x) постоянна и равна с па отрезке ; вне этого отрезка она равна нулю:
Так как площадь, ограниченная кривой распределения, равна единице:
то
и плотность распределения f (х) имеет вид:
Формула (5.8.1) и выражает закон равномерной плотности на участке .
Напишем выражение для функции распределения F (х). Функция распределения выражается площадью кривой распределения, лежащей левее точки х. Следовательно,
График функции F(x) приведен на рис. 5.8.3. Определим основные Числовые характеристики случайной вели- величины А’, подчиненной закону равномерной плотности на участке от а до .
Математическое ожидание величины X равно:
(5.8.2)
В силу симметричности равномерного распределения медиана величины X также равна
Моды закон равномерной плотности не имеет. По формуле (5.7,16) находим дисперсию величины X:
откуда среднее квадратическое отклонение
В силу симметричности распределения его асимметрия равна нулю: (5.8.5)
Для определения эксцесса находим четвертый центральный момент:
откуда
(5.8.6)
Определяем среднее арифметическое отклонение:
Наконец, найдем вероятность попадания случайной величины X, рас- распределенной по закону равномерной плотности, на участок (а, Ь), представляющий собой часть участка (рис. 5.8.4). Геометрически эта вероятность представляет собой площадь, заштрихованную на рис. 5.8.4. Очевидно, она равна: (5.8.8)
т. е. отношению длины отрезка (а, Ь) ко всей длине участка , на котором задано равномерное распределение.
Закон Пуассона
Во многих задачах практики приходится иметь дело со случайными величинами, распределенными по своеобразному закону, который называется законом Пуассона.
Рассмотрим прерывную случайную величину X, которая может принимать только целые, неотрицательные значения:
О, 1, 2 ,…m,… ,
причем последовательность этих значений теоретически не ограничена.
Говорят, что случайная величина X распределена по закону Пуассона, если вероятность того, что она примет определенное значение m, выражается формулой
(5.9.1)
где а — некоторая положительная величина, называемая параметром закона Пуассона.
Ряд распределения случайной величины X, распределенной по закону Пуассона, имеет вид:
Убедимся прежде всего, что последовательность вероятностей, задаваемая формулой (5.9.1), может представлять собой ряд распределения, т. е. что сумма всех вероятностей Рm равна единице. Имеем:
но
откуда
На рис. 5.9.1 показаны многоугольники распределения случайной величины X, распределенной по закону Пуассона, соответствующие различным значениям параметра а. В таблице 8 приложения приведены значения Рm для различных с.
Определим .основные характеристики — математическое ожидание и дисперсию—случайной величины X, распределенной по закону Пуассона. По определению математического ожидания
Первый член суммы (соответствующий m = 0) равен нулю, следовательно, суммирование можно начинать m = 1:
Обозначим m— 1 = k; тогда
(5.9.2)
Таким образом, параметр а представляет собой не что иное, как математическое ожидание случайной величины X.
Для определения дисперсии найдем сначала второй начальный момент величины Х:
По ранее доказанному
кроме того,
следовательно,
Далее находим дисперсию величины X:
(5.9.3)
Таким образом, дисперсия случайной величины, распределенной по закону Пуассона, равна ее математическому ожиданию а.
Это свойство распределения Пуассона часто применяется на практике для решения вопроса, правдоподобна ли гипотеза о том, что случайная величина X распределена по закону Пуассона. Для этого определяют из опыта статистические характеристики — математическое ожидание и дисперсию — случайной величины ‘) . Если их значения близки, то это может служить доводом в пользу гипотезы о пуассоновском распределении; резкое различие этих характеристик, напротив, свидетельствует против гипотезы.
‘) О способах экспериментального определения этих характеристик см. ниже, гл. 7 и 14.
Определим для случайной величины X, распределенной по закону Пуассона, вероятность того, что она примет значение не меньше заданного k. Обозначим эту вероятность
Очевидно, вероятность может быть вычислена как сумма
Однако значительно проще определить ее из вероятности противоположного события:
(5.9.4)
В частности, вероятность того, что величина К примет положи- положительное значение, выражается формулой
(5.9.5)
Мы уже упоминали о том, что многие задачи практики приводят к распределению Пуассона. Рассмотрим одну из типичных задач такого рода.
Пусть на оси абсцисс Ох случайным образом распределяются точки (рис. 5.9.2). Допустим, что случайное распределение точек удовлетворяет следующим условиям:
- Вероятность попадания того или иного числа точек на отрезок l зависит только от длины этого отрезка, но не зависит от его положения на оси абсцисс. Иными словами, точки распределены на оси абсцисс с одинаковой средней плотностью. Обозначим эту плотность (т. е. математическое ожидание числа точек, приходящихся на единицу длины) через X.
- Точки распределяются на оси абсцисс независимо друг от друга, т. е. вероятность попадания того или другого числа точек на заданный отрезок не зависит от того, сколько их попало на любой другой отрезок, не перекрывающийся с ним.
- Вероятность попадания на малый участок двух или более точек пренебрежимо мала по сравнению с вероятностью попадания одной точки (это условие означает практическую невозможность совпадения двух или более точек).
Выделим на оси абсцисс определенный отрезок длины l и рас- рассмотрим дискретную случайную величину X — число точек, попа- попадающих на этот отрезок. Возможные значения величины будут
0,1,2,…,m,… (5.9.6)
Так как точки попадают на отрезок независимо друг от друга, то теоретически не исключено, что их там окажется сколь угодно много, т. е. ряд (5.9.6) продолжается неограниченно.
Докажем, что случайная величина X имеет закон распределения Пуассона. Для этого вычислим вероятность Рm того, что на отрезок l попадет ровно m точек.
Сначала решим более простую задачу. Рассмотрим на оси Ох малый участок : и вычислим вероятность того, что па этот участок попадет хотя бы одна точка. Будем рассуждать следующим образом. Математическое ожидание числа точек, попадающих на этот участок, очевидно, равно ; (т. к. на единицу длины попадает в среднем X точек). Согласно условию 3 для малого отрезка ; можно пренебречь возможностью попадания на него двух или . больше точек. Поэтому математическое ожидание ; числа точек, попадающих на участок ;, будет приближенно равно вероятности попадания на него одной точки (или, что в наших условиях равнозначно, хотя бы одной).
Таким образом, с точностью до бесконечно малых высшего порядка, при :—>0 можно считать вероятность того, что на уча- участок ; попадет одна (хотя бы одна) точка, равной , а вероятность того, что не попадет ни одной, равной 1—;
Воспользуемся этим для вычисления вероятности Рm попадания на отрезок l ровно m точек. Разделим отрезок l на n равных частей длиной Условимся называть элементарный отрезок : «пустым», если в него не попало ни одной точки, и «занятым», если в него попала хотя бы одна. Согласно выше доказанному вероятность того, что отрезок ; окажется «занятым», приближенно равна вероятность того, что он окажется «пустым», равна Так как, согласно условию 2, попадания точек в неперекрывающиеся отрезки независимы, то наши п отрезков можно рассмотреть как n независимых «опытов», в каждом из которых отрезок может быть «занят» с вероятностьюНайдем вероятность того, что среди я отрезков будет ровно m «занятых». По теореме о повторении опытов эта вероятность равна
или, обозначая
(5.9.7)
При достаточно большом я эта вероятность приближенно равна вероятности попадания на отрезок I ровно m точек, так как попадание двух или больше точек на отрезок ; имеет пренебрежимо малую вероятность. Для того чтобы найти точное значение Рm, нужно в выражении (5.9.7) перейти к пределу при
(5.9.8)
Преобразуем выражение, стоящее под знаком предела:
Первая дробь и знаменатель последней дроби в выражении (5.9.9) при , очевидно, стремятся к единице. Выражение —
от n не зависит. Числитель последней дроби можно преобразовать так:
(5.9.10)
При , и выражение (5.9.10) стремится к Таким образом, доказано, что вероятность попадания ровно m точек в отрезок l выражается формулой
где т. е. величина X распределена по закону Пуассона с параметром
Отметим, что величина а по смыслу представляет собой среднее число точек, приходящееся на отрезок I.
Величина R1 (вероятность того, что величина X примет положительное значение) в данном случае выражает вероятность того, что на отрезок l попадет хотя бы одна точка : (5.9.11)
Таким образом, мы убедились, что распределение Пуассона возникает там, где какие-то точки (или другие элементы) занимают случайное положение независимо друг от друга, и подсчитывается количество этих точек, попавших в какую-то область. В пашем случае такой «областью» был отрезок l на оси абсцисс. Однако наш вывод легко распространить и на случай распределения точек на плоскости (случайное плоское поле точек) и в пространстве (случайное пространственное поле точек). Нетрудно доказать, что если соблюдены условия:
1) точки распределены в поле «статистически равномерно со средней плотностью X; 2) точки попадают в неперекрывающиеся области независимым образом; 3) точки появляются поодиночке, а не парами, тройками и т. д., то число точек X, попадающих в любую область D (плоскую или пространственную), распределяется по закону Пуассона:
где а — среднее число точек, попадающих в область D. Для плоского случая
где — площадь области D; для пространственного
где — объем области D.
точек, попадающих в отрезок или область, условие постоянной плотности ( = const) несущественно. Если выполнены два других условия, то закон Пуассона все равно имеет место, только параметр а в нем приобретает другое выражение: он получается не простым умножением плотности на длину, площадь или объем области, а интегрированием переменной плотности по отрезку, площади или объему. (Подробнее об этом см. п° 19.4.)
Наличие случайных точек, разбросанных на линии, на плоскости или объеме — не единственное условие, при котором возникает рас- распределение Пуассона. Можно, например, доказать, что закон Пуассона является предельным для биномиального распределения: (5.9.12)
если одновременно устремлять число опытов n к бесконечности, а вероятность р — k нулю, причем их произведение nр— сохраняет постоянное значение:
np = a (5.9.13)
Действительно, это предельное свойство биномиального распределения можно записать в виде:
(5.9.14)
Но из условия (5.9.13) следует, что
(5.9.15)
Подставляя (5.9.15) в (5.9.14), получим равенство
(5.9.16)
которое только что было доказано нами по другому поводу.
Это предельное свойство биномиального закона часто находит применение на практике. Допустим, что производится большое количество независимых опытов n, в каждом из которых событие А имеет очень малую вероятность р. Тогда для вычисления вероятности того, что событие А появится ровно m раз, можно воспользоваться приближенной формулой
(5.9.17)
где nр = а—параметр того закона Пуассона, которым приближенно заменяется биномиальное распределение.
От этого свойства закона Пуассона — выражать биномиальное распределение при большом числе опытов и малой вероятности события — происходит его название, часто применяемое в учебниках статистики: закон редких явлений.
Рассмотрим несколько примеров, связанных с пуассоновским распределением, из различных областей практики.
Пример:
На автоматическую телефонную станцию поступают вызовы со средней плотностью К вызовов в час. Считая, что число вызовов на любом участке времени распределено по закону Пуассона, найти вероятность того, что за две минуты на станцию поступит ровно три вызова.
Решение:
Среднее число вызовов за две минуты равно:
По формуле (5.9.1) вероятность поступления ровно трех вызовов равна:
Пример:
В условиях предыдущего примера найти вероятность того, что за две минуты придет хотя бы один вызов.
Решение:
По формуле (5.9.4) имеем:
Пример:
В тех же условиях найти вероятность того, что за две минуты придет не менее трех вызовов.
Решение:
По формуле (5.9.4) имеем:
Пример:
На ткацком стаже нить обрывается в среднем 0,375 раза в течение часа работы станка. Найти вероятность того, что за смену (8 часов) число обрывов нити будет заключено в границах 2 и 4 (не менее 2 и не более 4 обрывов).
Решение:
Очевидно,
а = 0,375 *8 = 3;
имеем:
По таблице 8 приложения при а = 3
Пример:
С накаленного катода за единицу времени вылетает в среднем q (t) электронов, где t — время, протекшее с начала опыта. Найти вероятность того, что за промежуток времени длительности начинающийся в момент с катода вылетит ровно m электронов.
Решение:
Находим среднее число электронов а, вылетающих с ка- катода за данный отрезок времени. Имеем:
По вычисленному а определяем искомую вероятность:
Пример:
Число осколков, попадающих в малоразмерную цель при заданном положении точки разрыва, распределяется по закону Пуассона. Средняя плотность осколочного поля, в котором оказывается цель при данном положении точки разрыва, равна 3 оск./м2. Площадь цели равна S = 0,5 м2. Для поражения цели достаточно попадания в нее хотя бы одного осколка. Найти вероятность поражения цели при данном положении точки разрыва.
Решение:
По формуле (5.9.4) находим вероятность по- попадания хотя бы одного осколка:
(Для вычисления значения показательной функции пользуемся таблицей 2 приложения.)
Пример:
Средняя плотность болезнетворных микробов в одном кубическом метре воздуха равна 100. Берется на пробу 2 дм3 воздуха. Найти вероятность того, что з нем будет обнаружен хотя бы один микроб.
Решение:
Принимая гипотезу о пуассоновском распределении числа микробов в объеме, находим:
Пример:
По некоторой цели производится 50 независимых выстрелов Вероятность попадания в цель при одном выстреле равна 0,04. Пользуясь предельным свойством биномиального распределения (формула 5.9.17)), найти приближенно вероятность того, что в цель попадет: ни одного снаряда, один снаряд, два снаряда.
Решение:
Имеем по таблице 8 приложения находим вероятности:
Что такое случайные величины
В предыдущих главах мы рассмотрели аксиоматическое построение вероятностного пространства а также разобрали некоторые простейшие вероятностные схемы. Однако теория вероятностей не достигла бы такого расцвета и не была бы столь широко используема на практике, если бы занималась только лишь случайными событиями. Возвращаясь к истокам возникновения теории вероятностей, вспомним, что уже в азартных играх интерес играющих вызывает не наступление случайного исхода, а связанный с ним выигрыш или проигрыш, т. е. определенная числовая величина, поставленная в соответствие этому исходу. Вполне естественно такую числовую величину назвать случайной величиной. Изучением последнего понятия мы сейчас и займемся.
Случайная величина
Рассмотрим вероятностное пространство т.е. пространство элементарных исходов -алгебру событий и определенную на ней вероятность Р.
Случайной величиной называется функция, ставящая в соответствие каждому элементарному исходу число Для того чтобы такое определение было математически корректным, необходимо добавить следующее требование: для любого числа х множество элементарных исходов для которых является событием, или, иными словами, принадлежит -алгебре (это свойство носит название измеримости функции относительно -алгебры ). Таким образом, с точки зрения функционального анализа случайная величина представляет собой не что иное, как обычную числовую функцию, заданную на пространстве элементарных исходов (и измеримую относительно -алгебры ). Специфика теории вероятностей проявляется в том, что на задана также вероятность Р. Случайные величины будем обозначать греческими буквами, снабжая их при необходимости индексами: и т.д.
Для краткости условимся в дальнейшем вместо записи использовать запись если необходимо подчеркнуть связь случайной величины с пространством элементарных исходов или даже запись если не акцентируется внимание на этой связи.
Пример:
Два игрока играют в «орлянку» на следующих условиях: если при подбрасывании монеты выпадает «герб», то первый игрок платит второму 1 руб., если «цифра», то второй игрок платит первому 2 руб. Опишем случайную величину равную выигрышу первого игрока в этой игре (при одном подбрасывании монеты). Как мы знаем, пространство элементарных исходов состоит из двух исходов: — выпадение «герба» и — «цифры», (-алгебра событий насчитывает 4 события: Предполагая, что монета симметричная, найдем вероятности всех событий из Итак, вероятностное пространство нами определено. Осталось заметить, что случайная величина принимает значение — 1, если выпал «герб» и 2, если выпала «цифра» Измеримость функции очевидна, поскольку при множество является невозможным событием множество состоит из элементарного исхода и, наконец, при множество состоит из двух исходов и т. е. представляет собой достоверное событие
Пример:
Рассмотрим схему Бернулли с вероятностью успеха р. Сопоставим каждому элементарному исходу функцию равную числу успехов при этом исходе, т. е. числу букв У, содержащихся в последовательности УНН.. .У. Измеримость функции проверяется точно так же, как в предыдущем примере. Таким образом, — случайная величина. Отметим, что значения совпадают для тех элементарных исходов при которых произошло одинаковое число успехов.
Пример:
Случайными величинами будут число очков, выпавших при бросании игральной кости, а также суммарные числа очков, выпавших при бросании двух, трех и более костей. Советуем читателю для этого примера самостоятельно построить пространство элементарных исходов -алгебру вероятность Ри определить случайную величину
Пример:
На отрезок [0, 1] в соответствии с принципом геометрической вероятности падает идеальная точка. Пусть координата ее падения. Пространство элементарных исходов в данном случае совпадает с отрезком [0.1], -алгебра является борелевской (порожденной всевозможными интервалами) -алгеброй на этом отрезке, а вероятность попадания на каждый интервал внутри отрезка [0,1] равна его длине. Измеримость функции вытекает из того, что множество при пусто, при совпадает с интервалом [0, x) (а все интервалы, как мы знаем, принадлежат борелевской -алгебре) и, наконец, при х > 1 совпадает со всем отрезком [0.1], т.е. является достоверным событием. Таким образом, — случайная величина.
Отметим, что в этом примере мы имеем дело с интересным явлением: значение случайной величины для каждого элементарного исхода совпадает с самим этим исходом (в данном случае, наверное, лучше было бы сказать с «номером» этого исхода). Оказывается, такая ситуация встречается очень часто и связано это с тем, что, как правило, исследователь наблюдает именно случайную величину и, значит, для него понятие «элементарный исход» отождествлено с понятием «значение случайной величины». □
Пример:
На плоский экран падает частица. Будем считать, что нам известна вероятность попадания частицы в каждое (измеримое) множество на экране. Случайными величинами в данном случае будут, например, расстояние от центра экрана до точки падения, квадрат этого расстояния, угол в полярной системе координат и т. д.
Прежде чем перейти к дальнейшему изучению случайных величин, отметим, что все известные из курса математического анализа функции, как и вообще все функции, встречающиеся в реальной жизни, являются измеримыми. Поэтому в дальнейшем понятие измеримости мы нигде больше использовать не будем.
Функция распределения случайной величины
Функцией распределения (вероятностей) случайной величины называется функция F(x), значение которой в точке х равно вероятности события т. е. события, состоящего из тех и только тех элементарных исходов для которых
Обычно говорят, что значение функции распределения в точке х равно вероятности случайной величине принять значение, меньшее х. Правда, в таком определении имеется маленькая стилистическая неточность, связанная с тем, что слово «вероятность» мы обязаны употреблять только вместе со словом «событие».
Выведем некоторые очевидные свойства функции распределения. Так как, по определению, функция распределения является вероятностью, то
1.Далее, если то событие принадлежит событию и, значит,
— неубывающая функция).
Положим
Поскольку событие является невозможным, а — достоверным, то имеем
Событие при представляет собой объединение двух непересекающихся событий: — случайная величина приняла значение, меньшее — случайная величина приняла значение, лежащее в интервале Поэтому из аксиомы сложения получаем
Наконец, пусть — возрастающая последовательность чисел, сходящаяся к х. Тогда событие является счетным объединением несовместных событий
т. е.
В силу расширенной аксиомы сложения
Следовательно,
— непрерывная слева функция). Типичный вид функции распределения приведен на рис. 1.
Заметим, что, зная функцию распределения F(x), можно однозначно определить вероятность попадания случайной величины не только на интервал но и в любое измеримое (борелевское) множество на прямой.
Итак, с любой случайной величиной связана ее функция распределения. Отметим, что справедливо и обратное. Любая неубывающая непрерывная слева функция F(x), удовлетворяющая условиям является функцией распределения некоторой случайной величины Действительно, можно рассмотреть падение идеальной точки на прямую которая в этом случае принимается в качестве пространства элементарных исходов (см. также пример 22 в гл. 1). Поставим в соответствие каждому событию, заключающемуся в том, что точка попала на интервал на прямой, число F(x), а событию, заключающемуся в попадании точки на интервал — число Определенная таким образом для всех событий, связанных с попаданием точки на интервал числовая функция будет удовлетворять трем аксиомам вероятности. Для любых других событий, составляющих -алгебру борелевских множеств на прямой, вероятность определяется единственным образом с помощью теоремы о продолжении меры. Если теперь взять в качестве случайной величины координату падения, т. е. положить будет являться функцией распределения .
В дальнейшем иногда для того, чтобы подчеркнуть, какой именно случайной величине принадлежит функция распределения F(x), будем к функции распределения приписывать нижний индекс, обозначающий эту случайную величину:
В некоторых учебниках функцией распределения называют вероятность события Такое определение ничего не меняет в наших рассуждениях. Единственное изменение касается свойства 5: функция F(x) будет непрерывна справа.
Обычно (и мы будем также придерживаться этой традиции) для того, чтобы избежать сложного для неподготовленного читателя понятия интеграла Стилтьеса, при знакомстве с теорией вероятностей ограничиваются изучением так называемых дискретных и непрерывных случайных величин. Дискретную случайную величину вкратце можно охарактеризовать как случайную величину, все возможные значения которой можно пересчитать. В свою очередь, для непрерывной случайной величины вероятность попадания на «малый» интервал приближенно пропорциональна длине этого интервала с коэффициентом пропорциональности р(х), зависящим от х и носящим название плотности распределения.
Однако существуют случайные величины, не относящиеся ни к одному из этих двух типов. Простейшим примером такой случайной величины является время работы электрической лампочки. Купленная лампочка может с ненулевой вероятностью оказаться бракованной, т. е. время ее работы будет равно нулю, и в этом смысле его необходимо отнести к дискретным случайным величинам. Если же лампочка окажется исправной, то мы не сможем пересчитать все моменты времени, в которые она может отказать, и тогда время ее безотказной работы естественно считать непрерывной случайной величиной. Для данного примера можно сказать, что мы имеем дело со «смесью» дискретной и непрерывной случайных величин.
Существуют и более сложные примеры, в которых случайные величины уже не являются «смесью» дискретной и непрерывной компонент, но с точки зрения практики эти примеры представляют собой математическую абстракцию.
Часто поведение случайной величины удобно характеризовать не с помощью функции распределения, а как-то иначе. Если при этом возможно однозначно восстановить функцию распределения, то такая характеристика называется законом распределения (или просто распределением) случайной величины. Примерами законов распределения являются ряд распределения и плотность распределения, которые мы рассмотрим в следующих параграфах.
Дискретные случайные величины
Как уже говорилось, дискретной называется случайная величина, которая каждому элементарному исходу ставит в соответствие одно из конечного (или в общем случае счетного) набора чисел Дискретную случайную величину удобно характеризовать рядом распределения.
Рядом распределения (вероятностей) дискретной случайной величины называется таблица (табл. 1), состоящая из двух строк: в верхней строке перечислены все возможные значения случайной величины, а в нижней — вероятности того, что случайная величина примет эти значения.
Иногда для того, чтобы подчеркнуть, что ряд распределения относится именно к случайной величине будем наряду с записью употреблять запись
Рассмотрим некоторые наиболее часто встречающиеся на практике распределения дискретных случайных величин.
Биномиальное распределение
Дискретная случайная величина распределена по биномиальному закону, если она принимает значения в соответствии с рядом распределения, представленным в табл. 2, где
Биномиальное распределение является не чем иным, как распределением числа успехов испытаниях Бернулли с вероятностью успеха р и неудачи (см. пример 2).
Пуассоновское распределение
Дискретная случайная величина распределена по закону Пуассона, если она принимает целые неотрицательные значения с вероятностями, представленными рядом распределения в табл. 3, где — параметр пуассоновского распределения.
С распределением Пуассона мы тоже уже встречались в предельной теореме Пуассона. Распределение Пуассона носит также название закона редких событий, поскольку оно всегда появляется там, где производится большое число испытаний, в каждом из которых с малой
вероятностью происходит «редкое» событие. По закону Пуассона распределены, например, число вызовов, поступивших на телефонную станцию; число метеоритов, упавших в определенном районе; число распавшихся нестабильных частиц и т.д.
Геометрическое распределение
Снова рассмотрим схему Бернулли. Пусть — число испытаний, которое необходимо провести, прежде чем появится первый успех. Тогда — дискретная случайная величина, принимающая значения 0, 1, 2….. п,… Определим вероятность события Очевидно, что если в первом же испытании произойдет успех. Поэтому Далее, в том случае, когда в первом испытании произошла неудача, а во втором — успех. Но вероятность такого события, как мы знаем, равна qp, т. е. Аналогично, если в первых двух испытаниях произошли неудачи, а в третьем — успех, и, значит, Продолжая эту процедуру, получаем ряд распределения, представленный в табл. 4.
Случайная величина с таким рядом распределения называется распределенной по геометрическому закону.
Покажем теперь, как по ряду распределения дискретной случайной величины построить ее функцию распределения F(x). Пусть — дискретная случайная величина, заданная своим рядом распределения, причем значения расположены в порядке возрастания. Тогда для всех событие является невозможным и поэтому в соответствии с определением (рис. 2). Если
то событие состоит из тех и только тех элементарных исходов для которых и, следовательно, Аналогично, при событие состоит из тех элементарных исходов для которых либо либо т.е. а, значит, и т.д. Наконец, при событие достоверно и Таким образом, функция распределения дискретной случайной величины является кусочно-постоянной функцией, принимающей на интервале значение 0, на интервалах — значение и на интервале — значение 1.
Пример:
На зачете студент получил п = 4 задачи. Вероятность решить правильно каждую задачу р = 0,8. Определим ряд распределения и построим функцию распределения случайной величины — числа правильно решенных задач. В данном случае мы имеем дело с биномиальным законом. Подставляя в ряд распределения, заданный табл. 2, получаем ряд распределения и функцию распределения, представленные в табл. 5 и на рис. 3.
Пример:
Вероятность получить заданный эффект в физическом опыте р = 0,4. Определим ряд распределения и построим функцию распределения случайной величины равной числу «пустых» опытов, которые должен произвести экспериментатор, прежде чем он получит необходимый эффект. Случайная величина распределена по геометрическому закону. Поэтому, воспользовавшись табл. 4, имеем ряд распределения и функцию распределения, представленные в табл. 6 и на рис. 4.
Пример:
Выпишем ряд распределения случайной величины — числа угаданных номеров в «Спортлото 6 из 49». Как мы знаем (см. пример 7 в гл. 2), число угаданных номеров распределено по гипергеометрическому закону. В этом же примере были найдены
Аналогично определяются и вероятности — не угадать ни одного номера, — угадать ровно один номер и — угадать ровно два номера:
Окончательно получаем ряд распределения, представленный в табл. 7.
Непрерывные случайные величины
Непрерывной называется случайная величина функцию распределения которой F(x) можно представить в виде
Функция р(х) называется плотностью распределения (вероятностей) случайной величины Так же, как и прежде, иногда для того, чтобы подчеркнуть принадлежность плотности распределения случайной величине будем наряду с записью р(х) употреблять запись Отметим, что все реально встречающиеся плотности распределения являются непрерывными (за исключением, быть может, конечного числа точек) функциями и, следовательно, для них плотность распределения р(х) представляет собой производную функции распределения F(x), т. е. Для простоты изложения в дальнейшем будем рассматривать только такие плотности распределения. Типичный вид плотности распределения изображен на рис. 5.
выведем простеишие свойства плотности распределения.
Поскольку плотность распределения является производной от функции распределения, а функция распределения — неубывающая дифференцируемая функция, то
Далее, Значит, в силу определения непрерывной случайной величины
Таким образом, вероятность попадания случайной величины на интервал численно равна площади криволинейной трапеции, заштрихованной на рис. 5.
В частности, если то событие является достоверным, и поэтому
Иными словами, площадь, целиком заключенная под всей кривой, изображающей плотность распределения, равна единице.
Наконец, часто бывает полезна следующая трактовка плотности распределения. Как видно из рис.5, если мало, то вероятность попадания на интервал приближенно совпадает с площадью прямоугольника со сторонами Значит, с точностью до
Отсюда, в частности, следует, что
т.е. вероятность попадания в любую (заданную до опыта) точку для непрерывной случайной величины равна нулю. Здесь снова возникает кажущееся логическое противоречие: до опыта каждому возможному значению непрерывной случайной величины мы можем приписать только вероятность, равную нулю, однако после опыта случайная величина все же принимает некоторое значение. Решение этого противоречия опять связано с непрерывной структурой числовой прямой. Для того чтобы гарантировать ненулевую вероятность попадания в некоторое подмножество прямой, необходимо, чтобы это подмножество содержало более чем конечное и даже более чем счетное число точек. Из свойства 5 вытекает также, что в свойствах 2 и 4 знак можно заменить на знак строгого неравенства <. Например, свойство 2 можно переписать в виде
Рассмотрим некоторые наиболее важные распределения непрерывных случайных величин.
Равномерное распределение
Равномерно распределенная на отрезке [а, b] случайная величина имеет плотность распределения
Легко видеть, что функция распределения в этом случае определяется выражением
Графики плотности распределения р(х) и функции распределения F(x) приведены на рис. 6 и рис. 7.
Вероятность попадания равномерно распределенной случайной величины на интервал лежащий внутри отрезка [а,b], равна т.е. пропорциональна длине этого интервала. Таким образом, равномерное распределение реализует принцип геометрической вероятности при бросании точки на отрезок [а, b].
Заметим, что в примере 4 случайная величина равномерно распределена на отрезке
Экспоненциальное распределение
Случайная величина подчиняется экспоненциальному (показательному) закону, если она имеет плотность распределения
где — параметр экспоненциального распределения. Для функции распределения в данном случае нетрудно получить следующее выражение:
Графики плотности распределения и функции распределения экспоненциальной случайной величины приведены на рис. 8 и рис. 9.
Экспоненциально распределенная случайная величина может принимать только положительные значения. Экспоненциальному распределению подчинено время распада атомов различных элементов. При этом число носит название среднего времени распада. Кроме того, употребляют также число называемое периодом полураспада. Название «период полураспада» основано на следующем физическом соображении. Пусть у нас первоначально имелось п атомов вещества. Тогда через время каждый атом распадется с вероятностью Поэтому в силу независимости отдельных распадов число распавшихся за время атомов имеет биномиальное распределение с Но как мы знаем из теоремы Бернулли (см. параграф 5, гл. 4), при больших п это число будет примерно равно п/2, т. е. период полураспада представляет собой не что иное, как время, в течение которого распадается половина имеющегося вещества.
Экспоненциально распределенная случайная величина обладает весьма важным свойством, которое естественно назвать отсутствием последействия. Трактуя как время распада атома, рассмотрим событие и найдем условную вероятность этого события По определению условной вероятности Но событие АВ, как нетрудно видеть, совпадает с событием А. Поэтому Далее,
Значит,
Мы получили, что вероятность распада атома за время при условии, что перед этим он уже прожил время совпадает с безусловной вероятностью распада того же самого атома за время Именно это свойство и представляет собой отсутствие последействия. Допуская некоторую вольность речи, отсутствие последействия можно трактовать как независимость остаточного времени жизни атома от того, сколько он уже прожил. Можно показать и обратное: если случайная величина обладает свойством отсутствия последействия, то она обязана иметь экспоненциальное распределение. Таким образом, отсутствие последействия является характеристическим свойством экспоненциально распределенных случайных величин.
Практика показывает, что экспоненциальное распределение имеют и другие физические величины, например времена между падениями метеоритов в определенный район, времена между соседними поступлениями вызовов на телефонную станцию и т.д. Экспоненциальное распределение тесно связано с распределением Пуассона, а именно: если времена между последовательными наступлениями некоторого события представляют собой независимые (определение независимости случайных величин будет дано в гл. 6) экспоненциально распределенные (с одним и тем же параметром случайные величины, то число наступлений этого события за время t распределено по закону Пуассона с параметром Отметим также, что дискретным аналогом экспоненциального распределения является геометрическое распределение.
Нормальное распределение
Случайная величина распределена по нормальному, или гауссову, закону, если она имеет плотность распределения
Нормальное распределение зависит от двух параметров: т — математического ожидания, или среднего значения, нормального закона, и — среднего квадратичного отклонения. Графики плотности и функции нормального распределения в зависимости от m и приведены на рис. 10 и рис. 11.
Как видно из этих рисунков, параметр т определяет положение центра плотности нормального распределения, а — разброс относительно центра. Если то такой нормальный закон называется стандартным и его функция распределения обозначается через Ф(x). С плотностью и функцией стандартного нормального распределения мы уже встречались в локальной и интегральной теоремах Муавра-Лапласа. Нормальный закон также очень часто встречается на практике. Как мы увидим в гл. 8, посвященной предельным теоремам, он обычно возникает в явлениях, подверженных действию большого числа малых случайных воздействий.
Распределение Вейбулла
Случайная величина распределена по закону Вейбулла, если она имеет плотность распределения
Нетрудно проверить, что функция распределения в этом случае определяется следующим выражением:
Семейство распределений Вейбулла является двухпараметрическим и описывает положительные случайные величины. Графики плотности и функции распределения Вейбулла представлены на рис. 12 и рис. 13.
Считается, что распределению Вейбулла подчиняются времена безотказной работы многих технических устройств. Если то распределение Вейбулла превращается в экспоненциальное распределение, а если — в так называемое распределение Рэлея.
Гамма-распределение
Другим распределением, также достаточно хорошо описывающим времена безотказной работы различных технических устройств, является гамма-распределение с плотностью распределения
где — гамма-функция Эйлера (следующие свойства гамма-функции являются весьма полезными при изучении гамма-распределения: для целых n). Графики плотности и функции гамма-распределения изображены на рис. 14 и рис. 15.
Как видно из рисунков 12-15, распределение Вейбулла и гамма-распределение весьма близки между собой. Основным преимуществом распределения Вейбулла перед гамма-распределением является то, что его функция распределения выражается в явном виде. Поэтому раньше, когда ЭВМ еще не были достаточно распространены, распределение Вейбулла использовалось гораздо чаще, чем гамма-распределение. Хотя в общем случае гамма-распределение и не выражается в явном виде, оно обладает некоторыми весьма важными свойствами. Так, если принимает целые значения, то мы получаем распределение
Эрланга, находящее важные применения в теории массового обслуживания. Если же — полуцелое, а то гамма-распределение превращается в так называемое распределение (хи-квадрат), роль которого в математической статистике невозможно переоценить; параметр k называется в этом случае числом степеней свободы распределения Наконец, при мы имеем дело все с тем же экспоненциальным распределением. Гамма-распределение имеет и другие интересные особенности, которых мы здесь не будем касаться.
Функции от случайной величины
Пусть на вероятностном пространстве задана случайная величина Возьмем обычную (измеримую) числовую функцию g(х) числового аргумента х. Сопоставляя каждому элементарному исходу число по формуле мы получим новую случайную величину которую естественно назвать функцией от случайной величины
Функция от дискретной случайной величины также является дискретной случайной величиной, поскольку она не может принимать больше значений, чем случайная величина Очевидно, что, если случайная величина имеет ряд распределения, представленный в табл. 1, то ряд распределения случайной величины определяется табл. 8.
При этом, если в верхней строке табл. 8 появляются одинаковые значения то соответствующие столбцы надо объединить в один, приписав им суммарную вероятность.
Пример 9. Снова рассмотрим игру «Спортлото 6 из 49». Поставив на некоторые фиксированные номера, мы в результате розыгрыша получим случайную величину — число угаданных нами номеров (напомним, что пространство элементарных исходов состоит из всевозможных сочетаний по 6 номеров из 49), причем каждому элементарному исходу в соответствии с принципом классической вероятности сопоставлена вероятность (ряд распределения случайной величины представлен в табл. 7). Однако сама случайная величина нас не интересует, для нас представляет интерес выигрыш, связанный с числом угаданных номеров Рассмотрим идеализированный вариант игры, при котором, не угадав ни одного или угадав один или два номера, мы проигрываем (с учетом платы за билет) 0,3 руб., угадав 3 номера, получаем выигрыш 2,7 руб., угадав 4 номера — 54,7 руб., 5 номеров — 699,7 руб. и 6 номеров — 9999,7 руб. Выигрыш зависит только лишь от числа угаданных номеров, т.е. представляет собой функцию от случайной величины причем числовая функция определена формулами: и Ряд распределения случайной величины получается из ряда распределения (табл. 7) заменой в верхней строке чисел на соответствующие значения (табл.9).
Осталось заметить, что в табл. 9 три первых столбца имеют одинаковые значения равные -0,3. Поэтому их надо объединить в один. Окончательный ряд распределения представлен в табл. 10.
Реально при игре в «Спортлото» выигрыш зависит от числа играющих, поставивших на ту или иную комбинацию, и в этом случае его нельзя считать функцией от числа угаданных номеров а необходимо рассматривать более сложную модель, учитывающую вероятности (частоты) использования различных комбинаций номеров. В частности, мы не можем (без обращения к «потусторонним» силам) изменить вероятность угадывания определенного числа номеров, но мы можем увеличить выигрыш, ставя на «непопулярные» комбинации, которые хотя и появляются с той же частотой, что и остальные, но приносят больший выигрыш. Поиск «непопулярных» комбинаций относится к сфере психологии, а не теории вероятностей.
Функция от непрерывной случайной величины может быть как непрерывной, так и дискретной (дискретной она будет, например, если множество значений функции не более чем счетно). Найдем функцию распределения по заданной плотности распределения По самому определению, представляет собой вероятность события состоящего из тех элементарных исходов для которых В свою очередь, вероятность события можно определить, используя аксиому сложения вероятностей, «просуммировав» вероятности всех возможных значений у случайной величины для которых Поскольку, как мы знаем, вероятность случайной величине принять значение в промежутке от у до приближенно равна то, заменяя сумму на интеграл, получаем
Последняя запись означает, что интегрирование производится по всем тем значениям у, для которых
Пример:
Случайная величина распределена по стандартному нормальному закону. Найдем распределение случайной величины В данном случае поэтому
Поскольку при нет ни одного у, для которого или, что то же самое, не существует ни одного для которого при Если же то область совпадает с областью и, значит,
или в силу четности
Делая теперь замену окончательно получаем при х > 0
Нетрудно видеть, что случайная величина имеет плотность распределения
являющуюся плотностью гамма-распределения с параметрами или, иными словами, распределена по закону с одной степенью свободы. Именно как распределение квадрата стандартной нормальной случайной величины и появляется распределение в математической статистике.
Особенно просто находится функция распределения случайной величины — монотонно возрастающая функция. В этом случае событие эквивалентно событию функция, обратная и, значит,
Пример:
Пусть плотность р(х) распределения случайной величины положительна для всех х. Рассмотрим случайную величину где F(x) — функция распределения В силу сделанного предположения F(x) — монотонно возрастающая функция, принимающая значения от 0 до 1, и, следовательно,
Таким образом, случайная величина распределена равномерно на отрезке [0,1].
Полученный результат находит широкое применение при моделировании случайных величин с заданной функцией распределения F(x). Дело в том, что практически все используемые в настоящее время датчики случайных (более правильно, «псевдослучайных») чисел инициируют величины г], распределенные равномерно на отрезке [0,1]. Тогда, если функция F(x) имеет достаточно просто вычисляемую обратную функцию то, полагая получаем случайную величину с заданной функцией распределения F(x). Отметим, что такой способ может быть применен даже для моделирования некоторых дискретных случайных величин.
Если же, кроме того, — непрерывная случайная величина, а имеет производную является также непрерывной и ее плотность распределения определяется с помощью формулы дифференцирования сложной функции:
Случай монотонно убывающей функции g(х) предоставляется разобрать читателю.
Пример:
Случайная величина распределена по нормальному закону с параметрами Найдем распределение случайной величины В данном примере В силу свойства экспоненциальной функции случайная величина может принимать только положительные значения. Далее, при х > 0 функция дифференцируема, причем Таким образом,
Распределение с плотностью носит название логнормального (поскольку логарифм случайной величины распределен по нормальному закону). Двух-параметрическое логнормальное семейство наряду с распределением Вейбулла и гамма-распределением также довольно часто используется при описании времени безотказной работы различных технических устройств.
Пример:
Положительная случайная величина распределена по экспоненциальному закону с параметром (распределение с двумя степенями свободы). Покажите самостоятельно, что случайная величина имеет распределение Вейбулла с параметрами (распределение Рэлея). Воспользуйтесь монотонностью функции
Часто в дальнейшем нам будут встречаться линейные преобразования случайных величин: Тогда
и, значит, при а > 0
Пример:
Случайная величина распределена по стандартному нормальному закону. Найдем распределение случайной величины Тогда в формулах для линейного преобразования и
Итак, из случайной величины распределенной по стандартному нормальному закону, с помощью линейного преобразования получается нормально распределенная случайная величина с произвольными параметрами
Читателю предоставляем показать обратное: если — нормально распределенная случайная величина с параметрами то случайная величина распределена по стандартному нормальному закону. Из последнего свойства, в частности, следует
Эта формула позволяет вычислять значение функции нормального распределения при любых значениях параметров через значение функции стандартного нормального распределения Ф(x) и оправдывает тот факт, что во всех справочниках приведены только таблицы значений функции стандартного нормального распределения.
Какие бывают случайные величины и как их найти
Дискретные случайные величины
Понятие «случайные величины»:
Определение:
Случайной величиной называется переменная величина, которая в зависимости от исхода испытания случайно принимает одно значение из множества возможных значений.
Примеры:
1). Число очков, выпавших при однократном бросании игральной кости, есть случайная величина, она может принять одно из значений: 1, 2, 3, 4, 5, 6;
2) прирост массы домашнего животного за месяц есть случайная величина, которая может иметь значение из некоторого числового промежутка;
3) число родившихся мальчиков среди пяти новорожденных есть случайная величина, которая может принять значения 0, 1, 2, 3, 4, 5;
4) расстояние, которое пролетит снаряд при выстреле из орудия, есть случайная величина, возможные значения которой принадлежат некоторому промежутку.
Случайные величины обычно обозначают прописными буквами X, У, Z, а их возможные значения — соответствующими строчными буквами х, у, z- Например, если случайная величина X имеет три возможных значения, то они будут обозначены так:
Определение:
Случайная величина, принимающая различные значения, которые можно записать в виде конечной или бесконечной последовательности, называется дискретной случайной величиной.
Рассмотрим дискретные случайные величины, множество допустимых значений которых конечно.
Случайные величины из примеров 1) и 3) дискретные.
Определение:
Случайная величина, которая может принимать все значения из некоторого числового промежутка, называется непрерывной случайной величиной.
Случайные величины из примеров 2) и 4) являются непрерывными.
Определение:
Под суммой (произведением) случайных величин X и У понимают случайную величину Z=X+ У (Z=XY), возможные значения которой состоят из сумм (произведений) каждого возможного значения величины X и каждого возможного значения величины У.
Законы распределения дискретных случайных величин
Рассмотрим дискретную случайную величину X с конечным множеством возможных значений. Величина X считается заданной, если перечислены все ее возможные значения, а также вероятности, с которыми величина X может принимать эти значения. Указанный перечень всех ее возможных значений и их вероятностей называется законом распределения дискретной случайной величины. Закон распределения дискретной случайной величины может быть задан с помощью таблицы:
В верхней строке выписываются все возможные значения величины X, В нижней строке выписываются вероятности значений Читается таблица следующим образом: случайная величина X может принимать значения с вероятностями (i=1, 2, …, n).
Так как события Х=х, (i=1, 2, …, n) образуют полную группу несовместимых событий, то
Пример:
В денежной лотерее раньше разыгрывались: 1 выигрыш в 1000 р., 10 выигрышей по 100 р. и 100 выигрышей по 1 р. при общем числе билетов 10 000. Найдем закон распределения случайного выигрыша X для владельца одного лотерейного билета.
Здесь возможные значения для X есть: Вероятности их будут: Следовательно, закон распределения выигрыша X может быть задан таблицей:
В заключение отметим так называемую «механическую» интерпретацию представленной таблицы. Представим себе, что некоторая масса, равная единице, распределена по оси абсцисс так, что в п отдельных точках сосредоточены соответственно массы Тогда эта таблица описывает систему материальных точек, размещенных на оси абсцисс.
Математическое ожидание дискретной случайной величины
Понятие математического ожидания: Закон распределения полностью задает дискретную случайную величину. Однако часто встречаются случаи, когда закон распределения случайной величины неизвестен. В таких случаях случайную величину изучают по ее числовым характеристикам. Одной из таких характеристик является математическое ожидание.
Пусть некоторая дискретная случайная величина X с конечным числом своих значений задана законом распределения:
Определение. Математическим ожиданием М(Х) дискретной случайной величины X называется сумма произведений всех возможных значений величины X на соответствующие вероятности:
Пример:
Найдем математическое ожидание выигрыша X в примере из § 2.1 (п. 2).
Используя полученную там таблицу, имеем
Очевидно, М(Х) = 21 коп. есть справедливая стоимость одного лотерейного билета.
Теорема:
Математическое ожидание дискретной случайной величины X приближенно равно среднему арифметическому всех ее значений (при достаточно большом числе испытаний).
Доказательство:
Предположим, что произведено n испытаний, в которых дискретная случайная величина X приняла значения соответственно раз, так что Тогда среднее арифметическое всех значений, принятых величиной X, выразится равенством
или
Так как коэффициент является относительной частотой события «величина X приняла значение то
Из статистического определения вероятности следует, что при достаточно большом числе испытаний Поэтому
или
Таким образом, математическое ожидание случайной величины можно приближенно считать ее средним значением, что и делают на практике.
Обратимся теперь к механической интерпретации математического ожидания дискретной случайной величины X. Пусть на оси абсцисс расположены точки с абсциссами в которых сосредоточены соответственно массы причем
Тогда математическое ожидание М(Х), определяемое формулой (2.1). есть не что иное, как абсцисса центра масс данной системы материальных точек.
Свойства математического ожидания дискретной случайной величины
1. Математическое ожидание* постоянной величины С равно этой величине.
Постоянную С можно рассматривать как дискретную случайную величину, принимающую лишь одно значение С с вероятностью Поэтому
2. Постоянный множитель можно выносить за знак математического ожидания, т.е. М(СХ) = СМ(Х).
Используя соотношение (2.1), имеем:
3. Математическое ожидание суммы двух случайных величин X и У равно сумме их математических ожиданий:
Доказательство. Пусть X и У имеют законы распределения:
Для упрощения доказательства мы ограничиваемся лишь двумя возможными значениями каждой из случайных величин (в общем случае доказательство аналогично).
Составим все возможные значения величины Х+У, для чего к каждому возможному значению X прибавим каждое возможное значение У; получим (их вероятности обозначим соответственно через ).
Докажем, что . Событие, состоящее в том, что X примет значение (его вероятность равна ), влечет за собой событие, состоящее в том, что Х+У примет значение или (вероятность этого события по теореме сложения вероятностей несовместимых событий (см. § 1.3, п. 1) равна ). Поэтому Аналогично доказываются равенства
Наконец, согласно формуле (2.1), имеем
Определение. Случайные величины X и У называются независимыми, если закон распределения каждой из них не зависит от того, какое возможное значение приняла другая величина.
Примером двух независимых случайных величин могут служить суммы выигрышей по каждому из двух лотерейных билетов по двум различным денежно-вещевым лотереям. Здесь ставший известным размер выигрыша по билету одной лотереи не влияет на ожидаемый размер выигрыша и соответствующую ему вероятность по билету другой лотереи.
Несколько случайных величин называются независимыми, если закон распределения любой из них не зависит от того, какие возможные значения приняли остальные случайные величины.
4. Математическое ожидание произведения двух независимых случайных величин X и У равно произведению их математических ожиданий:
Пусть независимые случайные величины X и У заданы законами распределения (2.2). Для упрощения выкладок мы ограничиваемся лишь двумя возможными значениями каждой из случайных величин (в общем случае доказательство аналогично).
Составим все возможные значения величины ХУ: (их вероятности обозначим соответственно через
По теореме умножения вероятностей независимых событий (см. § 1.3, п. 2) вероятность того, что ХУ примет значение равна произведению вероятностей таких событий: X принимает значение а У—значение т.е. Аналогично
Согласно формуле (2.1), получим:
Следствием свойств 2 и 3 является свойство 5.
5. Математическое ожидание разности двух случайных величин X и Y равно разности их математических ожиданий:
Примечание:
Свойства 3 и 4 имеют место для любого конечного числа случайных величин.
Примечание:
Если множество возможных значений дискретной случайной величины X бесконечно, то математическое ожидание М(Х) определяется суммой числового ряда
при условии, что этот ряд абсолютно сходится. Перечисленные свойства математического ожидания остаются в силе (см. [2]) и для таких случайных величин.
Пример:
Найдем математическое ожидание случайной величины Z=X+2Y, если известны математические ожидания случайных величин Х и Y: М(Х) = 5, M(Y) = 3.
Используя свойства 3 и 2 математического ожидания, получим.
Пример:
Найдем математическое ожидание случайной величины Z=2X-Y, если заданы математические ожидания случайных величин X и Y: М(Х) = 4; M(Y)=6.
Используя свойства 5 и 2 математического ожидания, получаем
Пример:
Пусть независимые случайные величины заданы законами распределения:
Требуется найти математическое ожидание случайной величины XY.
Сначала найдем математические ожидания каждой из данных величин:
Случайные величины X и Y независимы, поэтому искомое математическое ожидание
Дисперсия дискретной случайной величины
Понятие дисперсии: Математическое ожидание не дает полной характеристики закона распределения случайной величины. Покажем это на примере. Пусть заданы две дискретные случайные величины X и Y своими законами распределения:
Несмотря на то что МО величин X и Y одинаковы, возможные значения величин X и Y «разбросаны» или «рассеяны» около своих МО (средних значений) по-разному: возможные значения величины X расположены гораздо ближе к своему МО, чем значения величины Y.
Вот еще один пример. При одинаковой средней величине годовых осадков одна местность может быть засушливой и неблагоприятной для сельскохозяйственных работ (нет дождей весной и летом), а другая — благоприятной для ведения сельского хозяйства.
Настоятельным является необходимость введения новой числовой характеристики случайной величины, по которой можно было бы судить о «рассеянии» возможных значений этой случайно величины.
Пусть задана дискретная случайная величина X:
Определение:
Отклонением случайной величины Х от ее Математического ожидания М(Х) (или просто отклонением случайной величины X) назывется случайная величина X- М(Х).
Видно, что для того, чтобы отклонение случайной величины X приняло значение — М(Х), достаточно, чтобы случайная величина X приняла значение . Вероятность же этого события равна ; следовательно, и вероятность того, что отклонение случайной величины X примет значение — М(Х), также равна . Аналогично обстоит дело и для остальных возможных значений отклонения случайной величины X. Используя это, запишем закон распределения отклонения случайной величины X:
Вычислим теперь МО отклонения X-М(Х). Пользуясь свойствами 5 и 1 (§ 2.1, п. 2), получим
Следовательно, справедлива следующая теорема.
Теорема:
Математическое ожидание отклонения Х-М(Х) равно нулю:
Из теоремы видно, что с помощью отклонения X-М(Х) не удается определить среднее отклонение возможных значений величины X от ее математического ожидания, т. е. оценить степень рассеяния величины X. Это объясняется взаимным погашением положительных и отрицательных возможных значений отклонения. Однако можно освободиться от этого недостатка, если рассматривать квадрат отклонения случайной величины X.
Запишем закон распределения случайной величины (рассуждения те же, что и в случае случайной величины X- М(Х)):
Определение:
Дисперсией D(X) дискретной случайной величины X называется математическое отклонение квадрата отклонения случайной величины X от ее математического отклонения (среднего значения):
Из закона распределения величины следует, что
Пример:
Пусть случайная величина X задана своим законом распределения:
Найдем D(X).
Имеем:
Таким образом, закон распределения случайной величины выразится таблицей:
Отсюда
Свойства дисперсии дискретной случайной величины
1. Дисперсия дискретной случайной величины X равна разности между математическим ожиданием квадрата величины X и квадратом ее математического ожидания:
Действительно, используя свойства математического ожидания, имеем:
С помощью этого свойства и свойств математического ожидания Устанавливаются и другие свойства.
2. Дисперсия постоянной величины С равна нулю.
Действительно,
3. Постоянный множитель можно выносить за знак дисперсии, возводя его в квадрат:
В самом деле,
4. Дисперсия суммы двух независимых случайных величин X и Y равна сумме дисперсий этих величин:
Действительно,
Используя метод математической индукции, это свойство можно распространить и на случай любого конечного числа слагаемых.
Следствием свойств 3 и 4 является следующее свойство.
5. Дисперсия разности двух независимых случайных величин X и Y равна сумме их дисперсий:
Пример:
Используя свойство 1 дисперсии, найдем дисперсию случайной величины X, имеющей следующий закон распределения:
Находим математические ожидания случайной величины X и ее квадрата:
Отсюда в силу свойства 1 дисперсии
Пример:
Дисперсия случайной величины X равна 3. Найдем дисперсию следующих величин: а) -ЗХ; б) 4X+З.
Согласно свойствам 2, 3 и 4 дисперсии, имеем:
Примечание:
Если множество возможных значений дискретной случайной величины X бесконечно, то ее дисперсия определяется суммой сходящегося числового ряда
Среднее квадратическое отклонение
Определение:
Средним квадратическим отклонением случайной величины X называется корень квадратный из ее дисперсии:
Необходимость введения среднего квадратического отклонения объясняется тем, что дисперсия измеряется в квадратных единицах относительно размерности самой случайной величины. Например, если возможные значения некоторой случайной величины измеряются в метрах, то ее дисперсия измеряется в квадратных метрах. В тех случаях, когда нужно иметь числовую характеристику рассеяния возможных значений в той же размерности, что и сама случайная величина, и используется среднее квадратическое отклонение.
Пример:
Случайная величина X—число очков, выпавших при однократном бросании игральной кости. Определим . Имеем:
Понятие о моментах распределения
Определение:
Начальным моментом порядка k случайной величины X называется математическое ожидание случайной величины где k — натуральное число:
Следовательно, если X имеет распределение
то
Математическое ожидание и дисперсию случайной величины X можно выразить через начальные моменты первого и второго порядков:
Определение:
Центральным моментом порядка k случайной величины X называется математическое ожидание величины
Из определения 2, согласно установленной выше теореме (п. 1) и определения дисперсии, следует, что
Сравнивая соотношения (2.3) и (2.4), получим
Пример:
Пусть дискретная случайная величина X задана законом распределения:
Требуется найти начальные моменты первого и второго порядков. Найдем начальный момент первого порядка:
Запишем закон распределения величины X2:
Найдем начальный момент второго порядка:
Пример:
Пусть дискретная случайная величина X задана законом распределения, приведенным в предыдущем примере. Найдем центральный момент второго порядка.
Как установлено в предыдущем примере, Поэтому, согласно формуле (2.5),
Основные законы распределения дискретных случайных величин
Биномиальное распределение
Пусть осуществляется n испытаний, причем вероятность появления события А в каждом испытании равна р и не зависит от исхода других испытаний (независимые испытания). Такая последовательность испытаний называется схемой Бернулли*. Так как вероятность наступления события А в одном испытании равна р, то вероятность его ненаступления равна q = 1 — p
Найдем вероятность того, что при n испытаниях событие А наступит m раз
Пусть событие А наступило в первых m испытаниях m раз и не наступило во всех последующих испытаниях. Это сложное событие можно записать в виде произведения:
Общее число сложных событий, в которых событие А наступает m раз, равно числу сочетаний из n элементов по m элементов. При этом вероятность каждого сложного события оказывается равной Так как указанные сложные события являются несовместимыми, то вероятность их суммы равна сумме их вероятностей. Итак, если есть вероятность появления события А m раз в n испытаниях, то
или
Формула (2.6) называется формулой Бернулли.
Пример:
Пусть всхожесть семян данного растения составляет 90%. Найдем вероятность того, что из четырех посеянных семян взойдут: а) три; б) не менее трех.
а) В данном случае и = 4, т = 3, р = 0,9, q = 1 -р = 0,1.
Применяя формулу Бернулли, получим
б) Искомое событие А состоит в том, что из четырех семян взойдут или три, или четыре. По теореме сложения вероятностей Поэтому Р(A) = 0,2016 + + 0,6561 = 0,0477.
Снова рассмотрим n независимых испытаний, в каждом из которых наступает событие А с вероятностью р. Обозначим через X случайную величину, равную числу появлений события А в n испытаниях.
Понятно, что событие А может вообще не наступить, наступить 1 раз, 2 раза и т. д. и, наконец, наступить п раз. Следовательно, возможными значениями величины X будут числа 0, 1, 2, …, n- 1, n.
По формуле Бернулли можно найти вероятности этих значений.
Запишем полученные данные в виде таблицы распределения:
Построенный закон распределения дискретной случайной величины X называется законом биномиального распределения.
Найдем М(Х) для биноминального распределения. Очевидно, что X, — число появлений события А в каждом испытании — представляет собой случайную величину со следующим распределением:
Поэтому Но так как
Найдем далее D(X) и . Так как величина имеет распределение
то Поэтому
Наконец, в силу независимости величин
Отсюда для биноминального распределения
Пример:
Монета брошена 2 раза. Напишем в виде таблицы закон распределения случайной величины X— числа выпадений герба.
Вероятность появления герба в каждом бросании монеты Следовательно, вероятность непоявления герба При двух бросаниях монеты герб может либо совсем не появиться, либо появиться 1 раз, либо появиться 2 раза. Таким образом, возможные значения X таковы: Найдем вероятность этих возможных значений по формуле Бернулли:
Тогда искомый закон распределения будет иметь вид:
Пример:
Первая игра де Мерэ*. Игральная кость бросается четыре раза. Рыцарь бился об заклад, что при этом хотя бы один раз выпадет шесть очков. Какова вероятность выигрыша для рыцаря?
Решение:
Вероятность выпадения шестерки при одном бросании игральной кости равна (см. § 1.1, п. 3, пример 4). Значит, вероятность ее невыпадения при одном бросании равна (противоположное событие). Тогда вероятность невыпадения шестерки при четырех бросаниях, согласно формуле Бернулли,
Значит, вероятность выигрыша для рыцаря есть
Это значит, что чем больше рыцарь играл, тем больше он выигрывал. Оказываясь постоянно в проигрыше, противники рыцаря перестали играть с ним по этим правилам.
Пример:
Вторая игра де Мерэ. Две игральные кости бросаются 24 раза. Рыцарь бился об заклад, что при этом хотя бы один раз выпадут две шестерки. Какова вероятность проигрыша для рыцаря?
Решение:
При одном одновременном бросании двух игральных костей вероятность выпадения двух шестерок равна , а вероятность того, что не выпадут две шестерки, равна .Тогдa вероятность того, что при 24-х одновременных бросаниях двух игральных костей ни разу не выпадут две шестерки, согласно фор муле Бернулли,
т. е. вероятность проигрыша для рыцаря была больше . Это значит, что чем больше рыцарь будет играть, тем больше он будет проигрывать. Когда так и случилось, рыцарь разорился и обратился к Паскалю за разъяснениями. Паскаль успешно раскрыл математические тайны правил двух игр рыцаря де Мерэ.
Пример:
Применяемый метод лечения приводит к выздоровлению в 80% случаев. Какова вероятность того, что из 5 больных выздоровят 4?
В данном случае Поэтому по формуле Бернулли
Пример:
В условии предыдущего примера найдем вероятность того, что из 5 больных выздоровят не менее 4.
Искомая вероятность есть сумма вероятностей Имеем:
Задача об экстрасенсе. Обычный человек примерно в половине случаев правильно угадывает, в какой руке спрятан мелкий предмет.
Предположим, что верный ответ получен в трех случаях из четырех. Случайно ли это? Или при таком результате можно говорить о необычных способностях угадывающего?
Если принять вероятность угадывания в норме , то по формуле Бернулли
где q = I — р,
или
Как видим, каждый четвертый нормальный человек правильно угадывает в трех случаях из четырех.
Допустим, что верный ответ получен в девяти случаях из десяти. Какова вероятность такого угадывания у нормального человека?
По формуле Бернулли
Таким образом, нормальный человек лишь в одном случае из 100 может случайно продемонстрировать такой результат. И если подобное угадывание происходит чаще, то можно, по-видимому, говорить, что угадыватель — экстрасенс (или мистификатор).
Распределение Пуассона
Пусть проводится серия n независимых испытаний (n=1, 2, 3, …), причем вероятность появления данного события А в этой серии зависит от ее номера n и стремится к нулю при (последовательность «редких событий»). Предположим, что для каждой серии среднее значение числа появлений события А постоянно, т. е.
Отсюда
На основании формулы Бернулли (2.6) для вероятности появления события А в n-й серии ровно m раз имеет место формула
Пусть т фиксировано. Тогда
(здесь использован второй замечательный предел
Поэтому
Если n велико, то в силу определения предела вероятность сколь угодно мало отличается от . Отсюда при больших n
для искомой вероятности имеем приближенную формулу Пуассона (для простоты знак приближенного равенства опущен).
где
Пример:
Завод отправил на базу 500 доброкачественных изделий. Вероятность того, что в пути изделие повредится, равна 0,002. Найдем вероятность того, что на базу придут три негодных изделия.
По условию Поэтому и искомая вероятность
Определение:
Говорят, что случайная величина X распре-делена по закону Пуассона, если эта величина задана таблицей
где — фиксированное положительное число (разным значениям отвечают разные распределения Пуассона).
Полезно проверить, что для приведенной таблицы сумма всех вероятностей равна единице. Действительно, с учетом известного разложения для имеем
Распределение Пуассона заслуживает особого внимания, так как из всех дискретных распределений оно наиболее часто встречается в приложениях.
Найдем математическое ожидание дискретной величины X, распределенной по закону Пуассона. Согласно определению математического ожидания (§ 2.2, п. 2, примечание 2), имеем
Таким образом, параметр р в распределении Пуассона есть не что иное, как математическое ожидание величины X.
Найдем далее D(X). Сначала найдем начальный момент второго порядка (§ 2.3, п. 4):
Запишем закон распределения величины
Отсюда
Затем по известной формуле (§ 2.3, п. 4) вычислим дисперсию
Задача. (Редкие болезни.) Многие болезни достаточно редки или становятся таковыми после принятия профилактических и лечебных мер. Однако даже при самых благоприятных условиях в больших популяциях все же встречается некоторое число больных редкими болезнями. Например, при введении вакцины против полиомиелита иммунитет создается в 99,99% случаев. Какова вероятность того, что из 10 000 вакцинированных детей заболеет один?
Вероятность заболеть p= 1 -0,9999 = 0,0001, число испытаний n =10 000. Поэтому = 0,0001 10000= 1, и по формуле Пуассона имеем
Аналогично, вероятность, что заболеют 2 ребенка
а вероятности заболевания 3 и 4 детей соответственно равны
Непрерывные случайные величины
Интегральная функция распределения
Для непрерывной случайной величины в отличие от дискретной нельзя построить таблицу распределения. Поэтому непрерывные случайные величины изучаются другим способом, который мы и будем рассматривать.
Пусть X— непрерывная случайная величина с возможными значениями из некоторого интервала (а; b) и х — действительное число. Под выражением Х<х понимается событие «случайная величина X приняла значение, меньшее х». Вероятность этого события Р(X<х) есть некоторая функция переменной х:
Определение:
Интегральной функцией распределения (или кратко функцией распределения) непрерывной случайной величины X называется функция F(x), равная вероятности того, что X приняла значение, меньшее х:
F(x) — это геометрический смысл этого равенства: вероятность того, что случайная величина X примет значение, которое изображается на числовой оси точкой, лежащей левее точки х.
Отметим, что функция распределения совершенно так же определяется для дискретных случайных величин.
Укажем свойства, которыми обладает функция F(x).
Это свойство следует из того, что F(x) есть вероятность.
2. F(x) — неубывающая функция, т. е. если
Доказательство:
Предположим, что Событие «X примет значение, меньшее » можно представить в виде суммы двух несовместимых событий: «X примет значение, меньшее » и «X примет значение, удовлетворяющее неравенствам ». Обозначим вероятности последних двух событий соответственно через По теореме о вероятности суммы двух несовместимых событий имеем
откуда с учетом равенства (2.7)
Так как вероятность любого события есть число неотрицательное, то и, значит,
Формула (2.8) утверждает свойство 3.
3. Вероятность попадания случайной величины X в полуинтервал [а; b) равна разности между значениями функции распределения в правом и левом концах интервала (а; b):
В частности, в случае полуинтервала
Пример:
Пусть случайная величина X задана функцией распределения:
Найдем вероятность того, что в результате испытания X примет значение, принадлежащее полуинтервалу [0; 2).
Так как на полуинтервале , то
В дальнейшем случайную величину будем называть непрерывной, если ее функция распределения непрерывна с непрерывной или кусочно-непрерывной производной.
4. Вероятность того, что непрерывная случайная величина X примет какое-либо заранее заданное значение, равна нулю:
Доказательство:
Положив в (2.9′) будем иметь
Так как F(x) — непрерывная функция, то, перейдя в (2.11) к пределу при , получим искомое равенство (2.10).
Из свойства 4 следует свойство 5.
5. Вероятности попадания непрерывной случайной величины в интервал, сегмент и полуинтервал с одними и теми же концами одинаковы:
6. Если возможные значения случайной величины X принадлежат интервалу (а; b), то:
Доказательство:
1) Пусть Тогда событие . невозможно, и, следовательно, вероятность его равна нулю. 2) Пусть Тогда событие достоверно, и, следовательно, вероятность его равна 1.
Следствие:
Если возможные значения непрерывной случайной величины расположены на всей числовой оси, то справедливы следующие предельные соотношения:
Дифференциальная функция распределения
Дифференциальной функцией распределения непрерывной случайной величины X (или ее плотностью вероятности, или ее плотностью распределения) называется функция f(x), равная производной интегральной функции
Так как F(x) — неубывающая функция, то
Из равенства (2.9′) с учетом неравенства справедливого для малых , и свойства 5 (п. 1) имеем
или
(для малых , т. е. вероятность попадания случайной величины X в интервал при малых приближенно равна произведению ее плотности вероятности в точке х на длину этого итервала.
Имеет место и следующая теорема.
Теорема:
Вероятность попадания непрерывной случайной величины X в интервал (а; b) равна определенному интегралу от ее плотности вероятности, взятому в пределах от а до b:
Доказательство:
Так как F(x) является первообразной для f(х), то на основании формулы Ньютона —Лейбница имеем
Теперь с учетом соотношений (2.9), (2.12), (2.14) получим искомое равенство.
Из (2.13) следует, что геометрически вероятность Р(а<Х<b) представляет собой площадь криволинейной трапеции, ограниченной графиком плотности вероятности y=f(x) и отрезками прямых у = 0, х = а и х=b.
Следствие:
В частности, если f(x) — четная функция и концы интервала симметричны относительно начала координат, то
Действительно,
Пример:
Пусть задана плотность вероятности случайной величины X
Найдем вероятность того, что в результате испытания X примет значение, принадлежащее интервалу (0,5; 1).
Согласно формуле (2.13), искомая вероятность
Заменяя в формуле (2.14) а на и b на х, получим
откуда в силу приведенного выше следствия (п. 1)
Выражение (2.16) позволяет найти интегральную функцию распределения F(x) по ее плотности вероятности.
Заметим, что из формулы (2.16) и отмеченного следствия вытекает, что
Пример:
Пусть плотность вероятности случайной величины X задана так:
Требуется найти коэффициент А, функцию распределения F(x) и вероятность попадания случайной величины X в интервал (0; 1).
Коэффициент А найдем, воспользовавшись соотношением (2.17). Так как
то , откуда
Применяя формулу (2.16), получим функцию распределения F(х):
Наконец, формулы (2.9) и (2.12) с учетом найденного значения функции F(х) дают
Математическое ожидание и дисперсия непрерывной случайной величины
Пусть непрерывная случайная величина X задана плотностью вероятности f(х). Допустим, что все возможные значения X принадлежат отрезку [a; b]. Точками разобьем его на n частичных отрезков, длины которых обозначим через Наибольшую из этих длин обозначим через
Предполагая определить математическое ожидание непрерывной случайной величины по аналогии с дискретной, составим сумму
(напомним, что произведение при малых приближенно равно вероятности попадания случайной величины X в интервал см. § 2.5, п. 2]. Перейдя в этой сумме к пределу при , получим определенный интеграл , который и называют математическим ожиданием непрерывной случайной величины X, все возможные значения которой принадлежат отрезку
Если возможные значения непрерывной случайной величины X принадлежат всей числовой оси, то математическое ожидание определяется интегралом
При этом предполагается, что несобственный интеграл сходится абсолютно, т. е. интеграл существует.
По аналогии с дисперсией дискретной случайной величины определяется и дисперсия непрерывной случайной величины.
Дисперсией непрерывной случайной величины X называют математическое ожидание квадрата ее отклонения.
Если все возможные значения X принадлежат отрезку то
если возможные значения X принадлежат всей числовой оси, то
при условии, что последний несобственный интеграл сходится.
Заметим, что свойства математического ожидания и дисперсии дискретных случайных величин сохраняются и для непрерывных случайных «величин.
Наконец, для непрерывной случайной величины X среднее квадратическое отклонение определяется, как и для дискретной величины, формулой
Пример:
Пусть случайная величина X задана плотностью вероятности
Определим математическое ожидание, дисперсию и среднее квадратическое отклонение величины X.
Согласно формулам (2.18) и (2.19), имеем:
и наконец,
Основные законы распределения непрерывных случайных величин
Равномерное распределение
Распределение вероятностей непрерывной случайной величины X, принимающей все свои значения из отрезка , называется равномерным, если ее плотность вероятности на этом отрезке постоянна, а вне его равна нулю, т. е.
Отсюда
Но, как известно (см. § 2.5, п. 2),
Из сравнения равенств (2.20) и (2.21) получаем
Итак, плотность вероятности непрерывной случайной величины X, распределенной равномерно на отрезке [а; b], имеет вид
Пример:
На отрезке наугад указывают точку. Какова вероятность того, что эта точка окажется в левой половине отрезка?
Обозначим через X случайную величину, равную координате выбранной точки. X распределена равномерно (в этом и состоит точный смысл слов: «наугад указывают точку»), а так как середина отрезка [а; b] имеет координату , то искомая вероятность равна (см. § 2.5, п. 2):
Впрочем, этот результат был ясен с самого начала (см. § 1.2, п. I).
Нормальный закон распределения
Закон распределения вероятностей непрерывной случайной величины X называется нормальным законом, или законом Гаусса*, если ее плотность вероятности есть
где и а—постоянные, причем >0.
Убедимся, что функция (2.22) удовлетворяет условию (2.17). Действительно, перейдя в интеграле
к новой переменной
получим интеграл
Но
Следовательно,
Значит, интеграл (2.23) тоже равен единице.
Покажем, что или
Согласно формуле (2.18), получаем
Введя новую переменную t по формуле (2.24), с учетом равенства (2.25) получим
Далее, в соответствии с формулой (2.19)
Воспользовавшись подстановкой (2.24), получим:
Применяя здесь метод интегрирования по частям получим с учетом (2.25)
График функции (кривая Гаусса) имеет вид (рис. 6). С учетом графика этой функции график функции (2.22) будет иметь вид (рис. 7). Причем его максимальная ордината равна Значит, эта ордината убывает с возрастанием значения о (кривая «растягивается» к оси Ох — рис. 8) и возрастает с убыванием значения
(кривая «сжимается» в положительном направлении оси Оу). Изменение значений параметра а (при неизменном значении о) не влияет на форму кривой.
Нормальное распределение с параметрами а = 0 и =1 называется нормированным. Плотность вероятности в случае такого распределения оказывается равной
Вероятность попадания случайной величины, распределенной по нормальному закону, в заданный интервал.
Пусть случайная величина X распределена по нормальному закону. Тогда вероятность того, что X примет значение, принадлежащее интервалу согласно теореме из п. 2 § 2.5
Проведя в этом интеграле замену переменной получим
Учитывая, что функция является первообразной
для , и используя формулу Ньютона — Лейбница, будем иметь
Пример:
Пусть случайная величина X распределена по нормальному закону с параметрами а = 30 и = 10. Найдем вероятность того, что X примет значение, принадлежащее инвервалу (10 50).
Пользуясь формулой (2.26), получим
По таблице приложения 3 находим Ф(2) = 0,4772. Отсюда искома вероятность
Вычисление вероятности заданного отклонения. Часто требуется определить вероятность того, что отклонение нормально распределенной случайной величины X от ее математического ожидания по абсолютной величине меньше заданного положительного числа 8, т. е. нужно найти
Используя формулу (2.26) и учитывая, что функция Ф(х) нечетная, имеем
т. е.
Пример:
Пусть случайная величина X распределена по нормальному закону с параметрами а = 20 и =10. Найдем
Используя выражение (2.27), имеем
По таблице приложения 3 находим Ф(0,3) = 0,1179. Поэтому
Правило трех сигм.
Полагая в выражении (2.27) получим
Но Ф(3) = 0,49865 (см. таблицу приложения 3) и, значит,
Формула (2.28) означает, что событие, состоящее в осуществлении неравенства , имеет вероятность, близкую к единице, т. е. является почти достоверным. Эта формула выражает так называемое правило трех сигм: если случайная величина распределена по нормальному закону, то модуль ее отклонения от математического ожидания не превосходит утроенного среднего квадратического отклонения.
В заключение заметим, что нормальное распределение вероятностей имеет в теории вероятностей большое значение. Нормальному закону подчиняется вероятность при стрельбе по цели, его используют в теории погрешностей физических измерений и т. п.
Закон больших чисел
Неравенство Чебышева
Лемма:
Пусть X — случайная величина, принимающая только неотрицательные значения, тогда
Доказательство:
Для простоты докажем это утверждение для дискретной величины X, принимающей случайные значения при условии По теореме сложения вероятностей для несовместимых событий (§ 1.3, п. 1) имеем
где суммирование распространено на все значения большие или равные единице. Но для очевидно,
Поэтому
Добавим к правой части неравенства (2.30) сумму где Эта сумма неотрицательна, так как по условию, а вероятность Поэтому
Последняя сумма распространена на все значения х„ принимаемые случайной величиной X. Следовательно (см. § 2.2, п. 1),
Отсюда, сопоставляя соотношения (2.30) и (2.31), получаем искомое неравенство (2.29).
Теорема:
Для любой случайной величины X при каждом положительном числе є имеет место неравенство
Неравенство (2.32) называется неравенством Чебышева.
Доказательство:
Так как событие равносильно событию
то
Случайная величина неотрицательна, и, значит, согласно лемме, свойству 2 математического ожидания (§ 2.2, п. 2) и определению дисперсии (§ 2.3, п. 1)
Поэтому
Пример:
Пусть случайная величина X имеет D(X) = 0,001. Какова вероятность того, что она отличается от М(Х) более чем на 0,1?
По неравенству Чебышева
Примечание:
Отметим другую форму неравенства Чебышева. Так как событие, выражаемое неравенством противоположно событию, выражаемому неравенством то (§ 1.3, п. 1, следствие 2)
Отсюда с учетом неравенства (2.32) получаем такую форму неравенства Чебышева:
Закон больших чисел Чебышева
Докажем закон больших чисел в широкой и удобной для практики форме, полученной П.Л. Чебышевым.
Теорема:
Теорема Чебышева; закон больших чисел. Если дисперсии независимых случайных величин ограничены одной и той же постоянной с, n, то каково бы ни было , вероятность выполнения неравенства где будет сколь угодно близка к единице, если число случайных величин n достаточно велико, т. е.
Доказательство:
Применяя неравенство Чебышева (2.33) к величине X, имеем
Пользуясь свойствами дисперсии (§ 2.3, п. 2) и условием теоремы, получим
Отсюда с учетом неравенства (2.35) и того, что вероятность любого события не превосходит единицы (§ 1, п. 3), получим
Наконец, переходя в неравенстве (2.36) к пределу при , приходим к искомому соотношению (2.34).
Частный случай теоремы Чебышева. Если все имеют одинаковое математическое ожидание и то
Действительно, в условиях рассматриваемого частного случая равенство (2.34) имеет вид (2.37).
Сущность теоремы Чебышева состоит в следующем. Несмотря на то, что каждая из независимых случайных величин может принять значение, далекое от математического ожидания M(Xt), среднее арифметическое достаточно большого числа случайных величин с большой вероятностью весьма близко к среднему арифметическому их математических ожиданий.
Теорема Чебышева имеет громаднейшее практическое значение. Пусть, например, измеряется некоторая физическая величина. Обычно принимают в качестве искомого значения измеряемой величины среднее арифметическое результатов нескольких измерений. Можно ли считать такой подход верным? Теорема Чебышева (ее частный случай) отвечает на этот вопрос положительно.
На теореме Чебышева основан широко применяемый в статистике выборочный метод, согласно которому по сравнительно небольшой случайной выборке выносят суждение, касающееся всей совокупности исследуемых объектов.
Из теоремы Чебышева (частный случай) следует теорема Бернулли, являющаяся простейшей формой закона больших чисел.
Теорема Бернулли:
Пусть m — число наступлений события А в n независимых испытаниях и р есть вероятность наступления события А в каждом из испытаний. Тогда, каково бы ни было положительное число
Доказательство:
Обозначим через случайную величину, равную числу наступлений события А в k-м испытании, где k=1, 2, …, п. Тогда имеем (§ 2.4, п. 1)
и все условия частного случая теоремы Чебышева выполнены. Равенство (2.37) превращается в равенство (2.38).
Практический смысл теоремы Бернулли следующий: при постоянстве вероятности случайного события А во всех испытаниях при неограниченном возрастании числа испытаний можно с вероятностью, сколь угодно близкой к единице (т. е. как угодно близко к достоверности), утверждать, что наблюдаемая относительная частота случайного события будет как угодно мало отклоняться от его вероятности.
Предельные теоремы теории вероятностей
Центральная предельная теорема
Как уже отмечалось, нормально распределенные случайные величины имеют широкое распространение на практике. Объяснение этому дает центральная предельная теорема, один из вариантов формулировки которой принадлежит русскому математику А. М. Ляпунову (1857—1918). Суть центральной предельной теоремы состоит в следующем: если случайная величина X представляет собой сумму очень большого числа независимых случайных величин, влияние каждой из которых на всю сумму ничтожно мало, то X имеет распределение, близкое к нормальному.
Приведем без доказательства (доказательство см. в работе (3]) центральную предельную теорему для случая одинаково распределенных случайных величин.
Теорема:
Если —независимые случайные величины, имеющие одно и то же распределение с математическим ожиданием а и дисперсией то при неограниченном увеличении п закон распределения суммы неограниченно приближается к нормальному.
Локальная и интегральная предельные теоремы Лапласа
Если число испытаний n велико, то вычисления по формуле Бернулли становятся затруднительными. Лаплас* получил важную приближенную формулу для расчета вероятности появления события А точно m раз, если n — достаточно большое число. Им же
получена приближенная формула и для суммы вида
Локальная предельная теорема Лапласа. Пусть р = Р(А) — вероятность события А, причем 0<р<1. Тогда вероятность того, что в условиях схемы Бернулли событие А при п испытаниях появится точно m раз, выражается приближенной формулой
где q = 1 -p;
Для функции составлена таблица (см. приложение 2) ее значений для положительных значений х [функция четная].
Выражение (2.39) называют формулой Лапласа.
Пример:
Вероятность поражения цели стрелком при одиночном выстреле р = 0,2. Какова вероятность того, что при 100 выстрелах цель будет поражена ровно 20 раз?
Здесь р = 0,2, q = 0,8, n = 100 и m = 20. Отсюда
и, следовательно,
Учитывая, что из формулы (2.39) получаем
Перейдем к интегральной теореме Лапласа. Поставим следующий вопрос: какова вероятность того, что в условиях схемы Бернулли событие А, имеющее вероятность Р(А) =р(0<р< 1) при n испытаниях (как и прежде число испытаний велико), появится не менее k раз и не более l раз? Эту искомую вероятность обозначим
На основании теоремы сложения вероятностей для несовместимых событий (§ 1.3, п. 1) получим
Получим приближенную формулу Лапласа для подсчета суммы (2.40) при больших m и n. Используя локальную теорему Лапласа, приближенно будем иметь
где
Далее, в силу равенства (2.41) имеем
и потому
Здесь сумма справа является интегральной суммой для функции на отрезке причем, как следует из равенства (2.42), при Следовательно, при предел указанной интегральной суммы есть определенный интеграл
Поэтому
где
Выражение (2.43) при условии (2.44) и составляет содержание интегральной предельной теоремы Лапласа. Нами уже была введена функция
называемая функцией Лапласа, или интегралом вероятности. Очевидно, Ф(х) есть первообразная для функции . Поэтому на основании формулы Ньютона — Лейбница из формулы (2.43) получим
(интегральная формула Лапласа).
Как известно, интеграл не берется в элементарных функциях. Поэтому для функции (2.45) составлена таблица (см. приложение 3) ее значений для положительных значений х, так как Ф(0) = 0 и функция Ф(х) нечетная:
Пример:
Вероятность того, что изделие не прошло проверку ОТК, p = 0,2. Найдем вероятность того, что среди 400 случайно отобранных изделий окажутся непроверенными от 70 до 100.
Здесь
Поэтому в силу равенств (2.44) и, согласно формуле (2.46)
Замечание:
Отметим, что локальную и интегральную предельные теоремы Лапласа иногда еще называют локальной и интегральной предельными теоремами Муавра*— Лапласа.
Распределение случайных ошибок измерения
Пусть проводится измерение некоторой величины. Разность х-а между результатом измерения х и истинным значением а измеряемой величины называется ошибкой измерения. Вследствие воздействия на измерение большого количества факторов, которые невозможно учесть (случайные изменения температуры, колебание прибора, ошибки, возникающие при округлении и т. п.), ошибку измерения можно считать суммой большого числа независимых случайных величин, которая по центральной предельной теореме должна быть распределена нормально. Если при этом нет систематически действующих факторов (например, неисправности приборов, завышающих при каждом измерении показания), приводящих к систематическим ошибкам, то математическое ожидание случайных ошибок равно нулю.
Итак, принимается положение: при отсутствии систематически действующих факторов ошибка измерения есть случайная величина (обозначим ее через Т), распределенная нормально, причем ее математическое ожидание равно нулю, т. е. плотность вероятности величины Т равна
где — среднеквадратическое отклонение величины Т, характеризующее разброс результатов измерения вокруг измеряемой величины.
Результат измерения также есть случайная величина (обозначим ее через X), связанная с Т зависимостью Х=а+Т. Отсюда: М(Х)=а, и X имеет нормальный закон распределения.
Заметим, что случайная ошибка измерения, как и результаты измерения, всегда выражается в некоторых целых единицах, связанных с шагом шкалы измерительного прибора; в теории удобнее считать случайную ошибку непрерывной случайной величиной, что упрощает расчеты.
При измерении возможны две ситуации:
а) известно (это характеристика прибора и комплекса условий, при которых проводятся измерения), требуется по результатам измерений оценить а;
б) не известно, требуется по результатам измерений оценить а и .
Рассмотрению этих ситуаций при проведении физических измерений будет посвящен § 4.3.
Двумерные случайные величины
Понятие о двумерной случайной величине:
В различных практических приложениях встречаются случайные величины, возможные значения которых определяются не одним числом, а несколькими. Так, при вытачивании на станке цилиндрической детали ее размеры (диаметр основания и высота) являются случайными величинами. Таким образом, здесь мы имеем дело с совокупностью (системой) двух случайных величин, называемой двумерной случайной величиной и обозначаемой через (X, Y). Каждая из величин X и Y называется составляющей (компонентой) такой системы.
Различают дискретные (составляющие этих величин дискретные величины) и непрерывные (составляющие этих величин непрерывные величины) двумерные случайные величины.
Аналогично n-мерную случайную величину можно рассматривать как систему n случайных величин. Например, трехмерная величина (X, Y, Z) определяет систему трех случайных величин X, У, Z.
На практике чаще приходится встречаться с двумерными случайными величинами. Поэтому ограничимся их рассмотрением, хотя все положения, касающиеся двумерных случайных величин, могут быть распространены и на л-мерные случайные величины. Геометрически двумерная случайная величина (X, Y) интерпретируется как случайная точка на плоскости.
Аналогично одномерной дискретной случайной величине, законом распределения дискретной двумерной случайной величины (X, Y) называют перечень возможных значений этой величины, т. е. пар чисел , и их вероятностей Обычно закон распределения этой величины задают в виде таблицы. Ее общий вид
Здесь, например, есть вероятность того, что двумерная величина (X У) примет значение
Так как события образуют полную группу несовместимых событий, то сумма всех вероятностей, помещенных в таблице, равна единице (§ 1.3, п. 1, следствие 1), т. е.
Зная закон распределения двумерной дискретной случайной величины, можно найти законы распределения каждой из составляющих. Действительно, например, события несовместны, поэтому вероятность того, что X примет значение по теореме сложения вероятностей (см. § 1.3, п. 1) такова:
Таким образом, вероятность того, что X примет значение равна сумме вероятностей «строки ». Аналогично в случае других возможных значений величины X. Сложив же вероятности «столбца получим вероятность
Пример:
Найдем законы распределения составляющих двумерной случайной величины, заданной законом распределения:
Решение:
Сложив вероятности по строкам, получим вероятности возможных значений X:
Отсюда закон распределения X:
Сложив вероятности по столбцам, получим
и, значит, закон распределения составляющей Y:
Функция распределения двумерной случайной величины
Определение функции распределения двумерной случайной величины и ее свойства:
Определение:
Функцией распределения двумерной случайной величины (X, У) (безразлично, дискретной или непрерывной) называют функцию F(x, у), определяющую для каждой пары действительных чисел х, у вероятность того, что X примет значение, меньшее х, и при этом У примет значение, меньшее у:
Геометрически (рис. 9) это равенство представляет собой вероятность того, что случайная точка (X, У) попадет в бесконечный квадрант с вершиной (х, у), расположенный левее и ниже этой вершины.
Пример:
Найдите вероятность того, что в результате испытания составляющая X двумерной случайной величины (X, У) примет значение Х< 4 и при этом составляющая У примет значение У<5, если известна функция распределения этой величины
Решение:
Имеем
Укажем свойства, которыми обладает функция F(x, у).
1.
Это свойство следует из того, что F(х, у) вероятность.
2. F(x, у) — неубывающая функция по каждому аргументу, т. е.
Свойство становится наглядным, если воспользоваться геометрической интерпретацией функции распределения.
3. Имеют место предельные соотношения:
Эти соотношения также следуют из геометрической интерпретации функции распределения.
4. При функция распределения системы стремится к функции распределения составляющей X(Y):
Действительно, при бесконечный квадрант с вершиной в точке A (х, y) превращается в полуплоскость, вероятность попадания в которую есть функция распределения составляющей X(Y).
Вероятности попадания случайной точки в полуполосу и прямоугольник
1. Найдем вероятность того, что в результате испытания случайная точка попадет в полуполосу (рис. 10, а) или в полуполосу (рис. 10,6).
Вычитая из вероятности попадания случайной точки в квадрант с вершиной вероятность попадания этой точки в квадрант с вершиной (рис. 10, а) получим
Аналогично
Итак, вероятность попадания случайной точки в полуполосу равна приращению функции распределения по одному из аргументов.
2. Найдем вероятность попадания случайной точки (X; У) в прямоугольник ABCD (рис. 11).
Для этого из вероятности попадания случайной точки в полуполосу Ай с вертикальной штриховкой вычтем вероятность попадания этой точки в полуполосу DC с горизонтальной штриховкой. Получим
Пример:
Найдем вероятность попадания случайной точки (X, У) в прямоугольник, ограниченный прямыми если известна функция распределения
Решение:
В данном примере в выражении (3.1) и, значит,
Плотность вероятности двумерной случайной величины
Двумерная плотность вероятности и ее свойства
Определение:
Плотностью вероятности (плотностью распределения) непрерывной двумерной случайной величины (X, У) называется вторая смешанная частная производная ее функции распределения, т. е.
Геометрически плотность вероятности двумерной случайной величины (X, У) представляет собой поверхность в пространстве Oxyz, которую называют поверхностью распределения.
Плотность вероятности f(х, у) обладает свойствами, аналогичными свойствам плотности вероятности одномерной случайной величины.
1. Плотность вероятности двумерной случайной величины неотрицательна:
Действительно, разделив обе части равенства (3.1) на площадь прямоугольника и дважды воспользовавшись формулой Лагранжа, получим
Перейдя здесь к пределу при , находим
откуда и следует свойство 1.
2. Обозначим событие, состоящее в попадании случайной точки (X, Y) в область D, так: Тогда вероятность попадания непрерывной двумерной случайной величины (X, Y) в область D (аналогично одномерному случаю) равна
Пример:
Найдем плотность вероятности f(х, у) случайной величины (X, Y) по известной функции распределения
Решение:
Имеем
Отсюда, согласно формуле (3.2),
Это свойство следует из того, что интеграл слева в последнем равенстве есть вероятность попадания случайной точки (X, Y) во всю плоскость хОу, т. е. вероятность достоверного события.
Пример:
Двумерная плотность вероятности двух случайных величин X, Y
Найдем величину С.
Решение. Согласно формуле (3.3), имеем
Но
и, значит,
откуда
Пример:
В круге плотность вероятности двумерной случайной величины , а вне его F(x, у) = 0.
Найдем вероятность попадания случайной точки (X, Y) в круг
Решение:
Согласно формуле (3.3), имеем
Перейдя здесь к полярным координатам, найдем
Отыскание функции распределения двумерной случайной величины по известной двумерной плотности вероятности
Из формулы (3.2) имеем
откуда
Ho (cm. § 3.2, n. 1)
Следовательно,
Пример:
Пусть задана двумерная плотность вероятности случайной величины (X, Y)
Найдем функцию распределения.
Решение:
Согласно формуле (3.5),
Нахождение плотностей вероятности составляющих двумерной случайной величины
Пусть известна двумерная плотность вероятности f(x, у) случайной величины (X, Y). Тогда функция распределения F(x, у) определяется формулой
откуда
С другой стороны (см. § 3.2, п. 1)
где — функция распределения составляющей X. Из равенств (3.6) и (3.7) находим
Отсюда
или
где — плотность вероятности составляющей X.
Аналогично получим формулу для плотности вероятности составляющей У:
Пример:
Двумерная случайная величина (X, У) задана плотностью распределения
Найдем плотности распределения составляющих X и Y.
Решение:
Найдем плотность распределения составляющей X по формуле (3.8)
так как интеграл
(см. приложение 1).
Аналогично используя формулу (3.8′), получим
Условные законы распределения составляющих двумерных дискретных и непрерывных случайных величии
Условные законы распределения составляющих двумерных дискретных случайных величин
Рассмотрим дискретную двумерную случайную величину (X, У).
Пусть возможные значения составляющих
Допустим, что в результате испытания величина У приняла значение при этом X примет одно из своих возможных значений: или или . Обозначим условную вероятность того, что X примет, например, значение при условии, что через В общем случае условные вероятности составляющей будем обозначать так:
Определение:
Условным распределением составляющей X при называют совокупность условных вероятностей
вычисленных в предположении, что событие , уже наступило.
Так же определяются и условные распределения X при ,
Аналогично определяются условные распределения составляющей Y.
Зная закон распределения двумерной дискретной случайной величины, можно, воспользовавшись формулой
получить условные законы распределения составляющих. Так, условный закон распределения X в предположении, что событие , уже произошло, может быть найден по формуле
Аналогично находят условные законы распределения составляющей Y. Например, условный закон распределения Y в предположении, что событие уже произошло, есть
Замечание:
Сумма вероятностей условного распределения авна единице. Действительно, например,
Это свойство используют для контроля вычислений.
Пример:
Дискретная двумерная случайная величина задана таблицей
Найдем условный закон распределения составляющей X при условии, что составляющая Y приняла значение
Решение:
Искомый закон определяется совокупностью условных вероятностей:
Воспользовавшись формулой (3.9) и приняв во внимание данные указанной таблицы и что (§ 3.1, пример), имеем:
Условные законы распределения составляющих двумерных непрерывных случайных величин
Пусть (X, Y) — непрерывная двумерная случайная величина.
Определение:
Условной плотностью распределения составляющей Xпри данном значении Y = у называют отношение двумерной плотности вероятности f(x, у) к плотности вероятности составляющей Y:
Отличие условной плотности от плотности составляющей X состоит в том, что функция дает распределение X при условии, что составляющая У приняла значение У=у, функция же дает распределение X независимо от того, какие из возможных значений приняла составляющая У.
Аналогично определяется условная плотность составляющей Y при данном значении Х-х:
Формулы (3.10) и (3.11) с учетом формул (3.8′) и (3.8) могут быть переписаны и в следующем виде:
Заметим, что, как и всякая плотность, условные плотности обладают свойствами:
Пример:
Пусть двумерная случайная величина (X, Y) задана плотностью вероятности
Требуется найти условные плотности вероятности составляющих Х и Y
Решение:
Ранее (см. § 3.4, пример) были найдены плотности вероятности составляющих X и Y
Поэтому, согласно формулам (3.10) и (3.11), найдем:
Независимость случайных величии
Теорема:
Для того чтобы случайные величины X и Y были независимыми, необходимо и достаточно, чтобы функция распределения системы (X, Y) была равна произведению функции ее составляющих:
Доказательство:
Необходимость. Пусть X и Y независимы. Тогда события . независимы, следовательно, вероятность совмещения этих событий равна произведению их вероятностей.
Или
Достаточность. Пусть Отсюда следует, что вероятность совмещения событий Х<х и Y< у равна произведению вероятностей этих событий. Следовательно, величины X и Y независимы.
Следствие:
Для того чтобы непрерывные случайные величины X и Y были независимыми, необходимо и достаточно, чтобы плотность вероятности системы (X, Y) была равна произведению плотностей вероятности составляющих X и Y:
Пример:
Двумерная непрерывная случайная величина (X, Y) задана плотностью вероятностей
Докажите, что составляющие X и У независимы.
Решение:
Согласно формуле (3.8)
Аналогично согласно формуле
и, значит,
т. е. случайные величины X и Y независимы.
Элементы теории корреляции
Корреляционная зависимость
Часто приходится иметь дело с более сложной зависимостью, чем функциональная. Такова, например, связь между осадками и урожаем или связь между толщиной снегового покрова зимой и объемом стока последующего половодья. Здесь каждому значению одной величины соответствует множество возможных значений другой величины. Подобного рода зависимости относятся к корреляционным зависимостям.
Определение:
Две случайные величины X и Y находятся в корреляционной зависимости, если каждому значению любой из этих величин соответствует определенное распределение вероятностей другой величины.
Определение:
Условным математическим ожиданием дискретной случайной величины X при У=у (у—определенное возможное значение У) называется сумма произведений возможных значений величины X на их условные вероятности:
где — условная вероятность равенства , при условии, что У=у.
Для непрерывных величин
где — плотность вероятности случайной непрерывной величины X при условии Y=y.
Условное математическое ожидание есть функция от у: , которую называют функцией регрессии величины X на величину Y.
Аналогично определяются условное математическое ожидание случайной величины Y и функция регрессии Y на X:
Уравнение x=f(y) (y = g(x)) называется уравнением регрессии X на Y (Y на X), а линия на плоскости, соответствующая этому уравнению, называется линией регрессии.
Линия регрессии Y на X (X на У) показывает, как в среднем зависит У от X (X от У).
Пример:
Пусть Х и У независимы, М(Х) = а, M(Y) = b. Тогда . Линии регрессии изображены на рис. 12.
Пример:
Х и У связаны линейной зависимостью: Y=AX+B, Тогда функция регрессии У на X будет иметь вид
Так как , то функция регрессии X на У имеет вид
Значит, линия регрессии X на У: Таким образом, в случае линейной зависимости X и У линии регрессии X на У и У на X совпадают, и эта линия прямая.
Корреляционный момент и коэффициент корреляции
Для характеристики корреляционной зависимости между вели чинами используются коррекляционный момент и коэффициен корреляции.
Определение:
Корреляционным моментом случайных величин X и Y называют математическое ожидание произведения отклонений этих величин
Для вычисления корреляционного момента дискретных величии используется выражение
а для непрерывных — выражение
Замечание:
Корреляционный момент , может быть переписан в виде
Действительно, используя свойства математического ожидания (см. §§ 2.2; 2.6), имеем
Теорема:
Корреляционный момент двух независимых случайных величин X и Y равен нулю.
Доказательство:
Согласно замечанию
а так как X и Y независимые случайные величины, то (см. §§ 2.2. 2.6)
и, значит, = 0.
Из определения корреляционного момента следует, что он имеет размерность, равную произведению размерностей величин X и У т. е. его величина зависит от единиц измерения случайных величин Поэтому для одних и тех же двух величин величина корреляциенного момента может иметь различные значения в зависимости от того, в каких единицах были измерены величины. Для устранения этого недостатка условились за меру связи (зависимости) двух случайных величин X и Y принять безразмерную величину
где , называемую коэффициентом корреляции.
Пример:
Пусть двумерная дискретная случайная величина (X, К) задана законом распределения:
Найдем корреляционный момент и коэффициент корреляции случайных величин X и Y.
Решение:
Сложив вероятности по строкам, получим вероятности возможных значений X:
Отсюда закон распределения X:
и, значит,
Сложив же вероятности по столбцам, найдем вероятности возможных значений Y:
Отсюда закон распределения Y:
и, значит,
Наконец, применяя формулу (3.12), получим:
Следовательно, и коэффициент корреляции
Пример:
Пусть система случайных величин (X, К) имеет закон распределения с плотностью
Найдем корреляционный момент и коэффициент корреляции случайных величин X и Y.
Решение:
Плотности вероятности составляющих X и Y найдем по формулам (3.8) и
и, значит,
Далее имеем
Следовательно,
Найдем теперь . Согласно формуле (3.13), имеем
но
Отсюда
Затем, интегрируя по частям, найдем
Для определения коэффициента корреляции предварительно найдем . Имеем
т.е.
Но
(два раза применяли операцию интегрирования по частям).
Следовательно,
Таким образом, коэффициент корреляции
Теорема:
Абсолютная величина корреляционного момента двух случайных величин не превосходит произведения их средних квадратических отклонений:
Доказательство:
Введя в рассмотрение случайную величину найдем ее дисперсию. Имеем
(любая дисперсия неотрицательна).
Отсюда
Введя случайную величину аналогично найдем
В результате имеем
или
Определение:
Случайные величины X и У называются некоррелированными, если , и коррелированными, если
Пример:
Независимые случайные величины X и У являются некоррелированными, так как в силу соотношения (3.12)
Пример:
Пусть случайные величины Х и У связаны линейной зависимостью Найдем коэффициент корреляции. Имеем:
откуда
Поэтому
Таким образом, коэффициент корреляции случайных величин, связанных линейной зависимостью, равен ±1 (точнее, , если А>0 и , если А<0).
Отметим некоторые свойства коэффициента корреляции.
Из примера 1 следует:
1) Если X и Y — независимые случайные величины, то коэффициент корреляции равен нулю.
Заметим, что обратное утверждение, вообще говоря, неверно. (Доказательство см. в работе [2].)
2) Абсолютная величина коэффициента корреляции не превосходит единицы:
Действительно, разделив обе части неравенства (3.16) на произведение, приходим к искомому неравенству.
3) Как видно из формулы (3.15) с учетом формулы (3.14), коэффициент корреляции характеризует относительную величину отклонения математического ожидания произведения M(XY) от произведения математических ожиданий М(Х) M(Y) величин X и Y. Так как это отклонение имеет место только для зависимых величин, то можно сказать, что коэффициент корреляции характеризует тесноту зависимости между X и Y.
Линейная корреляция
Этот вид корреляционной зависимости встречается довольно часто.
Определение:
Корреляционная зависимость между случайными величинами X и Y называется линейной корреляцией, если обе функции регрессии а(у) и g(x) являются линейными. В этом случае обе линии регрессии являются прямыми, их называют прямыми регрессии.
Выведем уравнения прямой регрессии Y на X, т. е. найдем коэффициент линейной функции g(x) = Ax + В.
Обозначим С использованием свойств МО (§§ 2.2; 2.6) находим:
т.е. b = Аа + В, откуда В=b-Аа.
Далее, с помощью тех же свойств математического ожидания имеем
откуда
или, согласно свойству I дисперсии (§§ 2.3; 2.6),
Полученный коэффициент называется коэффициентом регрессии У на X и обозначается через
Таким образом, уравнение прямой регрессии У на X имеет вид
Аналогично можно получить уравнение прямой регрессии X на У
где
есть коэффициент регрессии X на У
Уравнения прямых регрессии можно записать в более симметричном виде, если воспользоваться коэффициентом корреляции. С учетом этого коэффициента имеем:
и поэтому уравнения прямых регрессии принимают вид:
Из уравнений прямых регрессии видно, что обе эти прямые проходят через точку (a; b); угловые коэффициенты прямых регрессии равны соответственно (рис. 13):
Так как , то Это означает, что прямая регрессии У на X имеет меньший наклон к оси абсцисс, чем прямая регрессии X на У. Чем ближе к единице, тем меньше угол между прямыми регрессии. Эти прямые сливаются тогда и только тогда, когда
При прямые регрессии описываются уравнениями у= b; х= а.
В этом случае
Из формул (3.21) видно, что коэффициенты регрессии имеют тот же знак, что и коэффициент корреляции и связаны соотношением
Нормальное распределение двумерной случайной величины
Определение:
Распределение двумерной случайной величины (X, У) называется нормальным, если ее плотность вероятности определяется выражением:
Нормальное распределение зависит от пяти параметров Можно доказать, что — математические ожидания случайных величин — их средние квадратические отклонения и — коэффициент корреляции этих величин.
Покажем, что если составляющие двумерной нормально распределенной случайной величины некоррелированы, то они и независимы. Действительно, если X и У некоррелированы, то , следовательно,
отсюда и следует независимость составляющих X и У (см. § 3.6, следствие).
Справедливо и обратное утверждение.
Таким образом, понятия «некоррелированные величины» и «независимые величины» для случая нормального распределения равносильны.
Замечание:
Опираясь на выражения (3.8) и (3.8′), можно доказать, что если двумерная случайная величина распределена нормально с параметрами то ее составляющие также распределены нормально с параметрами, соответственно равными
Решение заданий и задач по предметам:
Дополнительные лекции по теории вероятностей:
- Случайные события и их вероятности
- Функции случайных величин
- Числовые характеристики случайных величин
- Законы больших чисел
- Статистические оценки
- Статистическая проверка гипотез
- Статистическое исследование зависимостей
- Теории игр
- Вероятность события
- Теорема умножения вероятностей
- Формула полной вероятности
- Теорема о повторении опытов
- Нормальный закон распределения
- Определение законов распределения случайных величин на основе опытных данных
- Системы случайных величин
- Нормальный закон распределения для системы случайных величин
- Вероятностное пространство
- Классическое определение вероятности
- Геометрическая вероятность
- Условная вероятность
- Схема Бернулли
- Многомерные случайные величины
- Предельные теоремы теории вероятностей
- Оценки неизвестных параметров
- Генеральная совокупность