Оглавление:
Здравствуйте, на этой странице я собрала краткий курс лекций по предмету «Теория вероятностей и математическая статистика» — ТВИМС.
Лекции подготовлены для студентов любых специальностей и охватывает курс предмета «Теория вероятностей и математическая статистика».
В лекциях вы найдёте основные законы, теоремы, формулы и примеры с решением.
Если что-то непонятно — вы всегда можете написать мне в WhatsApp и я вам помогу! |
Тео́рия вероя́тностей — раздел математики, изучающий случайные события, случайные величины, их свойства и операции над ними. wikipedia.org/wiki/Теория_вероятностей
Математи́ческая стати́стика — наука, разрабатывающая математические методы систематизации и использования статистических данных для научных и практических выводов. wikipedia.org/wiki/Математическая_статистика
Предмет теория вероятностей
Задачи любой науки состоят в выявлении и исследовании закономерностей, которым подчиняются реальные процессы.
Теория вероятностей — математическая наука, изучающая закономерности случайных явлений. Знание закономерностей, которым подчиняются массовые случайные события, позволяет предвидеть, как эти события будут протекать.
Методы теории вероятностей широко применяются в различных отраслях науки и техники: в теории надёжности, теории массового обслуживания, теоретической физике, геодезии, астрономии, теории ошибок, теории управления, теории связи и во многих других теоретических и прикладных науках. Теория вероятностей служит для обоснования математической статистики.
Математическая статистика — раздел математики, изучающий методы сбора, систематизации и обработки результатов наблюдений с целью выявления статистических закономерностей. Методы математической статистики используются при планировании организации производства, анализе технологических процессов, для контроля качества продукции и многих других целей.
Первые работы, в которых зарождались основные понятия теории вероятностей, появились в XVI-XVII веках. Они принадлежали Д.Кардано, Б.Паскалю, П.Ферма, Х.Гюйгенс и др. и представляли попытки создания теории азартных игр с целью дать рекомендации игрокам. Следующий этап развития теории вероятностей связан с именем Я.Бернулли, который доказал теорему, теоретически обосновавшую накопленные ранее факты и названную в дальнейшем «законом больших чисел».
Дальнейшее развитие теории вероятностей приходится на XVII-XIX века благодаря работам А.Муавра, П.Лапласа, К.Гаусса, С.Пуассона и др. Весьма плодотворный период развития «математики случайного» связан с именами русских математиков П.Л.Чебышсва, А.М.Ляпунова и А.А.Маркова.
Большой вклад в последующее развитие теории вероятностей и математической статистики внесли российские математики С.Н.Бсрнштейн, В.И.Романовский, А.Н.Колмогоров, А.Я.Хинчин, Б.В.Гнеденко и др., а также учёные англо-американской школы Стьюдент (псевдоним В.Госсета), Р.Фишер, Э.Пирсон, Е.Нейман и др. Особо следует отметить неоценимый вклад академика А.Н.Колмогорова в становление теории вероятностей как математической науки.
Широкому внедрению статистических методов исследования способствовало появление во второй половине XX века электронных вычислительных машин и, в частности, персональных компьютеров. Статистические программные пакеты сделали эти методы более доступными и наглядными, так как трудоёмкую работу по расчёту статистик, параметров, характеристик, построению таблиц и графиков в основном стал выполнять компьютер, а исследователю осталась главным образом творческая работа: постановка задачи, выбор методов решения и интерпретация результатов.
Основные понятия теории вероятностей
Наблюдаемые события можно разделить на три вида: достоверные, невозможные и случайные.
Событие называется достоверным, если оно обязательно произойдет при выполнении данного ряда условий.
Событие называется невозможным, если оно заведомо не произойдет при выполнении данного ряда условий.
Событие называется случайным, если при осуществлении ряда условий оно может либо произойти, либо не произойти. Испытанием называется осуществление ряда условий. События называются несовместными, если появление одного из них исключает появление других событий в одном и том же испытании. События называются единственно возможными, если появление в результате испытания одного и только одного из них является достоверным событием.
Очевидно, единственно возможные события являются попарно несовместимыми.
События называются равновозможными. если можно считать, что ни одно из них не является более возможным, чем другие.
Элементарным исходом называется каждый из возможных результатов испытания.
Полной группой называется совокупность единственно возможных событий испытания.
Противоположными называются два единственно возможных события, образующих полную группу. Если одно из двух противоположных событий обозначено через , то другое обозначают .
Суммой двух событий и называется событие, состоящее в появлении события или события , или обоих этих событий. Суммой нескольких событий называется событие, которое состоит в появлении хотя бы одного из этих событий.
Произведением двух событий и называется событие , состоящее в совместном появлении этих событий.
Произведением нескольких событий называется событие, состоящее в совместном появлении всех этих событий.
Вероятностью события называется отношение числа благоприятных исходов к общему числу всех элементарных исходов испытания, если все исходы равновозможны (классическое определение вероятности). Формулой это определяется так:
где — число элементарных исходов, благоприятных событию — число всех возможных элементарных исходов.
Из определения вероятности вытекают следующие свойства:
а) вероятность достоверного события равна единице;
б) вероятность невозможного события равна нулю;
в) вероятность случайного события есть положительное число, заключенное между нулем и единицей;
г) вероятность суммы двух несовместных событий равна сумме вероятностей этих событий:
Пример № 1
В ящике 10 пронумерованных шаров с номерами от 1 до 10. Вынули один шар. Какова вероятность того, что номер вынутого шара не превышает 10?
Решение:
Так как номер любого шара, находящегося в ящике, не превышает 10, то число случаев, благоприятствующих событию , равно числу всех возможных случаев, т.е.
В этом случае событие достоверно.
Пример № 2
В урне 15 шаров: 5 белых и 10 чёрных. Какова вероятность вынуть из урны синий шар?
Решение:
Синих шаров в урне нет, т.е.
Следовательно,
В данном случае событие — невозможное.
Пример № 3
В урне 12 шаров: 3 белых, 4 чёрных и 5 красных. Какова вероятность вынуть из урны чёрный шар?
Решение:
Здесь
Пример № 4
В урне 10 шаров: 6 белых и 4 чёрных. Вынули 2 шара. Какова вероятность того, что оба шара — белые?
Решение:
Здесь число всех случаев
Число же случаев, благоприятствующих событию , определяется равенством
Итак,
Пример № 5
В корзине 100 фруктов: 10 груш и 90 яблок. Наугад взяты четыре фрукта. Найти вероятность того, что
а) взято четыре яблока;
б) взято четыре груши.
Решение:
Общее число элементарных исходов испытания равно числу сочетаний из 100 элементов по четыре, т.е. .
а) Число исходов, благоприятствующих рассматриваемому событию (все взятые наугад четыре фрукта являются яблоками), равно числу сочетаний из 90 элементов по четыре, т.е. .
Искомая вероятность равна отношению числа исходов, благоприятствующих рассматриваемому событию, к общему числу возможных элементарных исходов:
б) Число исходов, благоприятствующих рассматриваемому событию (все взятые наугад четыре фрукта — груши), равно числу способов, которыми можно извлечь четыре груши из десяти имеющихся, т.е. . Искомая вероятность
Пример № 6
Из 10 ответов к задачам, помещённым на данной странице, 2 имеют опечатки. Студент решает 5 задач. Какова вероятность того, что в одной из них ответ дан с опечаткой.
Решение:
Примечание. Такие задачи описываются общей схемой. Имеется совокупность из элементов первого вида и элементов второго вида. Какова вероятность того, что при выборе совокупности из элементов она состоит из элементов первого вида и элементов второго вида, где
Относительная частота события
Относительной частотой события называется отношение числа испытаний, в которых событие появилось, к общему числу фактически произведенных испытаний. Таким образом,
где — число появлений события; — общее число испытаний, — относительная частота события.
В тех случаях, когда классическое определение вероятности неприменимо (например, когда число исходов бесконечно), используется статистическое определение. В этом случае за вероятность события принимается относительная частота события.
Геометрическое определение вероятности
При классическом определении вероятности не всегда можно определить числа и для вычисления вероятностей событий, и поэтому непосредственно пользоваться формулой не удаётся. В таких случаях вводят понятие геометрической вероятности, т. е. вероятности попадания точки в область (отрезок, часть плоскости, часть тела и т. д.).
Пусть, например, на плоскости имеется некоторая область и в ней содержится другая область . Требуется найти вероятность того, что точка, взятая наудачу в области , попадет в область . При этом выражению «точка, взятая наудачу в области » придается следующий смысл: эта точка может попасть в любую точку области . Вероятность попадания точки в какую-либо часть области пропорциональна мере этой части (длине, площади, объему и т.д.) и не зависит от ее расположения и формы:
(геометрическое определение вероятности).
Пример № 7
На отрезке длины числовой оси наудачу нанесена точка . Найти вероятность того, что отрезки и имеют длину больше, чем .
Решение:
Разобьём отрезок на четыре равные части точками (рис. 1). Требование задачи будет выполнено, если точка попадёт на отрезок , длина которого равна .
Следовательно,
Пример № 8
Внутри эллипса расположен круг . Найти вероятность попадания точки в кольцо, ограниченное эллипсом и кругом.
Решение:
Пусть событие — попадание точки в кольцо. Тогда
где
Так как
то
Примечание. В случае классического определения вероятность невозможного события равна нулю. Справедливо и обратное утверждение, т.е. если вероятность события равна нулю, то событие невозможно. При геометрическом же определении вероятности обратное утверждение не имеет места. Вероятность попадания брошенной точки в одну определённую точку области равна нулю, однако это событие может произойти и, следовательно, не является невозможным.
Пример № 9 (Задача о встрече)
Два студента и условились встретиться в определённом месте во время перерыва между 13 ч и 13 ч 50 мин. Пришедший первым ждёт другого в течение 10 мин, после чего уходит. Чему равна вероятность их встречи, если приход каждого из них в течение указанных 50 мин может произойти наудачу, и моменты прихода независимы?
Решение:
Обозначим момент прихода студента через , а студента — через . Для того чтобы встреча произошла, необходимо и достаточно, чтобы . Изобразим и как декартовы координаты на плоскости, а в качестве единицы масштаба выберем одну минуту (рис. 2). Всевозможные исходы изобразятся точками квадрата со стороной 50, а исходы, благоприятствующие встрече, — точками заштрихованной области. Искомая вероятность равна отношению площади заштрихованной фигуры к площади всего квадрата:
Аксиоматическое построение теории вероятностей
Пусть — множество всех возможных исходов некоторого испытания (опыта, эксперимента). Каждый элемент множества , т.е. , называют элементарным событием или элементарным исходом, а само множество — пространством элементарных событий. Любое событие рассматривается как некоторое подмножество (часть) множества , т.е. .
Само пространство элементарных событий представляет собой событие, происходящее всегда (при любом элементарном исходе со), и называется достоверным событием. Таким образом, выступает в двух качествах: множества всех элементарных исходов и достоверного события. Ко всему пространству элементарных событий добавляется ещё пустое множество , рассматриваемое как событие и называемое невозможным событием.
Суммой нескольких событий называется объединение множеств .
Произведением нескольких событий называется пересечение множеств
Событием , противоположным событию , называется дополнение множества до , т.е. .
Несколько событий образуют полную группу (полную систему), если их сумма представляет всё пространство элементарных событий, а сами события несовместные, т.е.
Таким образом, под операциями над событиями понимаются операции над соответствующими множествами.
В начале 30-х годов XX века академик А.Н.Колмогоров разработал подход, связывающий теорию вероятностей с современной метрической теорией функций и теорией множеств, который в настоящее время является общепринятым.
Сформулируем аксиомы теории вероятностей. Каждому событию поставим в соответствие некоторое число, называемое вероятностью события , т.е. . Так как любое событие есть множество, то вероятность события есть функция множества.
Вероятность события должна удовлетворять следующим аксиомам: Р.1. Вероятность любого события неотрицательна: .
Р.2. Вероятность достоверного события равна 1: .
Р.З. Вероятность суммы несовместных событий равна сумме вероятностей этих событий, т.е. если то
Из аксиом P.1, Р.2, Р.З можно вывести основные свойства вероятностей:
Произведение событий
Условной вероятностью называется вероятность события , вычисленная в предположении, что событие уже произошло. Теорема. Вероятность произведения двух событий равна произведению вероятности одного из них на условную вероятность другого, вычисленную в предположении, что первое событие уже наступило:
Следствие. Вероятность совместного появления нескольких событий равна произведению вероятности одного из них на условные вероятности всех остальных, причем вероятность каждого последующего события вычисляется в предположении, что все предыдущие события уже появились:
Два события и называются независимыми, если
Пример № 10
В первом ящике 2 белых и 10 чёрных шаров; во втором ящике 8 белых и 4 чёрных шара. Из каждого ящика вынули по шару. Какова вероятность, что оба шара белые?
Решение:
В данном случае речь идёт о совмещении событий и , где событие — появление белого шара из первого ящика, событие — появление белого шара из второго ящика. При этом и — независимые события. Имеем
Применив теорему умножения вероятностей, находим
Пример № 11
В ящике 6 белых и 8 чёрных шаров. Из ящика вынули два шара (не возвращая вынутый шар в ящик). Найти вероятность того, что оба шара белые.
Решение:
Пусть событие — появление белого шара при первом вынимании; событие — появление белого шара при втором вынимании. По теореме умножения вероятностей для случая зависимых событий имеем
Но
(вероятность появления первого белого шара);
(вероятность появления второго белого шара в предположении, что первый белый шар уже вынут). Поэтому
Пример № 12
Три стрелка независимо друг от друга стреляют по цели. Вероятность попадания в цель для первого стрелка равна 0,75, для второго — 0,8, для третьего — 0,9. Определить вероятность того, что все три стрелка одновременно попадут в цель.
Решение:
Пример № 13
Из колоды в 52 листа наугад вытягиваются три карты. Какова вероятность, что все три карты — тузы?
Решение:
Интересующее нас событие (все три карты — тузы) является произведением трех событий: — первая карта туз, — вторая карта туз, — третья карта туз. По теореме умножения
(число благоприятствующих исходов — число тузов в колоде, общее число элементарных исходов равно числу карт).
(число благоприятствующих исходов — число тузов, оставшихся после совершения события , т.е. после того, как один туз был вынут из колоды; общее число исходов равно числу карт, оставшихся в колоде после того, как одну карту уже вынули). Аналогично,
Следовательно,
Пример № 14
Вероятность выхода станка из строя в течении одного рабочего дня равна ( — малое положительное число, второй степенью которого можно пренебречь). Какова вероятность того, что за 5 дней станок ни разу не выйдет из строя? Решить задачу при = 0,01.
Решение:
Так как (1 — ) — вероятность того, что станок не выйдет из строя в течение дня, то по теореме умножения вероятностей — вероятность того, что станок не выйдет из строя в течение 5 дней.
Воспользовавшись биномиальным разложением и пренебрегая членами, содержащими получим приближённое равенство . Приняв , получаем .
Сумма событий
Теорема. Вероятность суммы нескольких попарно несовместных событий равна сумме вероятностей этих событий:
Теорема. Сумма вероятностей событий образующих полную группу, равна единице:
Теорема. Сумма вероятностей противоположных событий равна единице:
Теорема. Вероятность суммы совместных событий равна сумме вероятностей этих событий без вероятности их совместного появления:
Пример № 15
В урне 10 белых, 15 чёрных, 20 синих и 25 красных шаров. Вынули один шар. Найти вероятность того, что вынутый шар: белый; чёрный; синий; красный; белый или чёрный; синий или красный; белый, чёрный или синий.
Решение:
Имеем
Применив теорему сложения вероятностей, получим
Пример № 16
Два стрелка стреляют по мишени. Вероятность попадания в цель первым стрелком равна 0,6, вторым — 0,8. Найти вероятность того, что при одном залпе:
а) попадут в цель оба стрелка;
б) попадет хотя бы один.
Решение:
Обозначим события: — попадет в цель первый стрелок, — попадет в цель второй стрелок.
а) Интересующее нас событие (попадут в цель оба стрелка) является произведением событий и . Так как и — независимые события (стрелок попадает или не попадает в цель независимо от меткости другого), то
Следовательно,
б) 1-й способ. Интересующее нас событие является суммой событий и , поэтому по теореме сложения
2-й способ. Событие (попадет хотя бы один стрелок) и (ни один из стрелков не попадет) — противоположные, поэтому . Следовательно, .
Событие является произведением событий и . Таким образом
Пример № 17
В первом ящике 2 белых и 10 чёрных шаров; во втором ящике 8 белых и 4 чёрных шара. Из каждого ящика вынули по шару. Какова вероятность того, что один из вынутых шаров белый, а другой — чёрный.
Решение:
Пусть: событие — появление белого шара из первого ящика; событие — появление белого шара из второго ящика; событие — появление чёрного шара из первого ящика , событие — появление белого шара из второго ящика .
Определим вероятность того, что шар, вынутый из первого ящика, белый, а из второго ящика — чёрный:
Определим вероятность того, что шар, вынутый из первого ящика, чёрный, а из второго ящика — белый:
Определим теперь вероятность того, что шар, вынутый из одного ящика (безразлично — из первого или второго), окажется белым, а шар, вынутый из другого ящика, — чёрным. Применяем теорему сложения вероятностей:
Пример № 18
Три стрелка независимо друг от друга стреляют по цели. Вероятность попадания в цель для первого стрелка равна 0,75, для второго — 0,8, для третьего — 0,9. Определить вероятность того, что в цель попадёт хотя бы один стрелок.
Решение:
Здесь (вероятность промаха первого стрелка); (вероятность промаха второго стрелка); (вероятность промаха третьего стрелка); тогда — вероятность одновременного промаха всех трёх стрелков — определится следующим образом:
Но событие, противоположное событию , заключается в поражении цели хотя бы одним стрелком. Следовательно, искомая вероятность
Формула полной вероятности
Теорема. Вероятность события , которое может наступить при условии появления одного из несовместных событий образующих полную группу и называемых гипотезами, равна сумме произведений вероятностей каждого из этих событий на соответствующую условную вероятность события :
Пример № 19
Студент знает только 10 из 25 экзаменационных билетов. В каком случае вероятность сдать экзамен больше: когда студент подходит тянуть билет первым или вторым по счету?
Решение:
Обозначим события: — вытягивает выученный билет, подходя первым; — вытягивает выученный билет, подходя вторым.
(число благоприятствующих исходов равно числу выученных билетов; число всех элементарных исходов равно числу билетов). Событие может наступить при появлении одного из двух несовместных событий (первый взятый билет был известен нашему студенту) и (первый взятый билет был невыученный билет). По формуле полной вероятности
Так как
то вероятность одинакова.
Пример № 20
Имеются 4 урны. В первой урне 1 белый и 1 чёрный шар, во второй -2 белых и 3 чёрных шара, в третьей — 3 белых и 5 чёрных шаров, в четвёртой -4 белых и 7 чёрных шаров. Событие — выбор -той урны . Известно, что вероятность выбора -той урны равна , т.е. , Выбирают наугад одну из урн и вынимают из неё шар. Найти вероятность того, что этот шар белый.
Решение:
Из условия следует, что (условная вероятность извлечения белого шара из первой урны); аналогично . Вероятность извлечения белого шара находим по формуле полной вероятности:
Пример № 21
В первой урне 5 белых и 10 чёрных шаров, во второй — 3 белых и 7 чёрных шаров. Из второй урны в первую переложили один шар, а затем из первой урны вынули наугад один шар. Определить вероятность того, что вынутый шар — белый.
Решение:
Обозначим события: — вынули белый шар из первой урны после того, как в неё переложили шар из второй урны; — из второй урны в первую переложили белый шар; — из второй урны в первую переложили чёрный шар.
Если из второй урны в первую переложили белый шар, то в первой урне стало 16 шаров, из них 6 белых, поэтому
Если переложили чёрный шар, то в первой урне стало 16 шаров, из них 5 белых, поэтому
По формуле полной вероятности
Формула Байеса
Пусть событие может наступить при условии появления одного из несовместных событий образующих полную группу. Тогда условная вероятность любого события при условии, что событие уже произошло, вычисляется по формуле Байеса:
Пример № 22
В первой урне 4 белых и 6 чёрных шаров, во второй — 5 белых и 4 чёрных. Из первой урны во вторую перекладывают, не глядя, один шар, после чего из второй урны извлекают один шар. Найти вероятность, что этот шар белый. Какова вероятность, что из первой во вторую урну был переложен чёрный шар, если извлечённый из второй урны шар оказался белым?
Решение:
Пусть — событие, состоящее в том, что извлечённый шар из второй урны оказался белым, — из первой урны во вторую переложили белый шар, — чёрный. и — гипотезы.
Найдем
Если переложили белый шар, то во второй урне стало 10 шаров, из них 6 белых 6
если чёрный, то шаров так же 10, но белых 5, тогда
По формуле полной вероятности
По формуле Байеса:
Схема Бернулли
Испытания называются независимыми относительно события , если при нескольких испытаниях вероятность события не зависит от исходов других испытаний.
Говорят, что испытания проводятся по схеме Бернулли, если для них выполняются следующие условия:
1) испытания независимы;
2) количество испытаний известно заранее;
3) в результате испытания может произойти только два исхода: «успех» или «неуспех»;
4) вероятность «успеха» в каждом испытании одна и та же. Вероятность того, что при испытаниях «успех» осуществится ровно раз и, следовательно, «неуспех» раз, вычисляется по следующей формуле:
где — число сочетаний из элементов по ; — вероятность «успеха»; — вероятность «неуспеха»
Данная формула называется формулой Бернулли.
Пример № 23
В урне 20 белых и 10 чёрных шаров. Вынули подряд 4 шара, причём каждый вынутый шар возвращают в урну перед извлечением следующего, и шары в урне перемешивают. Какова вероятность того, что из четырёх вынутых шаров окажется два белых?
Решение:
Вероятность извлечения белого шара можно считать одной и той же во всех четырёх испытаниях; . Используя формулу Бернулли, получаем
Пример № 24
Вероятность появления события равна 0,4. Какова вероятность того, что при 10 испытаниях событие А появится не более трёх раз?
Решение:
Здесь
Имеем:
- вероятность появления события раз: ;
- вероятность появления события раз: ;
- вероятность появления события раза: ;
- вероятность появления события раза: .
Вероятность того, что событие появится не больше трёх раз, составляет
Полагая
получим
Пример № 25
В семье пять детей. Найти вероятность того, что среди этих детей два мальчика. Вероятность рождения мальчика принять равной 0,51.
Решение:
Вероятность рождения мальчика равна . Следовательно, вероятность рождения девочки равна . Искомая вероятность по формуле Бернулли равна
Локальная и интегральная теоремы Лапласа
В тех случаях, когда использование формулы Бернулли затруднено из-за большого значения п, можно использовать асимптотическую формулу из следующей теоремы.
Локальная теорема Лапласа. Вероятность того, что в независимых испытаниях, в каждом из которых вероятность появления события равна , событие наступит ровно раз (безразлично, в какой последовательности), приближенно равна (тем точнее, чем больше )
Здесь
Имеются таблицы, в которых помещены значения функции
соответствующие положительным значениям аргумента (приложение, табл. 1). Для отрицательных значений аргумента пользуются теми же таблицами, т.к. функция четна, т.е. . При .
Интегральная теорема Лапласа. Вероятность того, что в п независимых испытаниях, в каждом из которых вероятность появления события равна , событие наступит не менее раз и не более раз, приближенно равна
Здесь
функция Лапласа,
Имеются таблицы функции Лапласа (приложение, табл. 2) для положительных значений ; для значений полагают . Для отрицательных значений используют эту же таблицу, учитывая, что функция Лапласа нечетна, т.е.
Пример № 26
Вероятность рождения мальчика равна 0,51. Найти вероятность того, что среди 100 новорожденных окажется 50 мальчиков.
Решение:
По условию задачи
Так как — достаточно большое число, воспользуемся локальной теоремой Лапласа:
Найдем значение :
По справочным таблицам (см. приложение, табл.1) найдем
(т.к. функция — четная).
Искомая вероятность
Пример № 27
Вероятность поражения мишени стрелком при одном выстреле равна 0,8. Найти вероятность того, что при 100 выстрелах мишень будет поражена не менее 75 раз и не более 90 раз.
Решение:
По условию задачи
Воспользуемся интегральной теоремой Лапласа:
где — функция Лапласа,
Вычислим и :
Так как функция Лапласа нечетна, т.е.
получим
По справочным таблицам (см. приложение, табл.2) найдём:
Искомая вероятность
Наивероятнейшее число появлений события в независимых испытаниях
Число (наступление события в независимых испытаниях, в каждом из которых вероятность появления события равна ) называют наивероятнейшим, если вероятность того, что событие наступит в этих испытаниях раз, превышает (или, по крайней мере, не меньше) вероятности остальных возможных исходов испытаний .
Наивероятнейшее число определяют из двойного неравенства
причем:
а) если число — дробное, то существует одно наивероятнейшее число ;
б) если число — целое, то существует два наивероятнейших числа, а именно и ;
в) если число — целое, то наивероятнейшее число .
Пример № 28
В урне 10 белых и 40 чёрных шаров. Вынимают подряд 14 шаров, причём цвет вынутого шара регистрируют, а затем шар возвращают в урну. Определить наивероятнейшее число появлений белого шара.
Решение:
Используя двойное неравенство
при указанных значениях и получим
Таким образом, задача имеет два решения:
Пример № 29
Вероятность попадания стрелком в цель равна 0,7. Сделано 25 выстрелов. Определить наивероятнейшее число попаданий в цель.
Решение:
Здесь
Следовательно,
Так как — целое число, то = 18.
Пример № 30
В результате многолетних наблюдений установлено, что вероятность выпадения дождя 1 октября в данном городе равна 1/7. Определить наивероятнейшее число дождливых дней 1 октября в данном городе за 40 лет.
Решение:
Имеем
Таким образом,
Пример № 31
В урне 100 белых и 80 чёрных шаров. Из урны извлекают шаров (с возвратом каждого вынутого шара). Наивероятнейшее число появлений белого шара равно 11. Найти .
Решение:
Из двойного неравенства
следует, что
Здесь
следовательно,
Итак, задача имеет два решения:
Пример № 32
Найти наиболее вероятное число правильно набранных секретарём страниц среди 19 страниц текста, если вероятность того, что страница набрана с ошибками, равна 0,1.
Решение:
По условию задачи
Найдем наиболее вероятное число правильно набранных страниц из двойного неравенства
Подставляя данные задачи, получим
или
Так как — целое число, то наиболее вероятных чисел два: и
Формула Пуассона
При достаточно больших , если вероятность события мала , формула Лапласа непригодна.
В этих случаях ( велико, р <0,1) пользуются формулой Пуассона: вероятность того, что при очень большом числе испытаний, в каждом из которых вероятность события очень мала, событие наступит ровно раз, приближенно равна
Здесь Имеются таблицы для вычисления , для различных и (приложение, табл. 3).
Пример № 33
Прядильщица обслуживает 1000 веретен. Вероятность обрыва нити на одном веретене в течение 1 минуты равна 0,004. Найти вероятность того, что в течение 1 минуты обрыв произойдет на пяти веретенах.
Решение:
Так как вероятность очень мала, применение локальной теоремы Лапласа приведет к значительному отклонению от точного значения . Поэтому при применяют формулу Пуассона:
где
По условию задачи
Тогда
Подставляя данные задачи, получим
Замечание. Формулы Бернулли, Пуассона и формула, следующая из локальной теоремы Лапласа, служат для нахождения вероятности, что в испытаниях, проводимых по схеме Бернулли, «успех» наступит ровно раз. Для удобства сведём их в одну таблицу.
Случайная величина
Случайной величиной называется переменная величина, значения которой зависят от случая. Примеры случайных величин: число попаданий в мишень при данном числе выстрелов; число очков, выпадающее при бросании игральной кости.
Случайная величина, возможные значения которой можно перенумеровать, называется дискретной. При этом число значений может быть конечным или бесконечным.
Непрерывной называется случайная величина, которая может принимать все значения из некоторого конечного или бесконечного промежутка. Очевидно, число возможных значений непрерывной случайной величины — бесконечно.
Закон распределения дискретной случайной величины
Для характеристики случайной величины нужно знать совокупность возможных значений этой величины, а также вероятности, с которыми эти значения могут появиться. Эти данные образуют закон распределения случайной величины. Закон распределения дискретной случайной величины может быть задан в виде таблицы, первая строка которой содержит возможные значения а вторая — вероятности :
где
Если множество возможных значений бесконечно, то ряд сходится и его сумма равна единице.
Закон распределения дискретной случайной величины может быть задан аналитически (в виде формулы)
или с помощью функции распределения (см. §20).
Закон распределения дискретной случайной величины можно изобразить графически, для чего в прямоугольной системе координат строят точки — возможные значения — соответствующие вероятности) и соединяют их отрезками прямых. Полученную фигуру называют многоугольником или полигоном распределения вероятностей.
Числовые характеристики дискретных случайных величин
Математическим ожиданием дискретной случайной величины называется сумма произведений всех ее возможных значений на их вероятности:
Если дискретная случайная величина принимает бесконечное множество возможных значений, то
причем математическое ожидание существует, если ряд в правой части равенства сходится абсолютно.
Дисперсией случайной величины называется математическое ожидание квадрата отклонения случайной величины от ее математического ожидания:
Дисперсию удобно вычислять по формуле
Средним квадратическим отклонением случайной величины называется квадратный корень из дисперсии:
Свойства математического ожидания
Свойство 1. Математическое ожидание постоянной величины равно самой постоянной:
Свойство 2. Постоянный множитель можно выносить за знак математического ожидания:
Свойство 3. Математическое ожидание произведения взаимно независимых случайных величин равно произведению математических ожиданий сомножителей:
Свойство 4. Математическое ожидание суммы случайных величин равно сумме математических ожиданий слагаемых:
Свойства дисперсии
Свойство 1. Дисперсия постоянной равна нулю:
Свойство 2. Постоянный множитель можно выносить за знак дисперсии, предварительно возведя в квадрат:
Свойство 3. Дисперсия суммы независимых случайных величин равна сумме дисперсий слагаемых:
Примеры дискретных распределений
Биномиальным называют закон распределения дискретной случайной величины — числа появлений «успеха» в независимых испытаниях (возможные значения случайной величины ), в каждом из которых вероятность появления «успеха» равна , вероятность возможного значения (числа появлений «успеха») вычисляют по формуле Бернулли:
Математическое ожидание биномиального распределения равно произведению числа испытаний на вероятность появления события в одном испытании:
Дисперсия биномиального распределения равна произведению числа испытаний на вероятности появления и непоявления события в одном испытании:
Если число испытаний велико, а вероятность появления события в каждом испытании очень мала, то используют приближенную формулу
где — число появлений события в независимых испытаниях, , и говорят, что случайная величина распределена по закону Пуассона.
Пример № 34
Производится независимых испытаний, в каждом из которых некоторое событие наступает с вероятностью — число наступлений события в испытаниях. Для случая 1) малого построить ряд распределения, функцию распределения случайной величины , найти и ; 2) большого и малого найти приближённо с помощью распределения Пуассона; 3) большого найти вероятность .
Решение:
1)
Возможные значения случайной величины : 0,1,2,3,4. Пусть им соответствуют вероятности Найдём их, используя формулу Бернулли:
Таким образом, ряд распределения имеет следующий вид:
По определению функция распределения находится по формуле
Найдем
2)
По формуле Пуассона
Таким образом, имеем:
(значения найдены по табл. 3 приложения).
3)
По условию задачи
Воспользуемся интегральной теоремой Лапласа:
где — функция Лапласа,
Вычислим и :
Так как функция Лапласа нечетна, т.е. , получим
По табл.2 приложения найдем:
Искомая вероятность
Функция распределения вероятностей случайной величины
Функцией распределения называется функция , определяющая для каждого значения вероятность того, что случайная величина примет значение, меньшее , т.е.
Свойства функции распределения:
Свойство 1. Значения функции распределения принадлежат отрезку .
Свойство 2. Функция распределения есть неубывающая функция:
Следствие 1. Вероятность того, что случайная величина примет значение, заключенное в промежутке , равна приращению функции распределения на этом интервале:
Следствие 2. Вероятность того, что непрерывная случайная величина примет одно определенное значение , равна нулю:
Свойство 3. Если все возможные значения случайной величины принадлежат интервалу , то при при . Следствие. Справедливы следующие предельные соотношения:
Свойство 4. Функция распределения непрерывна слева:
Пример № 35
В тёмной комнате 7 красных кубиков и 8 синих, не отличаемых друг от друга на ощупь. Мальчик вынес три кубика. — случайная величина числа красных кубиков среди вынесенных. Найти закон распределения, математическое ожидание и дисперсию случайной величины . Построить график функции распределения и найти вероятность .
Решение:
Возможные значения случайной величины : 0,1,2,3. Пусть им соответствуют вероятности . Найдём их, используя непосредственный подсчёт:
Проверка
Таким образом, закон распределения имеет вид:
Найдем
Дисперсию будем искать по формуле
Составим закон распределения для .
По определению функция распределения находится по формуле
Построим график функции распределения:
IIo функции распределения
Плотность распределения вероятностей непрерывной случайной величины
Плотностью распределения вероятностей непрерывной случайной величины называется первая производная от функции распределения:
Вероятность того, что непрерывная случайная величина примет значение, принадлежащее интервалу , определяется равенством
Зная плотность распределения, можно найти функцию распределения
Свойства плотности распределения:
Свойство 1. Плотность распределения неотрицательна, т.е. .
Свойство 2. Несобственный интеграл от плотности распределения по всей числовой оси равен единице:
Числовые характеристики непрерывных случайных величин
Математическое ожидание непрерывной случайной величины , возможные значения которой принадлежат всей оси , определяется равенством , где — плотность распределения случайной величины .
Предполагается, что интеграл сходится абсолютно.
Дисперсия непрерывной случайной величины , возможные значения которой принадлежат всей оси , определяется равенством
или равносильным равенством
Среднее квадратическое отклонение непрерывной случайной величины определяется так же, как и для дискретной величины:
Все свойства числовых характеристик, указанные для дискретных случайных величин, сохраняются и для непрерывных величин.
Пример № 36
Дана функция плотности распределения
Найти: 1) параметр ; 2) построить графики плотности и функции распределения; 3) ; 4) 5) вероятность , что отклонение случайной величины от не более 1.
Решение:
Так как
получаем
так как
тогда
Итак,
Найдём , функцию распределения по формуле
Итак,
Построим оба графика
Найдем
Так как
Найдём по формуле
Дисперсия вычисляется по формуле
Среднее квадратическое отклонение
Найдем
Так как
следует
в нашей задаче
или
то необходимо найти
Примеры непрерывных распределений
Равномерным называется распределение вероятностей непрерывной случайной величины , если на интервале , которому принадлежат все возможные значения , плотность сохраняет постоянное значение, а именно ; вне этого интервала
Математическое ожидание случайной величины, равномерно распределенной в интервале , равно полусумме концов этого интервала:
Дисперсия случайной величины, равномерно распределенной в интервале , определяется равенством
Нормальным называется распределение вероятностей непрерывной случайной величины , плотность которого имеет вид
где — математическое ожидание, — среднее квадратическое отклонение . Для случайной величины , распределенной по нормальному закону, вероятность того, что примет значение, принадлежащее интервалу , вычисляется по формуле
— функция Лапласа.
Функция распределения случайной величины находится по формуле
а вероятность отклонения нормально распределённой случайной величины от её математического ожидания менее чем на 8 равна:
Правило трёх сигм. Если случайная величина распределена нормально, то абсолютная величина её отклонения от математического ожидания не превосходит утроенного среднего квадратического отклонения с вероятностью 0,9973.
Пример № 37
Масса вагона — случайная величина, распределённая по нормальному закону с математическим ожиданием 65 т и средним квадратичным отклонением 0,9 т. Найти вероятность того, что вагон имеет массу не более 67 т и не менее 64 т. По правилу трёх сигм найти наибольшую и наименьшую границы предполагаемой массы.
Решение:
Для нормального распределённой случайной величины
По правилу трёх сигм наименьшая граница , наибольшая граница . Таким образом, .
Наименьшая граница 62,3 т, наибольшая 67,7 т.
Закон больших чисел
Неравенство Чебышева. Вероятность того, что отклонение случайной величины от ее математического ожидания по абсолютной величине меньше положительного числа , не меньше чем :
Теорема Чебышева. Если последовательность попарно независимых случайных величин имеет конечные математические ожидания и дисперсии этих величин равномерно ограничены (не превышают постоянного числа ), то среднее арифметическое случайных величин сходится по вероятности к среднему арифметическому их математических ожиданий, т.е. если — любое положительное число, то
Теорема Бернулли (Закон больших чисел). Если в каждом из независимых испытаний вероятность появления события постоянна, то как угодно близка к единице вероятность того, что отклонение относительной частоты от вероятности по абсолютной величине будет сколь угодно малым, если число испытаний достаточно велико, т.е.
где — любое сколь угодно малое положительное число.
Центральная предельная теорема
Теорема Ляпунова. Если случайные величины в последовательности … независимы, одинаково распределены и имеют конечное математическое ожидание, и дисперсию , то для любого действительного
где
функция распределения случайной величины
Системы случайных величин
Часто результат опыта описывается не одной случайной величиной , а несколькими случайными величинами: . В этом случае принято говорить, что указанные случайные величины образуют систему
Систему двух случайных величин можно изобразить случайной точкой на плоскости.
Событие, состоящее в попадании случайной точки в область , принято обозначать в виде .
Закон распределения системы двух дискретных случайных величин может быть задан с помощью таблицы
где — вероятность события, заключающегося в одновременном выполнении равенств
При этом
Таблица может содержать бесконечное множество строк и столбцов.
Функцией распределения -мерной случайной величины называется функция , выражающая вероятность совместного выполнения неравенств т.е.
Примечание. Функцию называют также совместной функцией распределения случайных величин .
В двумерном случае для случайной величины функция распределения определяется равенством . Геометрически функция распределения означает вероятность попадания случайной точки в бесконечный квадрант, лежащий левее и ниже точки . Правая и верхняя границы области в квадрант не включаются — это означает, что функция распределения непрерывна слева по каждому из аргументов.
В случае дискретной двумерной случайной величины её функция распределения определяется по формуле:
где суммирование вероятностей распространяется на все , для которых , и все , для которых .
Отметим свойства функции распределения двумерной случайной величины, аналогичные свойствам функции распределения одномерной случайной величины.
- Функция распределения есть неотрицательная функция, заключённая между нулём и единицей, т.е. .
- Функция распределения есть неубывающая функция по каждому из аргументов, т.е. при
- Если хотя бы один из аргументов обращается в , функция распределения равна нулю, т.е. .
- Если один из аргументов обращается в , функция распределения становится равной функции распределения случайной величины, соответствующей другому аргументу:
где и — функции распределения случайных величин и , т.е. .
- Если оба аргумента равны , то функция распределения равна единице: .
Закон распределения системы непрерывных случайных величин будем задавать с помощью функции плотности вероятности . Плотностью вероятности (плотностью распределения или совместной плотностью) непрерывной двумерной случайной величины называется вторая смешанная частная производная её функции распределения, т.е.
Вероятность попадания случайной точки в область определяется равенством
Функция плотности вероятности обладает следующими свойствами:
Если все случайные точки принадлежат конечной области , то последнее условие принимает вид
Математические ожидания дискретных случайных величии и , входящих в систему, определяются по формулам
а математические ожидания непрерывных случайных величин — по формулам
Точка называется центром рассеивания системы случайных величин .
Математические ожидания и . можно найти и проще, если случайные величины и независимы. В этом случае из законов распределения этих случайных величин можно определить математические ожидания и по формуле, приведенной в §16 для дискретных случайных величин и в §22 для непрерывных случайных величин.
Дисперсии дискретных случайных величин и определяются по формулам
Дисперсии же непрерывных случайных величии и , входящих в систему, находятся по формулам
Средние квадратические отклонения случайных величин и определяются по формулам
Для вычисления дисперсий могут быть применены формулы
Важную роль в теории систем случайных величин играет так называемый корреляционный момент (коваркация)
Для дискретных случайных величин корреляционный момент находится по формуле
а для непрерывных — по формуле
Случайные величины и называются независимыми, если вероятность одной из них принять значение, лежащее в любом промежутке области её значений, не зависит от того, какое значение приняла другая величина. В этом случае
Ковариация двух случайных величин характеризует как степень зависимости случайных величин, так и их рассеяние вокруг точки .
Свойства ковариации случайных величин:
Здесь
для дискретных случайных величин и и
для непрерывных величин.
- Ковариация двух независимых случайных величин равна нулю, т.е.
- Ковариация двух случайных величин по абсолютной величине не превосходит произведения их средних квадратических отклонений, т.е.
Для характеристики связи между величинами и рассматривается так называемый коэффициент корреляции
являющийся безразмерной величиной. Свойства коэффициента корреляции:
- Коэффициент корреляции удовлетворяет условию: .
- Если случайные величины и независимы, то .
- Если случайные величины и связаны точной линейной зависимостью то т.е. при и при .
Пример № 38
В двух ящиках находятся по шесть шаров; в первом ящике: 1 шар с №1,2 шара с №2, 3 шара с №3; во втором ящике: 2 шара с №1, 3 шара с №2, 1 шар с №3. Пусть — номер шара, вынутого из первого ящика. — номер шара, вынутого из второго ящика. Из каждого ящика вынули по шару. Составить таблицу закона распределения системы случайных величин . Найти математические ожидания и дисперсии случайных величин и . Определить коэффициент корреляции.
Решение:
Случайная точка (1,1) имеет кратность 1 х 2 = 2;
Всего случайных точек 6×6 = 36 (-кратную точку принимаем за точек). Так как отношение кратности точки ко всему количеству точек равно вероятности появления этой точки, то таблица закона распределения системы случайных величин имеет вид
Сумма всех вероятностей, указанных в таблице, равна единице. Найдём математические ожидания случайных величин и
Точка (7/3; 11/6) является центром рассеивания для заданной системы .
Так как случайные величины и независимы, то математические ожидания и можно подсчитать проще, используя ряды распределения:
Отсюда находим
От системы величин перейдём к системе центрированных величин , где
Составим таблицу
Имеем
Отсюда
Заметим, что и можно найти по формулам
Для нахождения коэффициента корреляции воспользуемся таблицей распределения системы центрированных случайных величин. Определим ковариацию:
Так как , то и коэффициент корреляции .
Этот же результат мы могли получить и не определяя ковариации . Действительно, полагая , получаем, что значение повторяется 2 раза, значение = 2 — 4 раза, а значение = 3 — 6 раз. Значит при получаем ряд распределения случайной величины :
Если , то значение повторяется 3 раза, значение = 2-6 раз, а значение = 3-9 раз. Следовательно, при получается ряд распределения случайной величины :
Наконец, если = 3, то значение = 1 повторяется 1 раз, значение = 2 -2 раза, а значение = 3 — 3 раза. Ряд распределения случайной величины при = 3 имеет вид
Итак, при различных значениях получаем один и тот же ряд распределения случайной величины . Так как ряд распределения случайной величины не зависит от значений случайной величины , то случайные величины и независимы. Отсюда следует, что коэффициент корреляции равен нулю.
Пример № 40
Система случайных величин подчинена закону распределения с плотностью
Область — квадрат, ограниченный прямыми . Требуется: 1) определить коэффициент ; 2) вычислить вероятность попадания случайной точки в квадрат , ограниченный прямыми 3) найти математические ожидания и ; 4) найти средние квадратические отклонения и .
Решение:
1. Коэффициент находим из уравнения
Находим математические ожидания и ; имеем
Следовательно, и
Находим средние квадратические отклонения и :
Итак,
Предмет математическая статистика
Установление закономерностей, которым подчинены массовые случайные явления, основано на изучении статистических данных — результатах наблюдений.
Первая задача математической статистики — указать способы сбора и группировки (если данных очень много) статистических сведений.
Вторая задача математической статистики — разработать методы анализа статистических данных в зависимости от целей исследования.
Основные понятия математической статистики
Генеральная совокупность — совокупность всех изучаемых объектов, — её объём (количество всех объектов).
Выборочная совокупность — совокупность объектов, отобранных для изучения, — объём выборки.
Объемом совокупности (выборочной или генеральной) называют число объектов этой совокупности.
Таким образом, вместо большой совокупности объектов изучается совокупность объёма, значительно меньшего по количеству объектов . Результаты, полученные при изучении выборки, распространяются на объекты всей генеральной совокупности. Для этого выборка должна быть репрезентативной (представительной), то есть правильно представлять генеральную совокупность. Это обеспечивается случайностью отбора.
Виды отбора:
- простой случайный: повторный; бесповторный;
- сложный случайный: типический; механический; серийный.
Простой случайный отбор — производится без деления генеральной совокупности на части.
Повторный отбор — отобранный объект возвращается в генеральную совокупность.
Бссповторный отбор — отобранный объект не возвращается в генеральную
Сложный случайный отбор — производится после предварительного деления генеральной совокупности на части.
Типический отбор — генеральная совокупность делится на типы, из каждого типа случайно отбираются объекты пропорционально объёму типов. Механический отбор — генеральная совокупность делится на части механически, из каждой части случайно отбираются объекты.
Серийный отбор — генеральная совокупность делится на серии, и случайным образом отбираются целые серии объектов.
Статистическое распределение выборки и его характеристики
Пусть из генеральной совокупности извлечена выборка, причем наблюдалось раз, раз, раз — объем выборки. Наблюдаемые значениях, называют вариантами, а последовательность вариант, записанных в возрастающем порядке, — вариационным рядом. Числа наблюдений называются частотами, а их отношения к объему выоорки — относительными частотами.
Статистическим распределением выборки называют перечень вариант и соответствующих им частот или относительных частот.
Результаты выборки представляются в виде статистического распределения:
где
— варианты;
— соответствующие им частоты;
— объём выборки;
— относительные частоты.
Распределение относительных частот:
Основные характеристики выборки:
— выборочная средняя;
— выборочная дисперсия;
— выборочное среднее квадратичное отклонение;
— исправленная дисперсия.
Эмпирической функцией распределения (функцией распределения выборки) называют функцию , определяющую для каждого значения относительную частоту события :
где — число вариант, меньших — объем выборки.
Полигон и гистограмма
Полигон абсолютных частот — это ломаная, отрезки которой соединяют точки
Пример:
Полигон относительных частот — это ломаная, отрезки которой соединяют точки
Пример:
Статистическое распределение может носить интервальный (непрерывный) характер.
Пример:
— длина частичного интервала.
Гистограмма частот — ступенчатая фигура, состоящая из прямоугольников, основаниями которых служат частичные интервалы длиною , а высоты равны отношению (плотность частоты).
Пример № 41
В результате испытания случайная величина приняла следующие значения
Требуется: 1) составить таблицу, устанавливающую зависимость между значениями случайной величины и её частотами; 2) построить статистическое распределение; 3) изобразить полигон распределения.
Решение:
1. Найдём объём выборки: . Составим таблицу
Статистическое распределение имеет вид
Контроль
Последнюю таблицу можно переписать в виде
Возьмём на плоскости точки (1; 0,04), (2; 0,08), (3; 0,12) и т.д. Последовательно соединив эти точки прямолинейными отрезками, получим полигон распределения случайной величины .
Пример № 42
В результате испытания случайная величина приняла следующие значения
Требуется: составить таблицу статистического распределения, разбив промежуток (0, 25) на пять участков, имеющих одинаковые длины; построить гистограмму одинаковых частот.
Решение:
Предварительно составим таблицу
Статистическое распределение имеет вид
Гистограмма относительных частот изображена на рисунке
Точечные оценки параметров генеральной совокупности
Точечной называют оценку, которая определяется одним числом. Оценка параметра называется несмещённой, если её математическое ожидание равно оцениваемому параметру, т.е. . В противном случае оценка называется смещённой.
Оценка параметра называется состоятельной, если она удовлетворяет закону больших чисел, т.е. сходится по вероятности к оцениваемому параметру:
В случае использования состоятельных оценок оправдывается увеличение объёма выборки, так как при этом становятся маловероятными значительные ошибки при оценивании. Поэтому практический смысл имеют только состоятельные оценки. Если оценка состоятельна, то практически достоверно, что при достаточно большом
Несмещённая оценка параметра называется эффективной, если она имеет наименьшую дисперсию среди всех возможных несмещённых оценок параметра , вычисленных по выборкам одного и того же объёма . Параметры генеральной совокупности — генеральная средняя и — генеральная дисперсия оцениваются по соответствующим параметрам выборки:
Пример № 43
Объем выборки:
или
Таким образом, точечные оценки характеристик генеральной совокупности
Для интервального распределения сначала находят середины интервалов .
Пример № 44
Переходим к дискретному распределению
Дальнейшие вычисления проводим, как в предыдущем примере. Получаем:
Таким образом:
Интервальная оценка (доверительный интервал) для генеральной средней
Интервальной называют оценку, которая определяется двумя числами -концами интервала.
Доверительным интервалом для параметра называется интервал , содержащий истинное значение 9 с заданной вероятностью , т.е.
Число называется доверительной вероятностью (надежностью), а значение — уровнем значимости.
Интервальной оценкой (с надежностью ) математического ожидания а нормально распределенного количественного признака по выборочной средней при известном среднем квадратическом отклонении служит доверительный интервал
где — объем выборки; — значение аргумента функции Лапласа (см. приложение, табл. 2), при котором .
— генеральная средняя (оцениваемый параметр); — средняя выборочная, точечная оценка генеральной средней; — точность оценки, — надёжность оценки.
— доверительный интервал для . с вероятностью (надёжностью) .
Для нормального распределения признака
где — объём выборки; — находят из соотношения с помощью табл. 2 (см. приложение). Таким образом, для нормально распределённой величины :
Чем больше , тем меньше , то есть точность оценки увеличивается при увеличении объёма выборки.
Чем выше — надёжность оценки, тем меньше её точность ( увеличивается).
Если неизвестно, то где — исправленная выборочная дисперсия, находится из табл. 4 (приложение) по заданным значениям и .
Интервальной оценкой (с надежностью ) среднего квадратического отклонения нормально распределенного качественного признака по «исправленному» выборочному среднему квадратическому отклонению служит доверительный интервал
где — «исправленное» выборочное среднее квадратическое отклонение; находят по табл. 5 приложения по заданным и .
Пример № 45
Найти доверительный интервал для оценки неизвестного математического ожидания «а» нормально распределённого признака, если известны:
Решение:
Из таблицы
Доверительный интервал
Пример № 46
Найти минимальный объём выборки, при котором с надёжностью 0,95 точность оценки математического ожидания нормально распределённого признака по выборочной средней будет равна 0,2, если среднее квадратическое отклонение равно 2.
Решение:
Дано:
найти .
Из формулы
находим
Из условия
находим
Тогда
Пример № 47
По заданным значениям характеристик нормально распределённого признака найти доверительный интервал для оценки неизвестного математического ожидания:
Решение:
. Из табл. 4 по данным и находим . Тогда
Доверительный интервал (16,8 — 0,95; 16,8 + 0,95) = (15,85; 17,75).
Понятие о критериях согласия
Статистической называется гипотеза о неизвестном законе распределения случайной величины или о параметрах закона распределения, вид которого известен.
Нулевой (основной) гипотезой называется выдвинутая гипотеза .
Конкурирующей (альтернативной) гипотезой называется гипотеза , которая противоречит нулевой гипотезе .
Пусть имеется статистическое распределение выборки для случайной величины :
По виду полигона или гистограммы, сравнивая их с графиками дифференциальных функций распределения, делаем предположение о виде закона распределения случайной величины.
Сделанное предположение (гипотеза) подтверждается расчётами критерия согласия.
Имеются различные критерии согласия: Хинчина, Колмогорова, Пирсона. Например, критерий Пирсона (хи-квадрат)
позволяет сравнивать близость частот — данного статистического распределения с теоретическими частотами , найденными с помощью функции распределения предполагаемого закона:
где — дифференциальная, — интегральная функции предполагаемого распределения.
Если вычисленное значение критерия не превосходит некоторого критического значения взятого по таблице, то выдвинутая гипотеза принимается с заданным уровнем надёжности (вероятности) . В противном случае гипотеза отвергается. В табл. 6 приложения:
— уровень значимости, это вероятность отвергнуть гипотезу; — число степеней свободы, , где
— число параметров предполагаемого распределения: для нормального распределения ( и ), для показательного распределения ().
При проверке гипотезы возможны следующие ошибки: ошибка первого рода — отвергнуть гипотезу при её правильности; ошибка второго рода — принятие гипотезы при правильности альтернативной гипотезы .
Виды зависимостей между случайными величинами X и Y
— количественные признаки, связанные между собой. — их возможные значения.
Функциональная зависимость — каждому значению признака соответствует единственное значение признака . Статистическая зависимость — каждому значению признака соответствует статистическое распределение признака :
Корреляционная зависимость — каждому значению признака соответствует среднее значение признака (условная средняя ):
Аналогично:
— уравнение регрессии по .
— уравнение регрессии по .
Примеры: площадь квадрата есть функция от длины стороны квадрата : , зависимость функциональная.
Товарооборот магазина зависит от числа торговых работников . Эта зависимость корреляционная. Две основные задачи теории корреляции:
- Определить форму корреляционной связи, то есть определить вид уравнения регрессии.
- Оценить тесноту (силу) корреляционной связи.
Корреляционная таблица
Все наблюдения числовых признаков и с соответствующими частотами записываются в корреляционную таблицу.
Пример № 48
Числа 1; 3; 5 (левый столбец таблицы) показывают наблюдаемые значения признака . Числа 2; 4; 6 (первая строка) показывают наблюдаемые значения признака .
Числа внутри таблицы показывают частоту появления соответствующей пары значений . Например, пара (1; 2) наблюдалась 2 раза, пара (3; 4) — 5 раз, пара (1; 4) не наблюдалась ни разу (соответствующая частота равна 0).
По данным наблюдений вычислены частоты :
— частота появления данного значения ,
— частота появления данного значения ,
— объём выборки, количество всех наблюдаемых пар .
Так, значение = 1 наблюдалось 2 + 4 = 6 раз; значение = 5 наблюдалось 3 + 9 + 3 = 15 раз и т.д. Объём выборки = 6 + 11 + 15 + 32 или = 5 + 14 + 13 + 32.
В общем виде корреляционная таблица выглядит так:
Условные средние по :
Условные средние по :
Виды уравнений регрессии
В случаях 1-5 параметры линейной зависимости находятся по формулам, указанным в следующем параграфе. Для случая 6 применяется непосредственно метод наименьших квадратов.
Пример № 49
Дана таблица
Определить коэффициент корреляции и уравнения линий регресии.
Решение:
Составим расчётную таблицу:
Из таблицы получаем:
Теперь находим
Вычисляем значение произведения
так как
то связь достаточно обоснована. Уравнения линий регрессии:
Построив точки, определяемые таблицей, и линии регрессии, видим, что обе линии регрессии проходят через точку (0,7029; 1,5782). Первая линия отсекает на оси ординат отрезок 3,0329, а вторая — на оси абсцисс отрезок 1,4566. Точки расположены близко к линиям регрессии.
Метод наименьших квадратов
Служит для нахождения параметров уравнения регрессии. Пусть даны соответствующие значения рассматриваемых признаков и :
Подберём функцию , наилучшим образом отражающую зависимость между признаками и .
Подставляя в функцию, получим теоретическое значение (обозначим ):
— отклонения теоретических значений от эмпирических значений .
Суть метода наименьших квадратов: параметры выбранной функции находят так, чтобы сумма квадратов отклонений теоретических значений от эмпирических была наименьшей, т.е.
Нахождение параметров уравнения линейной регрессии:
Из системы нормальных уравнений:
Показатели тесноты корреляционной связи
— корреляционное отношение (для линейной и нелинейной связи). — коэффициент корреляции (только для линейной связи). Свойства:
Формулы для вычислении:
— корреляционное отношение к , где межгрупповая дисперсия, характеризует разброс условных средних от общей средней — общая дисперсия, характеризует разброс фактических данных от их общей средней .
— корреляционное отношение к , где
— межгрупповая дисперсия, характеризует разброс условных средних от общей средней — общая дисперсия, характеризует разброс фактических данных от их общей средней
Кстати дополнительная теория из учебников по теории вероятности тут.
Пример составления уравнения линейной регрессии и оценки тесноты корреляционной связи
Пусть — оценка студента по математике в школе, — оценка по математике в первом семестре.
В результате опроса составлена следующая корреляционная таблица:
Оценить тесноту корреляционной связи между и , вычислив коэффициент корреляции . Составить уравнение линейной регрессии по .
Решение:
Для вычисления найдём
Общие средние:
- Это уравнение выражает зависимость средней оценки по математике в первом семестре от оценки в школе.
Аналогично, — уравнение регрессии по .
Тогда,
Построим прямые регрессии по и по . Они всегда проходят через точку .
Чем теснее связь между признаками и , тем ближе друг к другу расположены прямые регрессии (угол между ними мал). Прямые совпадают, если связь между и функциональная.
Основы комбинаторики
Факториалом целого положительного числа (обозначается !) называется произведение
Основное свойство факториала: .
Размещениями из элементов по называются такие соединения по элементов, которые отличаются друг от друга самими элементами или их порядком. Число всех размещений из и различных элементов по к (обозначается ):
Перестановками из элементов называются их соединения, отличающиеся друг от друга только порядком входящих в них элементов. Число всех перестановок из различных элементов (обозначается ):
Если среди элементов имеются одинаковые ( повторяется раз, — раз, раз и т.д.), то
Сочетаниями из элементов по называются их соединения, отличающиеся друг от друга только самими элементами. Число всех сочетаний из различных элементов по (обозначается ):
Основное свойство сочетаний:
Основной закон комбинаторики. Пусть нужно провести к действий, причём первое действие можно провести способами, второе — способами,…, -е- способами. Тогда все действия можно провести способами.
Возможно эти страницы вам будут полезны:
- Решение задач по теории вероятностей
- Помощь по теории вероятности
- Заказать работу по теории вероятности
- Контрольная работа по теории вероятности
- Курсовая работа по теории вероятности
- Решение задач по математической статистике
- Помощь по математической статистике
- Заказать работу по математической статистике
- Контрольная работа по математической статистике
- Курсовая работа по математической статистике
- Теория вероятностей краткий курс для школьников и студентов (заочников)