Формула пуассона и закон распределения пуассона. Распределение Пуассона

Как сразу стали поступать запросы: «Где Пуассон? Где задачи на формулу Пуассона?» и т.п . И поэтому я начну с частного применения распределения Пуассона – ввиду большой востребованности материала.

Задача до боли эйфории знакома:

И следующие две задачи принципиально отличаются от предыдущих:

Пример 4

Случайная величина подчинена закону Пуассона с математическим ожиданием . Найти вероятность того, что данная случайная величина примет значение, меньшее, чем ее математическое ожидание.

Отличие состоит в том, что здесь речь идёт ИМЕННО о распределении Пуассона.

Решение : случайная величина принимает значения с вероятностями:

По условию, , и тут всё просто: событие состоит в трёх несовместных исходах :

Вероятность того, что случайная величина примет значение, меньшее, чем ее математическое ожидание.

Ответ :

Аналогичная задача на понимание:

Пример 5

Случайная величина подчинена закону Пуассона с математическим ожиданием . Найти вероятность того, что данная случайная величина примет положительное значение.

Решение и ответ в конце урока.

Помимо приближения биномиального распределения (Примеры 1-3), распределение Пуассона нашло широкое применение в теории массового обслуживания для вероятностной характеристики простейшего потока событий. Постараюсь быть лаконичным:

Пусть в некоторую систему поступают заявки (телефонные звонки, приходящие клиенты и т.д.). Поток заявок называют простейшим , если он удовлетворяет условиям стационарности , отсутствия последствий и ординарности . Стационарность подразумевает то, что интенсивность заявок постоянна и не зависит от времени суток, дня недели или других временнЫх рамок. Иными словами, не бывает «часа пик» и не бывает «мёртвых часов». Отсутствие последствий означает, что вероятность появления новых заявок не зависит от «предыстории», т.е. нет такого, что «одна бабка рассказала» и другие «набежали» (или наоборот, разбежались). И, наконец, свойство ординарности характеризуется тем, что за достаточно малый промежуток времени практически невозможно появление двух или бОльшего количества заявок. «Две старушки в двери?» – нет уж, увольте.

Итак, пусть в некоторую систему поступает простейший поток заявок со средней интенсивностью заявок в минуту (в час, в день или в произвольный промежуток времени). Тогда вероятность того, что за данный промежуток времени , в систему поступит ровно заявок, равна:

Пример 6

Звонки в диспетчерскую такси представляет собой простейший пуассоновский поток со средней интенсивностью 30 вызовов в час. Найти вероятность того, что: а) за 1 мин. поступит 2-3 вызова, б) в течение пяти минут будет хотя бы один звонок.

Решение : используем формулу Пуассона:

а) Учитывая стационарность потока, вычислим среднее количество вызовов за 1 минуту:
вызова – в среднем за одну минуту.

По теореме сложения вероятностей несовместных событий:
– вероятность того, что за 1 минуту в диспетчерскую поступит 2-3 вызова.

б) Вычислим среднее количество вызов за пять минут:

Наиболее общим случаем различного рода вероятностных распределений является биномиальное распределение. Воспользуемся его универсальностью для определения наиболее часто встречающихся на практике частных видов распределений.

Биномиальное распределение

Пусть имеется некое событие A . Вероятность появления события A равна p , вероятность непоявления события A равна 1 – p , иногда ее обозначают как q . Пусть n — число испытаний, m — частота появления события A в этих n испытаниях.

Известно, что суммарная вероятность всех возможных комбинаций исходов равна единице, то есть:

1 = p n + n · p n – 1 · (1 – p ) + C n n – 2 · p n – 2 · (1 – p ) 2 + … + C n m · p m · (1 – p ) n – m + … + (1 – p ) n .

p n — вероятность того, что в n n раз;

n · p n – 1 · (1 – p ) — вероятность того, что в n n – 1) раз и не произойдет 1 раз;

C n n – 2 · p n – 2 · (1 – p ) 2 — вероятность того, что в n испытаниях событие A произойдет (n – 2) раза и не произойдет 2 раза;

P m = C n m · p m · (1 – p ) n – m — вероятность того, что в n испытаниях событие A произойдет m раз и не произойдет (n – m ) раз;

(1 – p ) n — вероятность того, что в n испытаниях событие A не произойдет ни разу;

— число сочетаний из n по m .

Математическое ожидание M биномиального распределения равно:

M = n · p ,

где n — число испытаний, p — вероятность появления события A .

Среднеквадратичное отклонение σ :

σ = sqrt(n · p · (1 – p )) .

Пример 1 . Вычислить вероятность того, что событие, имеющее вероятность p = 0.5 , в n = 10 испытаниях произойдет m = 1 раз. Имеем: C 10 1 = 10 , и далее: P 1 = 10 · 0.5 1 · (1 – 0.5) 10 – 1 = 10 · 0.5 10 = 0.0098 . Как видим, вероятность наступления этого события достаточно мала. Объясняется это, во-первых, тем, что абсолютно не ясно, произойдет ли событие или нет, поскольку вероятность равна 0.5 и шансы здесь «50 на 50»; а во-вторых, требуется исчислить то, что событие произойдет именно один раз (не больше и не меньше) из десяти.

Пример 2 . Вычислить вероятность того, что событие, имеющее вероятность p = 0.5 , в n = 10 испытаниях произойдет m = 2 раза. Имеем: C 10 2 = 45 , и далее: P 2 = 45 · 0.5 2 · (1 – 0.5) 10 – 2 = 45 · 0.5 10 = 0.044 . Вероятность наступления этого события стала больше!

Пример 3 . Увеличим вероятность наступления самого события. Сделаем его более вероятным. Вычислить вероятность того, что событие, имеющее вероятность p = 0.8 , в n = 10 испытаниях произойдет m = 1 раз. Имеем: C 10 1 = 10 , и далее: P 1 = 10 · 0.8 1 · (1 – 0.8) 10 – 1 = 10 · 0.8 1 · 0.2 9 = 0.000004 . Вероятность стала меньше, чем в первом примере! Ответ, на первый взгляд, кажется странным, но поскольку событие имеет достаточно большую вероятность, вряд ли оно произойдет только один раз. Более вероятно, что оно произойдет большее, чем один, количество раз. Действительно, подсчитывая P 0 , P 1 , P 2 , P 3 , …, P 10 (вероятность того, что событие в n = 10 испытаниях произойдет 0, 1, 2, 3, …, 10 раз), мы увидим:

C 10 0 = 1 , C 10 1 = 10 , C 10 2 = 45 , C 10 3 = 120 , C 10 4 = 210 , C 10 5 = 252 ,
C 10 6 = 210 , C 10 7 = 120 , C 10 8 = 45 , C 10 9 = 10 , C 10 10 = 1 ;

P 0 = 1 · 0.8 0 · (1 – 0.8) 10 – 0 = 1 · 1 · 0.2 10 = 0.0000… ;
P 1 = 10 · 0.8 1 · (1 – 0.8) 10 – 1 = 10 · 0.8 1 · 0.2 9 = 0.0000… ;
P 2 = 45 · 0.8 2 · (1 – 0.8) 10 – 2 = 45 · 0.8 2 · 0.2 8 = 0.0000… ;
P 3 = 120 · 0.8 3 · (1 – 0.8) 10 – 3 = 120 · 0.8 3 · 0.2 7 = 0.0008… ;
P 4 = 210 · 0.8 4 · (1 – 0.8) 10 – 4 = 210 · 0.8 4 · 0.2 6 = 0.0055… ;
P 5 = 252 · 0.8 5 · (1 – 0.8) 10 – 5 = 252 · 0.8 5 · 0.2 5 = 0.0264… ;
P 6 = 210 · 0.8 6 · (1 – 0.8) 10 – 6 = 210 · 0.8 6 · 0.2 4 = 0.0881… ;
P 7 = 120 · 0.8 7 · (1 – 0.8) 10 – 7 = 120 · 0.8 7 · 0.2 3 = 0.2013… ;
P 8 = 45 · 0.8 8 · (1 – 0.8) 10 – 8 = 45 · 0.8 8 · 0.2 2 = 0.3020… (самая большая вероятность!);
P 9 = 10 · 0.8 9 · (1 – 0.8) 10 – 9 = 10 · 0.8 9 · 0.2 1 = 0.2684… ;
P 10 = 1 · 0.8 10 · (1 – 0.8) 10 – 10 = 1 · 0.8 10 · 0.2 0 = 0.1074…

Разумеется, P 0 + P 1 + P 2 + P 3 + P 4 + P 5 + P 6 + P 7 + P 8 + P 9 + P 10 = 1 .

Нормальное распределение

Если изобразить величины P 0 , P 1 , P 2 , P 3 , …, P 10 , которые мы подсчитали в примере 3, на графике, то окажется, что их распределение имеет вид, близкий к нормальному закону распределения (см. рис. 27.1 ) (см. лекцию 25. Моделирование нормально распределенных случайных величин).

Рис. 27.1. Вид биномиального распределения
вероятностей для различных m при p = 0.8, n = 10

Биномиальный закон переходит в нормальный, если вероятности появления и непоявления события A примерно одинаковы, то есть, условно можно записать: p ≈ (1 – p ) . Для примера возьмем n = 10 и p = 0.5 (то есть p = 1 – p = 0.5 ).

Содержательно к такой задаче мы придем, если, например, захотим теоретически посчитать, сколько будет мальчиков и сколько девочек из 10 родившихся в роддоме в один день детей. Точнее, считать будем не мальчиков и девочек, а вероятность, что родятся только мальчики, что родится 1 мальчик и 9 девочек, что родится 2 мальчика и 8 девочек и так далее. Примем для простоты, что вероятность рождения мальчика и девочки одинакова и равна 0.5 (но на самом деле, если честно, это не так, см. курс «Моделирование систем искусственного интеллекта»).

Ясно, что распределение будет симметричное, так как вероятность рождения 3 мальчиков и 7 девочек равна вероятности рождения 7 мальчиков и 3 девочек. Наибольшая вероятность рождения будет у 5 мальчиков и 5 девочек. Эта вероятность равна 0.25, кстати, не такая уж она и большая по абсолютной величине. Далее, вероятность того, что родится сразу 10 или 9 мальчиков намного меньше, чем вероятность того, что родится 5 ± 1 мальчик из 10 детей. Как раз биномиальное распределение нам поможет сделать этот расчет. Итак.

C 10 0 = 1 , C 10 1 = 10 , C 10 2 = 45 , C 10 3 = 120 , C 10 4 = 210 , C 10 5 = 252 ,
C 10 6 = 210 , C 10 7 = 120 , C 10 8 = 45 , C 10 9 = 10 , C 10 10 = 1 ;

P 0 = 1 · 0.5 0 · (1 – 0.5) 10 – 0 = 1 · 1 · 0.5 10 = 0.000977… ;
P 1 = 10 · 0.5 1 · (1 – 0.5) 10 – 1 = 10 · 0.5 10 = 0.009766… ;
P 2 = 45 · 0.5 2 · (1 – 0.5) 10 – 2 = 45 · 0.5 10 = 0.043945… ;
P 3 = 120 · 0.5 3 · (1 – 0.5) 10 – 3 = 120 · 0.5 10 = 0.117188… ;
P 4 = 210 · 0.5 4 · (1 – 0.5) 10 – 4 = 210 · 0.5 10 = 0.205078… ;
P 5 = 252 · 0.5 5 · (1 – 0.5) 10 – 5 = 252 · 0.5 10 = 0.246094… ;
P 6 = 210 · 0.5 6 · (1 – 0.5) 10 – 6 = 210 · 0.5 10 = 0.205078… ;
P 7 = 120 · 0.5 7 · (1 – 0.5) 10 – 7 = 120 · 0.5 10 = 0.117188… ;
P 8 = 45 · 0.5 8 · (1 – 0.5) 10 – 8 = 45 · 0.5 10 = 0.043945… ;
P 9 = 10 · 0.5 9 · (1 – 0.5) 10 – 9 = 10 · 0.5 10 = 0.009766… ;
P 10 = 1 · 0.5 10 · (1 – 0.5) 10 – 10 = 1 · 0.5 10 = 0.000977…

Разумеется, P 0 + P 1 + P 2 + P 3 + P 4 + P 5 + P 6 + P 7 + P 8 + P 9 + P 10 = 1 .

Отразим на графике величины P 0 , P 1 , P 2 , P 3 , …, P 10 (см. рис. 27.2 ).

Рис. 27.2. График биномиального распределения при параметрах
p = 0.5 и n = 10, приближающих его к нормальному закону

Итак, при условиях m n /2 и p ≈ 1 – p или p ≈ 0.5 вместо биномиального распределения можно использовать нормальное. При больших значениях n график сдвигается вправо и становится все более пологим, так как математическое ожидание и дисперсия возрастают с увеличением n : M = n · p , D = n · p · (1 – p ) .

Кстати, биномиальный закон стремится к нормальному и при увеличении n , что вполне естественно, согласно центральной предельной теореме (см. лекцию 34. Фиксация и обработка статистических результатов).

Теперь рассмотрим, как изменится биномиальный закон в случае, когда p q , то есть p –> 0 . В этом случае применить гипотезу о нормальности распределения нельзя, и биномиальное распределение переходит в распределение Пуассона.

Распределение Пуассона

Распределение Пуассона — это частный случай биномиального распределения (при n >> 0 и при p –> 0 (редкие события)).

Из математики известна формула, позволяющая примерно подсчитать значение любого члена биномиального распределения:

где a = n · p — параметр Пуассона (математическое ожидание), а дисперсия равна математическому ожиданию. Приведем математические выкладки, поясняющие этот переход. Биномиальный закон распределения

P m = C n m · p m · (1 – p ) n – m

может быть написан, если положить p = a /n , в виде

Так как p очень мало, то следует принимать во внимание только числа m , малые по сравнению с n . Произведение

весьма близко к единице. Это же относится к величине

Величина

очень близка к e –a . Отсюда получаем формулу:

Пример . В ящике находится n = 100 деталей, как качественных, так и бракованных. Вероятность достать бракованное изделие составляет p = 0.01 . Допустим, что мы вынимаем изделие, определяем, бракованное оно или нет, и кладем его обратно. Поступая таким образом, получилось, что из 100 изделий, которые мы перебрали, два оказались бракованными. Какова вероятность этого?

По биномиальному распределению получаем:

По распределению Пуассона получаем:

Как видно, величины получились близкими, поэтому в случае редких событий вполне допустимо применять закон Пуассона, тем более что он требует меньших вычислительных затрат.

Покажем графически вид закона Пуассона. Возьмем для примера параметры p = 0.05 , n = 10 . Тогда:

C 10 0 = 1 , C 10 1 = 10 , C 10 2 = 45 , C 10 3 = 120 , C 10 4 = 210 , C 10 5 = 252 ,
C 10 6 = 210 , C 10 7 = 120 , C 10 8 = 45 , C 10 9 = 10 , C 10 10 = 1 ;

P 0 = 1 · 0.05 0 · (1 – 0.05) 10 – 0 = 1 · 1 · 0.95 10 = 0.5987… ;
P 1 = 10 · 0.05 1 · (1 – 0.05) 10 – 1 = 10 · 0.05 1 · 0.95 9 = 0.3151… ;
P 2 = 45 · 0.05 2 · (1 – 0.05) 10 – 2 = 45 · 0.05 2 · 0.95 8 = 0.0746… ;
P 3 = 120 · 0.05 3 · (1 – 0.05) 10 – 3 = 120 · 0.05 3 · 0.95 7 = 0.0105… ;
P 4 = 210 · 0.05 4 · (1 – 0.05) 10 – 4 = 210 · 0.05 4 · 0.95 6 = 0.00096… ;
P 5 = 252 · 0.05 5 · (1 – 0.05) 10 – 5 = 252 · 0.05 5 · 0.95 5 = 0.00006… ;
P 6 = 210 · 0.05 6 · (1 – 0.05) 10 – 6 = 210 · 0.05 6 · 0.95 4 = 0.0000… ;
P 7 = 120 · 0.05 7 · (1 – 0.05) 10 – 7 = 120 · 0.05 7 · 0.95 3 = 0.0000… ;
P 8 = 45 · 0.05 8 · (1 – 0.05) 10 – 8 = 45 · 0.05 8 · 0.95 2 = 0.0000… ;
P 9 = 10 · 0.05 9 · (1 – 0.05) 10 – 9 = 10 · 0.05 9 · 0.95 1 = 0.0000… ;
P 10 = 1 · 0.05 10 · (1 – 0.05) 10 – 10 = 1 · 0.05 10 · 0.95 0 = 0.0000…

Разумеется, P 0 + P 1 + P 2 + P 3 + P 4 + P 5 + P 6 + P 7 + P 8 + P 9 + P 10 = 1 .

Рис. 27.3. График распределения Пуассона при p = 0.05 и n = 10

При n –> ∞ распределение Пуассона переходит в нормальный закон, согласно центральной предельной теореме (см.

Введение

Подчиняются ли каким-либо законам явления, носящие случайный характер? Да, но эти законы отличаются от привычных нам физических законов. Значения СВ невозможно предугадать даже при известных условиях эксперимента, мы можем лишь указать вероятности того, что СВ примет то или иное значение. Зато зная распределение вероятностей СВ, мы можем делать выводы о событиях, в которых участвуют эти случайные величины. Правда, эти выводы будут также носить вероятностный характер.

Пусть некоторая СВ является дискретной, т.е. может принимать лишь фиксированные значения Xi. В этом случае ряд значений вероятностей P(Xi) для всех (i=1…n) допустимых значений этой величины называют её законом распределения.

Закон распределения СВ - это отношение, устанавливающее связь между возможными значениями СВ и вероятностями, с которыми принимаются эти значения. Закон распределения полностью характеризует СВ.

При построении математической модели для проверки статистической гипотезы необходимо ввести математическое предположение о законе распределения СВ (параметрический путь построения модели).

Непараметрический подход к описанию математической модели (СВ не имеет параметрического закона распределения) менее точен, но имеет более широкую область применения.

Точно также, как и для вероятности случайного события, для закона распределения СВ есть только два пути его отыскания. Либо мы строим схему случайного события и находим аналитическое выражение (формулу) вычисления вероятности (возможно, кто–то уже сделал или сделает это за нас!), либо придется использовать эксперимент и по частотам наблюдений делать какие–то предположения (выдвигать гипотезы) о законе распределения.

Конечно же, для каждого из "классических" распределений уже давно эта работа проделана – широко известными и очень часто используемыми в прикладной статистике являются биномиальное и полиномиальное распределения, геометрическое и гипергеометрическое, распределение Паскаля и Пуассона и многие другие.

Для почти всех классических распределений немедленно строились и публиковались специальные статистические таблицы, уточняемые по мере увеличения точности расчетов. Без использования многих томов этих таблиц, без обучения правилам пользования ими последние два столетия практическое использование статистики было невозможно.

Сегодня положение изменилось – нет нужды хранить данные расчетов по формулам (как бы последние не были сложны!), время на использование закона распределения для практики сведено к минутам, а то и секундам. Уже сейчас существует достаточное количество разнообразных пакетов прикладных компьютерных программ для этих целей.

Среди всех вероятностных распределений есть такие, которые используются на практике особенно часто. Эти распределения детально изучены и свойства их хорошо известны. Многие из этих распределений лежат в основе целых областей знаний – таких, как теория массового обслуживания, теория надежности, контроль качества, теория игр и т.п

Среди них нельзя не обратить внимание на труды Пуассона (1781-1840), доказавшего более общую, чем у Якова Бернулли, форму закона больших чисел, а также впервые применившего теорию вероятностей к задачам стрельбы. С именем Пуассона связан один из законов распределения, играющий большую роль в теории вероятностей и ее приложениях.

Именно этому закону распределения и посвящена данная курсовая работа. Речь пойдет непосредственно о законе, о его математических характеристиках, особых свойствах, связи с биномиальным распределением. Несколько слов будет сказано по поводу практического применения и приведено несколько примеров из практики.

Цель нашего реферата – выяснить сущность теорем распределения Бернулли и Пуассона.

Задача – изучить и проанализировать литературу по теме реферата.

1. Биномиальное распределение (распределение Бернулли)

Биномиальное распределение (распределение Бернулли) - распределение вероятностей числа появлений некоторого события при повторных независимых испытаниях, если вероятность появления этого события в каждом испытании равна p (0

Говорят, что СВ Х распределена по закону Бернулли с параметром p, если она принимает значения 0 и 1 с вероятностями pX(x)ºP{X=x} = pxq1-x; p+q=1; x=0,1.

Биноминальное распределение возникает в тех случаях, когда ставится вопрос: сколько раз происходит некоторое событие в серии из определенного числа независимых наблюдений (опытов), выполняемых в одинаковых условиях.

Для удобства и наглядности будем полагать, что нам известна величина p – вероятность того, что вошедший в магазин посетитель окажется покупателем и (1– p) = q – вероятность того, что вошедший в магазин посетитель не окажется покупателем.

Если X – число покупателей из общего числа n посетителей, то вероятность того, что среди n посетителей оказалось k покупателей равна

P(X= k) = , где k=0,1,…n 1)

Формулу (1) называют формулой Бернулли. При большом числе испытаний биномиальное распределение стремиться к нормальному.

Испытание Бернулли – это вероятностный эксперимент с двумя исходами, которые, как правило, называют «успехом» (его принято обозначать символом 1) и «неудачей» (соответственно, обозначается 0). Вероятность успеха принято обозначать буквой p, неудачи – буквой q; конечно, q=1-p. Величину p называют параметром испытания Бернулли.

Биномиальная, геометрическая, паскалева и отрицательная биномиальная случайные величины получаются из последовательности независимых испытаний Бернулли, если эту последовательность оборвать тем или иным способом, например, после n-го испытания или x-го успеха. Принято использовать следующую терминологию:

– параметр испытания Бернулли (вероятность успеха в отдельном испытании);

– число испытаний;

– число успехов;

– число неудач.

Биномиальная случайная величина (m|n,p) – число m успехов в n испытаниях.

Геометрическая случайная величина G(m|p)– число m испытаний до первого успеха (включая первый успех).

Паскалева случайная величина C(m|x,p)– число m испытаний до x-го успеха (не включая, конечно, сам x-й успех).

Отрицательная биномиальная случайная величина Y(m|x,p) – число m неудач до x-го успеха (не включая x-й успех).

Замечание: иногда отрицательное биномиальное распределение называют паскалевым и наоборот.


Распределение Пуассона

2.1. Определение закона Пуассона

Во многих задачах практики приходится иметь дело со случайными величинами, распределенными по своеобразному закону, который носит название закона Пуассона.

Рассмотрим прерывную случайную величину Х, которая может принимать только целые, неотрицательные значения: 0, 1, 2, … , m, … ; причем последовательность этих значений теоретически не ограничена. Говорят, что случайная величина Х распределена по закону Пуассона, если вероятность того, что она примет определенное значение m, выражается формулой:

где а - некоторая положительная величина, называемая параметром закона Пуассона.

Ряд распределения случайной величины Х, распределенной по закону Пуассона, выглядит следующим образом:

хm m
Pm e-a

2.2.Основные характеристики распределения Пуассона

Для начала убедимся, что последовательность вероятностей, может представлять собой ряд распределения, т.е. что сумма всех вероятностей Рm равна единице.

Используем разложение функции ех в ряд Маклорена:

Известно, что этот ряд сходится при любом значении х, поэтому, взяв х=а, получим

следовательно

Определим основные характеристики - математическое ожидание и дисперсию - случайной величины Х, распределенной по закону Пуассона. Математическим ожиданием дискретной случайной величины называют сумму произведений всех ее возможных значений на их вероятности. По определению, когда дискретная случайная величина принимает счетное множество значений:

Первый член суммы (соответствующий m=0) равен нулю, следовательно, суммирование можно начинать с m=1:

Таким образом, параметр а представляет собой не что иное, как математическое ожидание случайной величины Х.

Дисперсией случайной величины Х называют математической ожидание квадрата отклонения случайной величины от ее математического ожидания:

Однако, удобнее ее вычислять по формуле:

Поэтому найдем сначала второй начальный момент величины Х:

По ранее доказанному

кроме того,

2.3.Дополнительные характеристики распределения Пуассона

I. Начальным моментом порядка k случайной величины Х называют математическое ожидание величины Хk:

В частности, начальный момент первого порядка равен математическому ожиданию:

II. Центральным моментом порядка k случайной величины Х называют математическое ожидание величины k:

В частности, центральный момент 1-ого порядка равен 0:

μ1=М=0,

центральный момент 2-ого порядка равен дисперсии:

μ2=M2=a.

III. Для случайной величины Х, распределенной по закону Пуассона, найдем вероятность того, что она примет значение не меньшее заданного k. Эту вероятность обозначим Rk:

Очевидно, вероятность Rk может быть вычислена как сумма

Однако, значительно проще определить ее из вероятности противоположного события:

В частности, вероятность того, что величина Х примет положительное значение, выражается формулой

Как уже говорилось, многие задачи практики приводят к распределению Пуассона. Рассмотрим одну из типичных задач такого рода.

Рис.2

Пусть на оси абсцисс Ох случайным образом распределяются точки (рис.2). Допустим, что случайное распределение точек удовлетворяет следующим условиям:

1) Вероятность попадания того или иного числа точек на отрезок l зависит только от длины этого отрезка, но не зависит от его положения на оси абсцисс. Иными словами, точки распределены на оси абсцисс с одинаковой средней плотностью. Обозначим эту плотность, т.е. математическое ожидание числа точек, приходящихся на единицу длины, через λ.

2) Точки распределяются на оси абсцисс независимо друг от друга, т.е. вероятность попадания того или иного числа точек на заданный отрезок не зависит от того, сколько их попало на любой другой отрезок, не перекрывающийся с ним.

3) Вероятность попадания на малый участок Δх двух или более точек пренебрежимо мала по сравнению с вероятностью попадания одной точки (это условие означает практическую невозможность совпадения двух или более точек).

Выделим на оси абсцисс определенный отрезок длины l и рассмотрим дискретную случайную величину Х - число точек, попадающих на этот отрезок. Возможные значения величины будут 0,1,2,…,m,… Так как точки попадают на отрезок независимо друг от друга, то теоретически не исключено, что их там окажется сколь угодно много, т.е. данный ряд продолжается неограниченно.

Докажем, что случайная величина Х распределена по закону Пуассона. Для этого надо подсчитать вероятность Рm того, что на отрезок попадет ровно m точек.

Сначала решим более простую задачу. Рассмотрим на оси Ох малый участок Δх и вычислим вероятность того, что на этот участок попадет хотя бы одна точка. Будем рассуждать следующим образом. Математическое ожидание числа точек, попадающих на этот участок, очевидно, равно λ·Δх (т.к. на единицу длины попадает в среднем λ точек). Согласно условию 3 для малого отрезка Δх можно пренебречь возможностью попадания на него двух или больше точек. Поэтому математическое ожидание λ·Δх числа точек, попадающих на участок Δх, будет приближенно равно вероятности попадания на него одной точки (или, что в данных условиях равнозначно, хотя бы одной).

Таким образом, с точностью до бесконечно малых высшего порядка, при Δх→0 можно считать вероятность того, что на участок Δх попадет одна (хотя бы одна) точка, равной λ·Δх, а вероятность того, что не попадет ни одной, равной 1-c·Δх.

Воспользуемся этим для вычисления вероятности Pm попадания на отрезок l ровно m точек. Разделим отрезок l на n равных частей длиной Условимся называть элементарный отрезок Δх "пустым", если в него не попало ни одной точки, и "занятым", если в него попала хотя бы одна. Согласно вышедоказанному вероятность того, что отрезок Δх окажется "занятым", приближенно равна λ·Δх= ; вероятность того, что он окажется "пустым", равна 1- . Так как, согласно условию 2, попадания точек в неперекрывающиеся отрезки независимы, то наши n отрезков можно рассмотреть как n независимых "опытов", в каждом из которых отрезок может быть "занят" с вероятностью p= . Найдем вероятность того, что среди n отрезков будет ровно m "занятых". По теореме о повторных независимых испытаниях эта вероятность равна

,

или обозначим λl=a:

.

При достаточно большом n эта вероятность приближенно равна вероятности попадания на отрезок l ровно m точек, т.к. попадание двух или больше точек на отрезок Δх имеет пренебрежимо малую вероятность. Для того, чтобы найти точное значение Рm, нужно перейти к пределу при n→∞:

Учитывая, что

,

получаем, что искомая вероятность выражается формулой

где а=λl, т.е. величина Х распределена по закону Пуассона с параметром а=λl.

Надо отметить, что величина а по смыслу представляет собой среднее число точек, приходящееся на отрезок l. Величина R1 (вероятность того, что величина Х примет положительное значение) в данном случае выражает вероятность того, что на отрезок l попадет хотя бы одна точка: R1=1-e-a.

Таким образом, мы убедились, что распределение Пуассона возникает там, где какие-то точки (или другие элементы) занимают случайное положение независимо друг от друга, и подсчитывается количество этих точек, попавших в какую-то область. В нашем случае такой областью был отрезок l на оси абсцисс. Однако этот вывод легко можно распространить и на случай распределения точек на плоскости (случайное плоское поле точек) и в пространстве (случайное пространственное поле точек). Нетрудно доказать, что если соблюдены условия:

1) точки распределены в поле статистически равномерно со средней плотностью λ;

2) точки попадают в неперекрывающиеся области независимым образом;

3) точки появляются поодиночке, а не парами, тройками и т.д.,

то число точек Х, попавших в любую область D (плоскую или пространственную), распределяется по закону Пуассона:

,

где а - среднее число точек, попадающих в область D.

Для плоского случая а=SD λ, где SD - площадь области D,

для пространственного а= VD λ, где VD - объем области D.

Для пуассоновского распределения числа точек, попадающих в отрезок или область, условие постоянной плотности (λ=const) несущественно. Если выполнены два других условия, то закон Пуассона все равно имеет место, только параметр а в нем приобретает другое выражение: он получается не простым умножением плотности λ на длину, площадь или объем, а интегрированием переменной плотности по отрезку, площади или объему.

Распределение Пуассона играет важную роль в ряде вопросов физики, теории связи, теории надежности, теории массового обслуживания и т.д. Всюду, где в течение определенного времени может происходить случайное число каких-то событий (радиоактивных распадов, телефонных вызовов, отказов оборудования, несчастный случаях и т.п.).

Рассмотрим наиболее типичную ситуацию, в которой возникает распределение Пуассона. Пусть некоторые события (покупки в магазине) могут происходить в случайные моменты времени. Определим число появлений таких событий в промежутке времени от 0 до Т.

Случайное число событий, происшедших за время от 0 до Т, распределено по закону Пуассона с параметром l=аТ, где а>0 – параметр задачи, отражающий среднюю частоту событий. Вероятность k покупок в течение большого интервала времени, (например, – дня) составит


Заключение

В заключение хочется отметить то, что распределение Пуассона является достаточно распространенным и важным распределением, имеющим применение как в теории вероятностей и ее приложениях, так и в математической статистике.

Многие задачи практики сводятся в конечном счете к распределению Пуассона. Его особое свойство, заключающееся в равенстве математического ожидания и дисперсии, часто применяют на практике для решения вопроса, распределена случайная величина по закону Пуассона или нет.

Также важен тот факт, что закон Пуассона позволяет находить вероятности события в повторных независимых испытаниях при большом количестве повторов опыта и малой единичной вероятности.

Однако распределение Бернулли применяется в практике экономических расчетов и в частности при анализе устойчивости исключительно редко. Это связано как с вычислительными сложностями, так и с тем, что распределение Бернулли – для дискретных величин, и с тем, что условия классической схемы (независимость, счетное число испытаний, неизменность условий, влияющих на возможность наступления события) не всегда выполняются в практических ситуациях. Дальнейшие исследования в области анализа схемы Бернулли, проводимые в XVIII-XIX вв. Лапласом, Муавром, Пуассоном и другими были направлены на создание возможности использования схемы Бернулли в случае большого, стремящегося к бесконечности количества испытаний.


Литература

1. Вентцель Е.С. Теория вероятностей. - М, "Высшая школа" 1998

2. Гмурман В.Е. Руководство к решению задач по теории вероятностей и математической статистике. - М, "Высшая школа" 1998

3. Сборник задач по математике для втузов. Под ред. Ефимова А.В. - М, Наука 1990

Краткая теория

Пусть производится независимых испытаний, в каждом из которых вероятность появления события равна . Для определения вероятности появлений события в этих испытаниях используют формулу Бернулли . Если же велико, то пользуются или . Однако эта формула непригодна, если мала. В этих случаях ( велико, мало) прибегают к асимптотической формуле Пуассона .

Поставим перед собой задачу найти вероятность того, что при очень большом числе испытаний, в каждом из которых вероятность события очень мала, событие наступит ровно раз. Сделаем важное допущение: произведение сохраняет постоянное значение, а именно . Это означает, что среднее число появления события в различных сериях испытаний, т.е. при различных значениях , остается неизменным.

Пример решения задачи

Задача 1

На базе получено 10000 электроламп. Вероятность того, что в пути лампа разобьется, равна 0,0003. Найдите вероятность того, что среди полученных ламп будет пять ламп разбито.

Решение

Условие применимости формулы Пуассона:

Если вероятность появления события в отдельном испытании достаточно близка к нулю, то даже при больших значениях количества испытаний вероятность, вычисляемая по локальной теореме Лапласа, оказывается недостаточно точной. В таких случаях используют формулу, выведенную Пуассоном.

Пусть событие – 5 ламп будет разбито

Воспользуемся формулой Пуассона:

В нашем случае:

Ответ

Задача 2

На предприятии 1000 единиц оборудования определенного вида. Вероятность отказа единицы оборудования в течение часа составляет 0,001. Составить закон распределения числа отказов оборудования в течение часа. Найти числовые характеристики.

Решение

Случайная величина – число отказов оборудования, может принимать значения

Воспользуемся законом Пуассона:

Найдем эти вероятности:

.

Математическое ожидание и дисперсия случайной величины, распределенной по закону Пуассона равна параметру этого распределения:

Средняя стоимость решения контрольной работы 700 - 1200 рублей (но не менее 300 руб. за весь заказ). На цену сильно влияет срочность решения (от суток до нескольких часов). Стоимость онлайн-помощи на экзамене/зачете - от 1000 руб. за решение билета.

Заявку можно оставить прямо в чате, предварительно скинув условие задач и сообщив необходимые вам сроки решения. Время ответа - несколько минут.

Распределение Пуассона.

Рассмотрим наиболее типичную ситуацию, в которой возникает распределение Пуассона. Пусть событие А появляется некоторое число раз в фиксированном участке пространства (интервале, площади, объеме) или промежутке времени с постоянной интенсивностью. Для определенности рассмотрим последовательное появление событий во времени, называемое потоком событий. Графически поток событий можно иллюстрировать множеством точек, расположенных на оси времени.

Это может быть поток вызовов в сфере обслуживания (ремонт бытовой техники, вызов скорой помощи и др.), поток вызовов на АТС, отказ в работе некоторых частей системы, радиоактивный распад, куски ткани или металлические листы и число дефектов на каждом из них и др. Наиболее полезным распределение Пуассона оказывается в тех задачах, где требуется определить лишь число положительных исходов («успехов»).

Представим себе булку с изюмом, разделенную на маленькие кусочки равной величины. Вследствие случайного распределения изюминок нельзя ожидать, что все кусочки будут содержать их одинаковое число. Когда среднее число изюминок, содержащееся в этих кусочках, известно, тогда распределение Пуассона задает вероятность того, что любой взятый кусочек содержит X =k (k = 0,1,2,...,)число изюминок.

Иначе говоря, распределение Пуассона определяет, какая часть длинной серии кусочков будет содержать равное 0, или 1, или 2, или и т.д. число изюминок.

Сделаем следующие предположения.

1. Вероятность появления некоторого числа событий в данном промежутке времени зависит только от длины этого промежутка, а не от его положения на временной оси. Это свойство стационарности.

2. Появление более одного события в достаточно малом промежутке времени практически невозможно, т.е. условная вероятность появления в этом же интервале другого события стремится к нулю при ® 0. Это свойство ординарности.

3. Вероятность появления данного числа событий на фиксированном промежутке времени не зависит от числа событий, появляющихся в другие промежутки времени. Это свойство отсутствия последействия.

Поток событий, удовлетворяющий перечисленным предложениям, называется простейшим .

Рассмотрим достаточно малый промежуток времени . На основании свойства 2 событие может появиться на этом промежутке один раз или совсем не появиться. Обозначим вероятность появления события через р , а непоявления – через q = 1-p. Вероятность р постоянна (свойство 3) и зависит только от величины (свойство 1). Математическое ожидание числа появлений события в промежутке будет равно 0×q + 1×p = p . Тогда среднее число появления событий в единицу времени называется интенсивностью потока и обозначается через a, т.е. a = .

Рассмотрим конечный отрезок времени t и разделим его на n частей = . Появления событий в каждом из этих промежутков независимы (свойство 2). Определим вероятность того, что в отрезке времени t при постоянной интенсивности потока а событие появится ровно X = k раз и не появится n – k . Так как событие может в каждом из n промежутков появиться не более чем 1 раз, то для появления его k раз на отрезке длительностью t оно должно появиться в любых k промежутках из общего числа n. Всего таких комбинаций , а вероятность каждой равна . Следовательно, по теореме сложения вероятностей получим для искомой вероятности известную формулу Бернулли

Это равенство записано как приближенное, так как исходной посылкой при его выводе послужило свойство 2, выполняемое тем точнее, чем меньше . Для получения точного равенства перейдем к пределу при ® 0 или, что то же, n ® . Получим после замены

P = a = и q = 1 – .

Введем новый параметр = at , означающий среднее число появлений события в отрезке t . После несложных преобразований и переходу к пределу в сомножителях получим.

= 1, = ,

Окончательно получим

, k = 0, 1, 2, ...

е = 2,718... –основание натурального логарифма.

Определение . Случайная величина Х , которая принимает только целые, положительные значения 0, 1, 2, ... имеет закон распределения Пуассона с параметром , если

для k = 0, 1, 2, ...

Распределение Пуассона было предложено французским математиком С.Д. Пуассоном (1781-1840 гг). Оно используется для решения задач исчисления вероятностей относительно редких, случайных взаимно независимых событий в единицу времени, длины, площади и объема.

Для случая, когда а) – велико и б) k = , справедлива формула Стирлинга:

Для расчета последующих значений используется рекуррентная формула

P (k + 1) = P (k ).

Пример 1. Чему равна вероятность того, что из 1000 человек в данный день родились: а) ни одного, б) один, в) два, г) три человека?

Решение. Так как p = 1/365, то q = 1 – 1/365 = 364/365 » 1.

Тогда

а) ,

б) ,

в) ,

г) .

Следовательно, если имеются выборки из 1000 человек, то среднее число человек, которые родились в определенный день, соответственно будут равны 65; 178; 244; 223.

Пример 2. Определить значение , при котором с вероятностью Р событие появилось хотя бы один раз.

Решение. Событие А = {появиться хотя бы один раз} и = {не появиться ни одного раза}. Следовательно .

Отсюда и .

Например, для Р = 0,5 , для Р = 0,95 .

Пример 3. На ткацких станках, обслуживаемых одной ткачихой, в течение часа происходит 90 обрывов нити. Найти вероятность того, что за 4 минуты произойдет хотя бы один обрыв нити.

Решение. По условию t = 4 мин. и среднее число обрывов за одну минуту , откуда . Требуемая вероятность равна .

Свойства . Математическое ожидание и дисперсия случайной величины, имеющей распределение Пуассона с параметром , равны:

M (X ) = D (X ) = .

Эти выражения получаются прямыми вычислениями:

Здесь была осуществлена замена n = k – 1 и использован тот факт, что .

Выполнив преобразования, аналогичные использованным при выводе М (X ), получим

Распределение Пуассона используется для аппроксимации биноминального распределения при больших n