Биномиальное распределение вероятности

Краткая теория

Дискретная случайная величина имеет биномиальный закон распределения с параметрами и, если она принимает значения 0,2,3,…, m, . n с вероятностью:

где — количество комбинаций элементов по (см формулы комбинаторики)

Как видите, вероятности находятся по формуле Бернулли. Следовательно, биномиальный закон распределения — это закон распределения числа появлений события в независимых процессах, в каждом из которых оно может произойти с одинаковой вероятностью .

Ряд распределения биномиального закона имеет вид:

0 1 2

Математическое ожидание случайной величины, распределенной по биномиальному закону:

Дисперсия случайной величины, распределенной по биномиальному закону:

По биномиальному распределению, асимметрии и эксцессу:

 

Обратная функция БИНОМ.ОБР()

Напомним график функции биномиального распределения :

Решим проблему. Предположим, что для контроля качества необходимо определить максимально допустимое количество бракованных изделий, что все же позволяет отказаться от брака всей партии.

Устанавливается размер выборки из партии (n = 20) и p = 0,2 — доля бракованной продукции, которая обычно наблюдается в данном производственном процессе. Также установим вероятность совершения ошибки 1-го типа (см. Статью об уровне доверия) равной 90%. Критерий приемлемости порога можно рассчитать по формуле = БИНОМОБР (20; 0,2; 90%). Формула вернет 6 — максимальное количество дефектных элементов, разрешенное в выборке .

Примечание. Третий аргумент функции BINOMOBR () называется Alpha (ошибка α, ошибка типа I, риск производителя, риск альфа) и представляет вероятность совершения ошибки типа 1 при проверке статистической гипотезы (см. Статью Проверка статистических гипотез в MS EXCEL на равенство средних значений распределения (дисперсия известна)).

Допустим, в выборке 7 дефектных изделий. Это означает, что «очень вероятно», что процент брака p изменился, что характерно для нашего производственного процесса. Хотя эта ситуация «очень вероятна», существует вероятность (альфа-риск, ошибка типа 1, «ложная тревога»), что p не изменилось и что увеличение количества дефектных элементов вызвано случайной выборкой.

Как вы можете видеть на рисунке ниже, 7 — это количество дефектных продуктов, которое приемлемо для процесса с p = 0,21 при том же значении Alpha. Это показывает, что, когда порог дефекта образца превышен, р «наиболее вероятно» увеличивается. Фраза «очень вероятно» означает, что существует только 10% (100% -90%) вероятность того, что отклонение процента бракованных продуктов выше порогового значения вызвано только случайными причинами.

Следовательно, превышение порогового количества дефектных продуктов в образце может служить сигналом того, что процесс был изменен и начал производить более высокий процент дефектных продуктов.

Примечание. До MS EXCEL 2010 в EXCEL была функция CRITBIN (), которая эквивалентна BINOM.INV (). CRITBINOM () оставлен в MS EXCEL 2010 и новее для совместимости.

2.Геометрическое распределение.

Геометрическое распределение случайной величины выглядит следующим образом:

Геометрическое распределение

где это находится

  • Pm — вероятность того, что событие A произойдет в тесте номер m.
  • p — вероятность того, что событие A произойдет в испытании.
  • д = 1 — р

Пример. Компания по ремонту бытовой техники получила партию из 10 сменных блоков стиральных машин. Бывают случаи, когда у одной детали есть 1 плохой блок. Проверка выполняется до тех пор, пока не будет найден сбойный блок. Для количества контролируемых блоков необходимо разработать закон распределения. Вероятность того, что блок может быть неисправным, составляет 0,1. Постройте многоугольник распределения вероятностей.

Пример геометрического распределения
График геометрического распределения
Рис. 2

Из таблицы видно, что с увеличением числа m вероятность обнаружения плохого блока уменьшается. Последняя строка (m = 10) объединяет две вероятности: 1 — что десятый блок оказался неисправным — 0,038742049, 2 — что все проверенные блоки оказались работоспособными — 0,34867844. Поскольку вероятность того, что блок окажется дефектным, относительно мала (p = 0,1), вероятность последнего события Pm (проверено 10 блоков) на рисунке 2 относительно высока.

Нормальный закон распределения (закон Гаусса).

Среди законов распределения непрерывных случайных величин наиболее распространенным является закон нормального распределения. Случайная величина распределяется по закону нормального распределения, если ее плотность вероятности имеет вид:

Плотность вероятности закона нормального распределения

где это находится

  • а — математическое ожидание случайной величины
  • — среднеквадратичное отклонение

График плотности вероятности случайной величины, имеющей нормальный закон распределения, симметричен относительно линии x = a, т.е x равен математическому ожиданию. Итак, если x = a, то кривая имеет максимум, равный:

Плотность вероятности закона нормального распределения

При изменении значения математического ожидания кривая будет двигаться вдоль оси быка. График (рис. 6) показывает, что при x = 3 кривая имеет максимум, поскольку математическое ожидание равно 3. Если математическое ожидание принимает другое значение, например a = 6, тогда кривая будет иметь максимум по x. = 6. Говоря о стандартном отклонении, как видно из графика, чем выше стандартное отклонение, тем меньше максимальное значение плотности вероятности случайной величины.

График плотности вероятности закона нормального распределения
Рисунок 6

Функция, которая выражает распределение случайной величины на интервале (-∞, x) и имеет нормальное распределение, выражается через функцию Лапласа по следующей формуле:

Функция нормального распределения

График функции закона нормального распределения
Рис. 7

Те вероятность случайной величины X состоит из двух частей: вероятности, в которой x принимает значения от минус бесконечности до a, равного 0,5, и второй части — от a до x. (рис.7)

Распределение Стьюдента (t — распределение)

Распределение непрерывной случайной величины называется распределением Стьюдента, если оно имеет вид:

Функция распределения Стьюдента (t-распределение)

где это находится

  • Z — случайная величина, распределенная по нормальному закону.
  • χ ² — случайная величина с χ ² — распределение с k степенями свободы.

Плотность вероятности распределения Стьюдента имеет вид:

Плотность вероятности t-распределения Стьюдента

График плотности вероятности распределения Стьюдента (t-распределение)
Рис. 12

На рисунке 12 показана плотность вероятности распределения Стьюдента. Из графика видно, что чем больше k, тем ближе кривая к нормальному распределению.

Гипергеометрическое распределение.

Гипергеометрическое распределение случайной величины имеет следующий вид:

Гипергеометрическое распределение

где это находится

Гипергеометрическое распределение

Например, составьте закон распределения 7 угаданных чисел из 49. В этом примере было удалено общее количество чисел N = 49, n = 7 чисел, M — все числа, обладающие данным свойством, то есть угаданные правильно числа, m — количество правильно угаданных чисел среди подобранных.

Пример гипергеометрического распределения
График гипергеометрического распределения
Рис. 3

Из таблицы видно, что вероятность угадать число m = 1 больше, чем при m = 0. Однако вероятность начинает быстро уменьшаться. Следовательно, вероятность угадать 4 числа уже меньше 0,005, а 5 пренебрежимо мала.

Генерация случайных чисел. Распределение Бернулли

Используя надстройку пакета анализа, вы можете генерировать случайные числа, извлеченные из распределения Бернулли .

Мы генерируем 3 массива по 100 чисел с разной вероятностью успеха: 0,1; 0,5 и 0,9. Для этого в окне «Генерация случайных чисел» установите следующие параметры для каждой вероятности p:

Примечание. Если вы выберете опцию «Случайное начальное число», вы сможете выбрать определенный случайный набор сгенерированных чисел. Например, установив этот параметр = 25, можно сгенерировать одинаковые наборы случайных чисел на разных компьютерах (если, конечно, другие параметры распределения совпадают). Значение параметра может принимать целые числа от 1 до 32 767. Название опции Случайное рассеяние может сбивать с толку. Лучше было бы перевести его как Set number со случайными числами .

В результате у нас будет 3 столбца по 100 чисел, на основе которых можно, например, оценить вероятность успеха p по формуле: Количество успехов / 100 (см. Файл примера, лист GenerationBernoulli).

Примечание. Для распределения Бернулли с p = 0,5 можно использовать формулу = СЛУЧМЕЖДУ (0; 1), что соответствует дискретному равномерному распределению .

Примеры решения задач

Пример 1

Для данной случайной величины X постройте серию распределений; найти функцию распределения F (x) и построить ее график; вычислить характеристики: математическое ожидание, дисперсию и стандартное отклонение.

Во время экзамена студенту задают три вопроса. Вероятность ответить каждому правильно — 0,6. Случайная величина X — это количество вопросов, на которые были даны ответы.

Решение

Случайная величина — это количество вопросов, на которые даны ответы, она может принимать значения 0,1,2,3 и распределяется по биномиальному закону.

Соответствующие вероятности находим с помощью формулы Бернулли:

Медицинский осмотр:

Закон распределения случайной величины :

0 1 2 3
0,064 0,288 0,432 0,216

Запишем функцию распределения

График функции распределения

Поскольку случайная величина распределяется по биномиальному закону, мы используем соответствующие формулы для расчета характеристик.

Ожидаемое значение:

Рассчитываем дисперсию по формуле:

Среднеквадратичное отклонение:

Пример 2

Монета подбрасывается 3 раза. Найдите дисперсию и стандартное отклонение случайной величины X — герба.

Решение

Поскольку случайная величина распределяется по биномиальному закону, мы используем соответствующие формулы для расчета характеристик.

Ожидаемое значение:

Рассчитываем дисперсию по формуле:

Среднеквадратичное отклонение:

Отвечать: .

Пример 3

Случайная величина X имеет биномиальное распределение. Найдите вероятность P (3≤X≤5), если математическое ожидание M (X) = 4, а дисперсия D (X) = 1.

Решение

Для биномиального распределения:

Отвечать: .

Пример 4

Случайные величины X1… X243 независимы и распределены по биномиальному закону с параметрами n = 4 и p = 1/9. Найдите математическое ожидание E ((X1 + ⋯ + X243) 2)

Решение

Математическое ожидание случайной величины:

Дисперсия случайной величины:

У нас есть:

Отвечать:

Логарифмически-нормальное распределение.

Если логарифм непрерывной случайной величины изменяется по нормальному закону, то случайная величина имеет логнормальное распределение. Функция логнормального распределения имеет вид.

Функция логнормального распределения
График плотности вероятности логнормального закона распределения
Рис. 10

Из графика видно, что чем он меньше и чем выше математическое ожидание a, тем более пологая кривая и тем больше она стремится к симметрии. Этот закон чаще всего используется для описания распределения денежных потоков (доходов), банковских вкладов, амортизации основных средств и так далее (рис.10)

9 распределение х

Сумма квадратов k независимых случайных величин, распределенных по нормальному закону, называется распределением χ.

распределение χ² имеет вид:

Распределение хи-квадрат

где это находится

Аi — i-я случайная величина, распределенная по нормальному закону (i = 1,2,3, . k).

Плотность вероятности случайной величины, распределенной на распределении χ ², имеет вид:

Плотность вероятности хи-квадрат

График плотности вероятности распределения хи-квадрат
Рис. 11

График показывает, что чем больше n = k, тем больше кривая стремится к нормальному распределению (рис. 11.

Биномиальное распределение случайной величины

Давайте посмотрим на ситуацию с другой стороны. В самом деле, кого волнует, что средний хедз-ап на ролл равен 0,5? Это даже представить невозможно. Интереснее задать вопрос о количестве голов, выпадающих при заданном количестве бросков.

Другими словами, исследователя часто интересует вероятность наступления ряда успешных событий. Это может быть количество дефектных продуктов в тестируемой партии (1 — дефектный, 0 — хороший) или количество восстановленных (1 — здоровый, 0 — больной) и т.д. Количество таких «успехов» будет равно сумме всех значений переменной X, т.е количеству единичных результатов.

Случайная величина B называется биномиальной и принимает значения от 0 до n (при B = 0 все части исправны, при B = n все части неисправны). Предполагается, что все значения x независимы. Мы рассматриваем основные характеристики биномиальной переменной, то есть устанавливаем ее математическое ожидание, дисперсию и распределение.

Математическое ожидание биномиальной переменной получить очень легко. Математическое ожидание суммы количеств — это сумма математических ожиданий каждого добавленного количества, и оно одинаково для всех, поэтому:

Например, математическое ожидание количества голов, выпавших после 100 бросков, равно 100 x 0,5 = 50.

Теперь мы выведем формулу для дисперсии биномиальной переменной. Дисперсия суммы независимых случайных величин — это сумма дисперсий. Отсюда

Стандартное отклонение, соответственно

Для 100 подбрасываний монет стандартное отклонение количества орлов составляет

Наконец, рассмотрим распределение биномиальной величины, то есть вероятности того, что случайная величина B принимает разные значения k, где 0≤ k ≤n. Для монеты эта проблема может звучать так: какова вероятность выпадения 40 орлов при 100 бросках?

Чтобы понять метод расчета, представьте, что вы подбрасываете монету 4 раза. Любая сторона может упасть в любой момент. Мы спрашиваем себя: какова вероятность выпадения 2 решек из 4 бросков. Каждый бросок не зависит друг от друга. Это означает, что вероятность выпадения любой комбинации будет равна произведению шансов на результат для любого отдельного броска. Пусть О головы, П — крест. Так, например, одна из подходящих нам комбинаций может выглядеть как OORP, а именно:

Вероятность такой комбинации равна произведению двух вероятностей выпадения орлов и двух других вероятностей невыполнения (обратное событие рассчитывается как 1 — p), например 0,5 × 0,5 × (1-0,5) × (1-0,5) = 0,0625. Это вероятность одной из удовлетворяющих нас комбинаций.

Но речь шла об общем количестве орлов, а не о конкретном отряде. Затем вам нужно сложить вероятности всех комбинаций, в которых выпадает ровно 2 решки. Ясно, что все они одинаковы (произведение не меняется при изменении множителей). Поэтому необходимо посчитать их количество, а затем умножить на вероятность такой комбинации. Считаем все варианты комбинаций из 4 бросков по 2 решки в каждом: RROO, RORO, ROOP, ORRO, OPOR, OORR. Всего существует 6 вариантов.

Следовательно, желаемая вероятность выпадения 2 решек после 4-х подбрасываний равна 6 × 0,0625 = 0,375.

Однако считать таким способом скучно. Уже за 10 монет получить общее количество опций методом перебора будет очень сложно. Поэтому умные люди давно придумали формулу, по которой вычисляют количество различных комбинаций из n элементов для k, где n — общее количество элементов, k — количество элементов, расположение которых вычисляется. Формула для комбинации n элементов для k выглядит следующим образом:

Аналогичные вещи происходят и в комбинаторном разделе. Отправляю туда всех желающих пополнить свои знания. Так, кстати, название биномиального распределения (приведенная выше формула — коэффициент в разложении бинома Ньютона).

Формулу для определения вероятности легко обобщить на любое число n и k. Следовательно, формула биномиального распределения имеет следующий вид.

Количество комбинаций, удовлетворяющих условию, необходимо умножить на вероятность одной из них.

Для практического использования достаточно знать формулу биномиального распределения. Или вы можете даже не знать — ниже описано, как определить вероятность с помощью Excel. Но лучше знать.

Мы используем эту формулу для расчета вероятности выпадения 40 орлов на 100 флипов:

Или всего 1,08%. Для сравнения: вероятность того, что математическое ожидание этого эксперимента, то есть 50 голов, будет 7,96%. Максимальная вероятность биномиального значения принадлежит значению, соответствующему математическому ожиданию.

Закон распределения Пуассона

Случайная величина X имеет распределение Пуассона, если ее закон распределения имеет вид:

Закон распределения Пуассона

где это находится

  • λ = np = стоимость
  • n — количество попыток, стремящихся к бесконечности
  • p — вероятность наступления события, стремящаяся к нулю
  • m — количество появлений события A

Например, в среднем на телекомпанию поступает около 100 звонков в день. Вероятность заказа телевизора марки А 0,08; В — 0,06 и С — 0,04. Разработать закон распределения заказов на покупку телевизоров марок A, B и C. Построить многоугольник распределения вероятностей.

Из условия имеем: m = 100, λ1 = 8, λ2 = 6, λ3 = 4 (≤10)

Пример распределения Пуассона

(таблица не полная)

Диаграмма распределения Пуассона
Рис. 4

Если n достаточно велико и стремится к бесконечности, а значение p стремится к нулю, так что произведение np приближается к постоянному числу, то этот закон является приближением к закону биномиального распределения. Из графика видно, что чем выше вероятность p, тем ближе кривая к оси m, т.е более пологая. (рисунок 4)

Следует отметить, что биномиальное, геометрическое, гипергеометрическое распределение и распределение Пуассона выражают распределение вероятностей дискретной случайной величины.

Равномерный закон распределения

Если плотность вероятности (x) является постоянной величиной на определенном интервале a, b, то закон распределения называется равномерным. На рис. 5 показаны графики функции распределения вероятностей и плотности вероятности равномерного закона распределения.

Единый закон распределения

График закона равномерного распределения
Рис. 5

Связь Биномиального распределения с другими распределениями

Если параметр n биномиального распределения стремится к бесконечности, а p стремится к 0, то в этом случае биномиальное распределение можно аппроксимировать распределением Пуассона. Мы можем сформулировать условия, при которых приближение Пуассона работает хорошо:

  • p <0,1 (чем меньше p и больше n, тем точнее приближение);
  • p> 0,9 (с учетом того, что q = 1- p, вычисления в этом случае должны выполняться через q (а x необходимо заменить на n — x). Следовательно, чем меньше q и больше n, тем точнее приближение).

Для 0,1 <= p <= 0,9 и n * p> 10 Биномиальное распределение можно аппроксимировать нормальным распределением .

В свою очередь, биномиальное распределение может служить хорошей аппроксимацией гипергеометрического распределения, когда размер совокупности N гипергеометрического распределения намного больше, чем размер выборки n (то есть N >> not / N << 1).

Расчет вероятностей биномиального распределения в Excel

Если вы используете только бумагу и калькулятор, расчеты по формуле биномиального распределения, несмотря на отсутствие интегралов, довольно сложны. Например, значение 100! — имеет более 150 знаков. Раньше и даже сейчас для расчета таких величин использовались приблизительные формулы. В настоящее время рекомендуется использовать специальное программное обеспечение, например, MS Excel. Следовательно, любой пользователь (даже гуманист по образованию) вполне может рассчитать вероятность значения биномиально распределенной случайной величины.

Для закрепления материала пока будем использовать Excel как обычный калькулятор, т.е делаем пошаговый расчет по формуле биномиального распределения. Например, посчитаем вероятность выпадения 50 орлов. Ниже представлено изображение с этапами расчетов и конечным результатом.

Как видите, промежуточные результаты имеют такой масштаб, что они не помещаются в ячейку, хотя простые функции, такие как FACTR (вычисление факториала), POWER (возведение числа в степень), а также операторы умножения и деления являются используется везде. Кроме того, этот расчет довольно громоздкий; в любом случае он не компактен, так как задействовано много ячеек. И это сложно сразу понять.

В общем, Excel предоставляет готовую функцию для вычисления вероятностей биномиального распределения. Функция называется БИНОМРАСП.

Синтаксис функции состоит из 4 аргументов:

Поля предназначены для следующих целей:

Счетчик успехов — количество успешных испытаний. У нас 50.

Количество испытаний — количество запусков: 100 раз.

Шанс на успех: вероятность выпадения орла при выпадении равна 0,5.

Накопительное: 1 или 0. Если 0, рассчитывается вероятность P (B = k); если 1, то вычисляется биномиальная функция распределения, то есть сумма всех вероятностей от B = 0 до B = k включительно.

Нажмите OK, и вы получите тот же результат, что и выше, только все было рассчитано с помощью функции.

Очень удобно. В экспериментальных целях вместо последнего параметра 0 ставим 1. Получаем 0,5398. Это означает, что при подбрасывании 100 монет вероятность выпадения орла от 0 до 50 составляет почти 54%. И вначале казалось, что должно быть 50%. В общем, расчеты производятся легко и быстро.

Настоящий аналитик должен понимать, как ведет себя функция (каково ее распределение), поэтому мы рассчитаем вероятности для всех значений от 0 до 100. То есть мы зададим себе вопрос: какова вероятность того, что никакая голова не будет падение, это 1 голова, 2, 3, 50, 90 или 100. Расчет показан на следующем рисунке. Синяя линия — это само биномиальное распределение, красная точка — вероятность определенного количества успехов k.

Некоторые могут задаться вопросом, как выглядит биномиальное распределение… Да, очень похоже. Муавр (в 1733 г.) также сказал, что биномиальное распределение для больших выборок приближается к нормальному закону (я не знаю, как это тогда называлось), но его никто не слушал. Только Гаусс, а затем и Лаплас, 60-70 лет спустя, заново открыли и тщательно изучили закон нормального распределения. График выше ясно показывает, что максимальная вероятность приходится на математическое ожидание и, когда мы отклоняемся от него, она резко уменьшается. Прямо как нормальный закон.

Биномиальное распределение имеет большое практическое значение и встречается довольно часто. Расчеты выполняются быстро и легко с помощью Excel.

Оценка параметра p

В схеме Бернулли параметр распределения p можно оценить по формуле = СУММ (B14: B113) / COUNT (B14: B113). Формула предполагает, что массив случайных чисел находится в диапазоне B14: B113 .

Параметр биномиального распределения p можно оценить с помощью формулы = СРЕДНЕЕ (B13: B112) / n (предполагается, что случайные числа генерируются по формуле = BINOMOBR (n; p; RAND ()). Формула также предполагает, что l ‘ массив случайных чисел находится в диапазоне B13: B112 .

Показатели распределения

В файле примера на листе Пример есть формулы для расчета некоторых показателей распределения:

  • математическое ожидание = n * p;
  • дисперсия (квадрат стандартного отклонения) = n * p * (1-p);
  • способами = (n + 1) * p;
  • коэффициент асимметрии = (1-2 * p) * ROOT (n * p * (1-p)).

Мы выводим формулу математического ожидания биномиального распределения, используя схему Бернулли .

По определению случайная величина X в случайной величине Бернулли имеет функцию распределения :

Это распределение называется распределением Бернулли .

Распределение Бернулли — это частный случай биномиального распределения с параметром n = 1.

Найдите математическое ожидание (среднее, среднее) распределения Бернулли (x принимает только 2 значения).

Предположим, мы выполнили n последовательных испытаний Бернулли и сформировали выборку, состоящую из n элементов: x1, x2,…, xn (каждый из которых равен 0 или 1). Сумма этих случайных величин Y = X1 + X2 +… + Xn, в свою очередь, также является случайной величиной и, как мы помним, будет иметь биномиальное распределение с параметрами n и p .

Учитывая, что математическое ожидание для каждого xi равно p, тогда для соответствующего биномиального распределения μ = p * n.

Точно так же вы можете рассчитать дисперсию биномиального распределения.

Для этого сначала находим дисперсию (второй момент, дисперсию) распределения Бернулли :

Следовательно, дисперсия биномиального распределения равна σ 2 = n * p * (1-p) = n * p * q.

Оцените статью
Блог про прикладную математику