Основные модели теории вероятности.


Теория вероятностей и математическая статистика стремительно развивались в XX столетии. Поэтому, открыв современный учебник, неискушенный читатель будет подавлен обилием новых понятий, теорем, схем, критериев, примеров. Трудно просто перечислить все дисциплины, которые развились в рамках теории вероятности и отделились от нее. Это дисперсионный анализ (Analysis of Variance - ANOVA), последовательный анализ, планирование эксперимента, теория случайных процессов, теория игр, теория операций, теория надежности, распознавание образов, теория информации, теория связи, статистическая механика, биометрия, data mining и т.д. Длина этого списка должна не удручать, а, наоборот, обнадеживать! Она говорит о том, что знание основных положений теории вероятности позволяет найти им огромное количество практических применений.

Поэтому, чтобы за деревьями не потерять леса, заранее опишем несколько простейших схем, в которых возникают случайные события. Эти модели естественны и логически связаны друг с другом (вложены одна в другую). Они приводят к трем важнейшим распределениям, на которых как на трех китах, стоит теория вероятностей - биномиальному, пуассоновскому и нормальному (гауссовскому).
 

1. Схема независимых испытаний Бернулли.

            Простейшая модель - это серия n независимых одинаковых  испытаний ("микро" опытов),  каждое из которых имеет два исхода - событие происходит ("успех") или не происходит ("неудача"). Одна такая серия - это один опыт ("макро" опыт). Удобно представить результат серии как последовательность 1 и 0. Например: 010010001000. Это серия из 12 испытаний, из которых три (второе, пятое и девятое по счету) закончились успехом. Наглядным образом испытания с двумя исходами служит выпадение орла ("успех") или решетки ("неудача") при бросании монеты, возможно неправильной (асимметричной). Общее число успехов K (число единиц) - случайная величина, которая меняется от одного опыта (серии n испытаний) к другому. Монета при этом остается прежней, и бросают ее одинаково. Эта случайная величина K называется "биномиальной случайной величиной". Ее колебания пропорциональны колебаниям относительной частоты успехов ν =K / n. Если число опытов окажется очень большим, то частота ν практически перестанет меняться: случайная величина (частота) приблизится к константе p (вероятности события).

Испытания в схеме Бернулли могут производиться одновременно (бросаем n идентичных монет) или последовательно (n раз бросаем одну и ту же монету). Понятие пространственной или временной протяженности здесь вообще отсутствует. Оно появляется в следующей более сложной модели (см. п.2)
 

2. Случайное распределение n точек по интервалу времени или пространства.

Каждая из n точек независимо от других занимает свое положение и все эти положения равновероятны ("равномерное распределение"). Если выделить часть интервала и подсчитывать число точек, которые туда попадают, то мы вернемся к схеме Бернулли (см. п.1). Более простая модель содержится в предыдущей. Число измерений пространства может быть любым - точки могут располагаться на прямой (1D), плоскости (2D)..., (mD). Cлучай одного измерения имеет особенность - точки можно упорядочить по возрастанию ("слева направо") и рассматривать интервалы между ними "промежутки" (spacings)  как новые случайные величины (с.в.)
 

. Пусть число точек n и размер интервала L пропорционально увеличиваются: n→∞, L→∞, n / L = λ = const. Постоянная величина λ (λ >0) имеет смысл среднего числа точек на единицу длины. Рассмотрим число точек попадающих в выделенную часть интервала длиной l. Эта случайная величина имеет "распределение Пуассона". Формально размах колебаний этой случайной величины неограничен, но чрезмерно большие величины имеют ничтожную вероятность. Ее среднее значение равно λl. Так как число разбрасываемых точек неограниченно и точки выбирают себе положение независимо одна от другой, то количество их в не перекрывающихся интервалах длиной l - это разные реализации этой случайной величины. Поэтому разные опыты по получению пуассоновской случайной величины можно свести к подсчету числа точек в не перекрывающихся интервалах.


3. Нормальное распределение (Гаусса-Лапласа)

Это распределение обычно возникает при сложении большого числа независимых случайных величин. Например, общее число успехов в модели №1 это сумма n величин, каждая из которых равна 0 или 1. Поэтому с ростом n биномиальное распределение стремится к нормальному. Попытаемся представить это наглядно. Для этого рассмотрим большое количество (ансамбль) точек, каждая из которых в начальный момент времени (t=0) расположена в начале координат (x=0). Время меняется дискретно, принимая значения 1,2,3..., и в каждый момент времени каждая точка с вероятностью p либо смещается вправо на единицу либо остается на месте. Изначально узкий пик распределения точек (все они стартовали с позиции x=0) начинает смещаться вправо и расплываться - происходит диффузия. Напомним, что между точками нет никакого взаимодействия - все они двигаются независимо. Центр тяжести пика будет двигаться с постоянной скоростью (~ t=n), а ширина увеличиваться пропорционально квадратному корню из времени (~t1/2 =n1/2). Зависимость концентрации точек от координаты при достаточно большом времени (t = n>>1) будет близка к характерной колоколообразной кривой нормального распределения.
 

4.Марковская цепь.

...

 

Добавить комментарий


Защитный код
Обновить