Обновлено 19.05.2010
Автор: Пятницкий А.М.
Теория вероятностей и математическая статистика стремительно развивались в XX столетии. Поэтому, открыв современный учебник, неискушенный читатель будет подавлен обилием новых понятий, теорем, схем, критериев, примеров. Трудно просто перечислить все дисциплины, которые развились в рамках теории вероятности и отделились от нее. Это дисперсионный анализ (Analysis of Variance - ANOVA), последовательный анализ, планирование эксперимента, теория случайных процессов, теория игр, теория операций, теория надежности, распознавание образов, теория информации, теория связи, статистическая механика, биометрия, data mining и т.д. Длина этого списка должна не удручать, а, наоборот, обнадеживать! Она говорит о том, что знание основных положений теории вероятности позволяет найти им огромное количество практических применений.
Поэтому, чтобы за деревьями не потерять леса, заранее опишем несколько простейших схем, в которых возникают случайные события. Эти модели естественны и логически связаны друг с другом (вложены одна в другую). Они приводят к трем важнейшим распределениям, на которых как на трех китах, стоит теория вероятностей - биномиальному, пуассоновскому и нормальному (гауссовскому).
1. Схема независимых испытаний Бернулли. Простейшая модель - это серия
n независимых одинаковых испытаний ("микро" опытов), каждое из которых имеет два исхода - событие происходит ("успех") или не происходит ("неудача"). Одна такая серия - это один опыт ("макро" опыт). Удобно представить результат серии как последовательность 1 и 0. Например: 010010001000. Это серия из 12 испытаний, из которых три (второе, пятое и девятое по счету) закончились успехом. Наглядным образом испытания с двумя исходами служит выпадение орла ("успех") или решетки ("неудача") при бросании монеты, возможно неправильной (асимметричной). Общее число успехов
K (число единиц) - случайная величина, которая меняется от одного опыта (серии
n испытаний) к другому. Монета при этом остается прежней, и бросают ее одинаково. Эта случайная величина K называется "биномиальной случайной величиной". Ее колебания пропорциональны колебаниям относительной частоты успехов ν =
K / n. Если число опытов окажется очень большим, то частота ν практически перестанет меняться: случайная величина (частота) приблизится к константе
p (вероятности события).
Испытания в схеме Бернулли могут производиться одновременно (бросаем
n идентичных монет) или последовательно (
n раз бросаем одну и ту же монету). Понятие пространственной или временной протяженности здесь вообще отсутствует. Оно появляется в следующей более сложной модели (см. п.2)
2. Случайное распределение n точек по интервалу времени или пространства. Каждая из
n точек независимо от других занимает свое положение и все эти положения равновероятны ("равномерное распределение"). Если выделить часть интервала и подсчитывать число точек, которые туда попадают, то мы вернемся к схеме Бернулли (см. п.1). Более простая модель содержится в предыдущей. Число измерений пространства может быть любым - точки могут располагаться на прямой (1D), плоскости (2D)..., (mD). Cлучай одного измерения имеет особенность - точки можно упорядочить по возрастанию ("слева направо") и рассматривать интервалы между ними "промежутки" (spacings) как новые случайные величины (с.в.)
2а. Пусть число точек
n и размер интервала
L пропорционально увеличиваются: n→∞, L→∞,
n / L = λ = const. Постоянная величина λ (λ >0) имеет смысл среднего числа точек на единицу длины. Рассмотрим число точек попадающих в выделенную часть интервала длиной
l. Эта случайная величина имеет "распределение Пуассона". Формально размах колебаний этой случайной величины неограничен, но чрезмерно большие величины имеют ничтожную вероятность. Ее среднее значение равно λ
l. Так как число разбрасываемых точек неограниченно и точки выбирают себе положение независимо одна от другой, то количество их в не перекрывающихся интервалах длиной
l - это разные реализации этой случайной величины. Поэтому разные опыты по получению пуассоновской случайной величины можно свести к подсчету числа точек в не перекрывающихся интервалах.
3. Нормальное распределение (Гаусса-Лапласа) Это распределение обычно возникает при сложении большого числа независимых случайных величин. Например, общее число успехов в модели №1 это сумма
n величин, каждая из которых равна 0 или 1. Поэтому с ростом
n биномиальное распределение стремится к нормальному. Попытаемся представить это наглядно. Для этого рассмотрим большое количество (ансамбль) точек, каждая из которых в начальный момент времени (t=0) расположена в начале координат (x=0). Время меняется дискретно, принимая значения 1,2,3..., и в каждый момент времени каждая точка с вероятностью
p либо смещается вправо на единицу либо остается на месте. Изначально узкий пик распределения точек (все они стартовали с позиции x=0) начинает смещаться вправо и расплываться - происходит диффузия. Напомним, что между точками нет никакого взаимодействия - все они двигаются независимо. Центр тяжести пика будет двигаться с постоянной скоростью (~ t=n), а ширина увеличиваться пропорционально квадратному корню из времени (~t
1/2 =n
1/2). Зависимость концентрации точек от координаты при достаточно большом времени (t = n>>1) будет близка к характерной колоколообразной кривой нормального распределения.
4.Марковская цепь. ...
Добавить комментарий