Следующая тема:  САД. Распределения

Вернуться в раздел: Статистический анализ данных

Вернуться в оглавление: Я.Практикум

 

В теме:

2. Случайные величины. Распределение вероятностей для дискретной случайной величины

3. Вероятность попасть в промежуток для дискретной случайной величины

4. Кумулятивная функция для дискретной случайной величины

5. Математическое ожидание дискретной случайной величины

6. Дисперсия дискретной случайной величины

7. Заключение

8. Проверочные задания . Случайные величины

 

Случайные величины. Распределение вероятностей для дискретной случайной величины

Кратко:

В одной из прошлых тем вы познакомились с экспериментами, исходами и вероятностью. Эта терминология подходит для простых ситуаций, но бывает, что количество исходов бесконечно. Также исходы в экспериментах необязательно представлены числами — это могут быть слова, например: «Кот выбрал корм с лососем».
 
Если исходов много и их нельзя описать математически, пользоваться предыдущей теорией с экспериментами и исходами сложно. Чтобы описывать и анализировать такие ситуации, вам предстоит познакомиться с новой терминологией. Её придумали математики, и главное понятие в ней — случайная величина.
 
Правильный ответ
Правильный ответ
 
Ваш ответ правильный
0.5
 

Кумулятивная функция для дискретной случайной величины

Кратко:

Вы уже умеете находить вероятность того, что случайная величина принимает значение из диапазона. Теперь расскажем, как посчитать вероятность того, что она принимает значение меньше некоторого x.
 
Вернёмся к примеру с кафе. Возьмём таблицу вероятностей из прошлого урока:
 
                   
Значение случайной величины 9 10 11 12 13 14 15 16 17
Вероятность того, что случайная величина равна этому значению 0.3 0.2 0.1 0.1 0.05 0.05 0.05 0.05 0.1
 
Ваш ответ правильный
0.7
Правильный ответ
 

Математическое ожидание дискретной случайной величины

Кратко:

  • Математическое ожидание дискретной случайной величины - аналог среднего и дисперсии.
  • Вычисляется по формуле: E[X] = ∑_i=1^n P(X = x_i)x_i.
  • Основная причина приближения среднего к математическому ожиданию - закон больших чисел.
  • В анализе случайных величин математическое ожидание позволяет понять, к чему приближается среднее значение при бесконечном количестве повторений.
  • В случае равновероятных исходов формула математического ожидания превращается в формулу среднего для n значений
Вы уже многое знаете о случайных величинах, и в этом уроке расскажем об их характеристиках. Чаще всего рассматривают две характеристики, которые являются аналогами среднего и дисперсии. Аналогично описательным статистикам набора данных, они описывают центр и разброс случайной величины: это математическое ожидание и дисперсия. Этот урок посвящён математическому ожиданию.
 
Перед тем как вычислить математическое ожидание случайной величины X, немного подготовимся. Добавим в таблицу дополнительную строку, в которую запишем произведение значения случайной величины на её вероятность: xi⋅P(X=xi). Тогда получим:
 
           
Значение случайной величины xi (число посетителей за день) 10 11 15 18 20
Вероятность того, что случайная величина равна этому значению, P(X=xi) 0.3 0.2 0.1 0.15 0.25
Произведение значения случайной величины на его вероятность xi⋅P(X=xi) 3 2.2 1.5 2.7 5
 
Вычислим математическое ожидание этой случайной величины:
E[X]=∑p(xi)⋅xi=∑xi⋅p(xi)=
=x1⋅p(x1)+x2⋅p(x2)+x5⋅p(x5)=
=0.4⋅100+0.1⋅150+0.1⋅200+0.2⋅250+0.2⋅350=
=40+15+20+50+70=195

Если вероятности равны

А что, если все значения дискретной случайной величины будут равновероятны? Тогда вероятность каждого исхода будет равна p(xi)=1/n, где n — это количество значений случайной величины.
 
Представим, что посетитель только что открывшегося магазина вытаскивает лотерейный билет с числом призов. Их может быть от 1 до 5. Количество билетов с 1, 2, 3, 4 и 5 призами одинаково, поэтому и одинаковы вероятности: p(xi)=1/n=1/5=0.2. Получится такая таблица распределения для этой случайной величины:
 
         
1 2 3 4 5
0.2 0.2 0.2 0.2 0.2
 
Теперь к расчётам:
  1. Математическое ожидание будем считать по формуле:
     
    E[X]=∑p(xi)⋅xi=∑xi⋅p(xi)=
    =x1⋅p(x1)+x2⋅p(x2)+...+x5⋅p(x5)
  2. Все вероятности в формуле выше равны, поэтому вынесем общий множитель p(xi) за скобки и получим:
    p(xi)⋅∑xi=1/n⋅∑xi.
  3. Посчитаем мат. ожидание:
    E[X]=1/n⋅∑xi=0.2⋅(1+2+3+4+5)=3
Вывод — в случае равновероятных исходов формула математического ожидания превращается в формулу среднего для n значений.
 
В этом уроке вы познакомились с математическим ожиданием случайной величины. Это очень важная характеристика — она позволяет понять, какое значение можно в среднем ожидать от случайной величины. Поэтому математическое ожидание неплохо описывает, вокруг какого значения будут распределены остальные. А как они будут разбросаны вокруг этого значения, вы узнаете в следующем уроке.
 

Дисперсия дискретной случайной величины

Кратко:

В этом уроке поговорим о характеристике разброса случайных величин. Она также называется дисперсией, но формула её расчёта немного отличается.
 
Несмотря на устрашающий вид формулы, расчёты не должны вас пугать. Вы увидите, что они состоят из уже знакомых вам вычислений.
 
Скорее разберём пример. Посчитаем дисперсию случайной величины X: «Число посетителей за день». Вспомните, как выглядит таблица распределения этой случайной величины:
 
           
Значение случайной величины (число посетителей за день) 10 11 15 18 20
Вероятность того, что случайная величина равна этому значению 0.3 0.2 0.1 0.15 0.25
 
Ещё в прошлом уроке вы узнали, что математическое ожидание случайной величины X равно E[X]=14.4 Используем ту же тактику, с помощью которой рассчитывали математическое ожидание.
 
Сделаем несколько шагов:
  1. Добавим дополнительную строку, в которой вычислим отклонение каждого значения от математического ожидания xi−E[X]:
     
               
    Значение случайной величины xi (число посетителей за день) 10 11 15 18 20
    Вероятность того, что случайная величина равна этому значению, P(X=xi) 0.3 0.2 0.1 0.15 0.25
    Отклонение значения от математического ожидания xi−E[X] -4.4 -3.4 0.6 3.6 5.6
     
Теперь добавим новую строку, в которой вычислим квадрат этого отклонения (xi−E[X])^2
 
           
Значение случайной величины xi (число посетителей за день) 10 11 15 18 20
Вероятность того, что эта случайная величина равна этому значению, P(X=xi) 0.3 0.2 0.1 0.15 0.25
Отклонение значения от математического ожидания xi−E[X] -4.4 -3.4 0.6 3.6 5.6
Квадрат отклонения значения от математического ожидания (xi−E[X])^2 19.36 11.56 0.36 12.96 31.36
 
Теперь мы должны добавить ещё одну строку, в которой вычислим произведение квадрата отклонения и вероятности этого значения (xi−E[X])^2⋅P(X=xi):
 
           
Значение случайной величины xi (число посетителей за день) 10 11 15 18 20
Вероятность того, что эта случайная величина равна этому значению, P(X=xi) 0.3 0.2 0.1 0.15 0.25
Отклонение значения от математического ожидания xi−E[X] -4.4 -3.4 0.6 3.6 5.6
Квадрат отклонения значения от математического ожидания (xi−E[X])^2 19.36 11.56 0.36 12.96 31.36
Произведение квадрата отклонения значения случайной величины и вероятности этого значения (xi−E[X])^2⋅P(X=xi) 5.808 2.312 0.036 1.944 7.84
 
  1. А теперь финальный шаг! Сложим все значения из последней получившейся строки. В итоге мы получим долгожданное значение дисперсии случайной величины X:
     
    Var[X]=∑(xi−E[X])^2⋅P(X=xi)=
    =(x1−E[X])^2⋅P(X=x1)+…+(x5−E[X])^2⋅P(X=x5)=
    =(10−14.4)^2⋅0.3+(11−14.4)^2⋅0.2+(15−14.4)^2⋅0.1+(18−14.4)^2⋅0.15+(20−14.4)^2⋅0.25=
    =19.36⋅0.3+11.56⋅0.2+0.36⋅0.1+12.96⋅0.15+31.36⋅0.25=
    =5.808+2.312+0.036+1.944+7.84=17.94.
Получилось! Но что даёт это значение? С его помощью можно понять, насколько сильно значения разбросаны вокруг математического ожидания. Вспомните описательную статистику: у дисперсии есть «младший брат» — стандартное отклонение, которое равно корню из дисперсии.
 
s=Var[X]**0.5=17.94**0.5≈4.24
 
Теперь добавим новую строку, в которой вычислим квадрат этого отклонения (xi−E[X])^2:
 
           
Значение случайной величины xi (сумма, которую потратил посетитель) 100 150 200 250 350
Вероятность того, что случайная величина равна этому значению, P(X=xi) 0.4 0.1 0.1 0.2 0.2
Отклонение значения от математического ожидания xi−E[X] -95 -45 5 55 155
Квадрат отклонения значения от математического ожидания (xi−E[X])^2 9025 2025 25 3025 24025
 
Теперь мы должны добавить ещё одну строку, в которой будем вычислять произведение квадрата отклонения и вероятности этого значения (xi−E[X])^2⋅P(X=xi):
 
           
Значение случайной величины xi (сумма, которую потратил посетитель) 100 150 200 250 350
Вероятность того, что случайная величина равна этому значению, P(X=xi) 0.4 0.1 0.1 0.2 0.2
Отклонение значения от математического ожидания xi−E[X] -95 -45 5 55 155
Квадрат отклонения значения от математического ожидания (xi−E[X])^2 9025 2025 25 3025 24025
Произведение квадрата отклонения значения случайной величины и вероятности этого значения (xi−E[X])^2⋅P(X=xi) 3610 202.5 2.5 605 4805
 
  1. В конце мы должны сложить все значения из последней строки таблицы. Мы получим значение дисперсии случайной величины X:
     
    Var[X]=∑(xi−E[X])^2⋅P(X=xi)=
    =(x1−E[X])^2⋅P(X=x1)+…+(x5−E[X])^2⋅P(X=x5)=
    =(100−195)^2⋅0.4+(150−195)^2⋅0.1+(200−195)^2⋅0.1+(250−195)^2⋅0.2+(350−195)^2⋅0.2=
    =9025⋅0.4+2025⋅0.1+25⋅0.1+3025⋅0.2+24025⋅0.2=
    =3610+202.5+2.5+605+4805=9225

Вторая формула дисперсии

У дисперсии не одна формула расчёта, а целых две. Иногда удобно пользоваться одной, а иногда другой. Скорее познакомим вас со второй формулой:
 
Var[X]=E[X^2]−(E[X])^2
 
Соберём их всех:
 
Проверим, что обе формулы дают одинаковый результат. Вычислим дисперсию случайной величины X «Число посетителей за день» с помощью второй формулы:
 
Var[X]=E[X^2]−(E[X])^2
 
           
Значение случайной величины (число посетителей за день) 10 11 15 18 20
Вероятность того, что случайная величина равна этому значению 0.3 0.2 0.1 0.15 0.25
 
  • Как мы помним, математическое ожидание случайной величины X равно E[X]=14.4, а значит, выражение (E[X])^2 можно легко посчитать: (E[X])^2=207.36
  • Теперь вычислим выражение E[X2]. Добавим дополнительную строчку в таблицу — в ней будут квадраты значений, которые может принимать случайная величина xi^2:
     
               
    Значение случайной величины xi (число посетителей за день) 10 11 15 18 20
    Вероятность того, что случайная величина равна этому значению, P(X=xi) 0.3 0.2 0.1 0.15 0.25
    Квадрат значения случайной величины xi^2 100 121 225 364 400
     
Теперь добавим новую строку. В ней мы умножим квадрат значения на вероятность того, что квадрат случайной величины примет это значение: xi^2⋅P(X2=xi2). Так как все наши величины положительные, то P(X2=xi^2)=P(X=xi). Значит, достаточно добавить новую строку, в которой мы вычислим xi^2⋅P(X=xi):
 
           
Значение случайной величины xi (число посетителей за день) 10 11 15 18 20
Вероятность того, что случайная величина равна этому значению, P(X=xi) 0.3 0.2 0.1 0.15 0.25
Квадрат значения случайной величины xi^2 100 121 225 324 400
Произведение вероятности на квадрат значения xi^2⋅P(X=xi) 30 24.2 22.5 48.6 100
 
 
 
Чтобы пройти тест нужно правильно ответить на 6 вопросов из 10.
Время на прохождение: 25 минут
 
 
 
Правильный ответ
 
 
 
Правильный ответ
 
 

Далее добавим новую строку с произведением вероятности на квадрат значения xi^2⋅P(X=xi):
 
 

Следующая тема:  САД. Распределения

Вернуться в раздел: Статистический анализ данных

Вернуться в оглавление: Я.Практикум