Тема посвящена изучению случайных величин и их вычислению.
Необходимо задавать случайные величины и вычислять их вероятности.
Требуется вычислять математическое ожидание и дисперсию случайной величины.
Знание теории вероятностей будет полезно для изучения данной темы
В этой теме вы познакомитесь с понятием случайной величины.
Вы научитесь
задавать случайные величины и вычислять для них вероятности,
считать математическое ожидание и дисперсию случайной величины.
В этой теме вам пригодится знание теории вероятностей. Если что-то забыли, обращайтесь к прошлым темам.
Случайные величины. Распределение вероятностей для дискретной случайной величины
Кратко:
Случайная величина - переменная, хранящая исход случайного эксперимента в виде числа.
Исходы экспериментов могут быть описаны словами, а не только числами.
Для таких случаев исходы кодируются значениями, например, "Кот выбрал корм с лососем" = 1.
Случайная величина может быть дискретной или непрерывной.
Таблица распределения случайной дискретной величины хранит значения и вероятности, с которыми они принимаются.
Таблицы распределения часто используются для описания дискретных случайных величин.
В одной из прошлых тем вы познакомились с экспериментами, исходами и вероятностью. Эта терминология подходит для простых ситуаций, но бывает, что количество исходов бесконечно. Также исходы в экспериментах необязательно представлены числами — это могут быть слова, например: «Кот выбрал корм с лососем».
Если исходов много и их нельзя описать математически, пользоваться предыдущей теорией с экспериментами и исходами сложно. Чтобы описывать и анализировать такие ситуации, вам предстоит познакомиться с новой терминологией. Её придумали математики, и главное понятие в ней — случайная величина.
💡 Случайная величина — переменная, которая хранит исход некоторого случайного эксперимента в виде числа. В результате эксперимента случайная величина может принимать только одно значение.
Исходя из определения, случайная величина может принимать только числовые значения. Что делать, если исходы всё-таки описаны словами?
Решим эту проблему так. В примере с котом два исхода: «Кот выбрал корм с лососем» и «Кот выбрал корм с тунцом». Они не выражены числом, поэтому мы самостоятельно определим значение для каждого исхода:
Исход «Кот выбрал корм с лососем» кодируем значением 11. Это значит, что кот выбрал первый корм — с лососем.
Исход «Кот выбрал корм с тунцом» кодируем значением 22. Это значит, что кот выбрал второй корм — с тунцом.
В случайной величине исход обязательно представлен числом. Поэтому случайную величину проще анализировать математикам.
Число машин на парковке за день
Верно, случайная величина принимает только числовые значения.
Правильный ответ
Среднее время парковки машин
Этот вариант тоже подходит, так как случайная величина принимает числовое значение.
Случайная величина может быть как дискретной, так и непрерывной. С дискретными переменными проще работать, поэтому начнём с них.
Возьмём случайную величину, у которой есть более двух возможных значений. Например, проводится лотерея, в которой разыгрывают какие-нибудь ценные подарки. Каждый участник сидит за столом — всего столов пять, и у каждого есть номер. Номер стола описывает посетителя, который за этим столом сидит.
В результате получится такой набор чисел: {1, 1, 2, 2, 2, 2, 3, 4, 4, 5}. Расшифруем: за первым столом сидят два человека, за вторым — четыре, за третьим и пятым — по одному, за четвёртым — два. Организаторы выбирают случайного человека из полученного набора и дарят подарки всем, кто сидит за столом вместе с выбранным участником. В этом случае мы имеем дело со случайной величиной «Номер стола с участниками, которые выиграли подарки». Обратите внимание: случайная величина принимает только числовые значения — это условие не нарушено.
Обозначим случайную величину за X То, что случайная величина приняла значение aa, можно записать так: X=a. Теперь запишем вероятность того, что случайная величина приняла значение a: P(X=a). Буква P обозначает вероятность события, которое описали в скобках.
Посчитаем вероятность выигрыша подарка каждым столом. То есть вычислим вероятность того, что случайная величина принимает конкретное значение из набора. Запишем вероятность того, что подарки выиграют участники за столом под номером 5: P(X=5).
Чтобы вычислить эту вероятность, воспользуемся формулой вероятности для события A: P(A)=k/nP(A), где k — это число благоприятных исходов, а n — это общее число исходов. В наборе всего одно число 5, то есть у нас только один благоприятный исход из десяти возможных (10 — столько чисел в наборе). Найдём вероятность того, что случайная величина примет значение 5: P(X=5)=1/10.
Проделаем эту операцию для каждого числа из набора, и в результате получится таблица:
Значение случайной величины (это число, которое случайным образом получили из набора чисел)
1
2
3
4
5
Вероятность того, что случайная величина равна этому значению
0.2
0.4
0.1
0.2
0.1
Видно, что сумма вероятностей всех событий равна 1. Если бы мы получили другой результат, это бы значило, что мы упустили возможные значения случайной величины или учли возможные события несколько раз.
В таблице хранится полная информация о распределении случайной величины: какие значения и с какой вероятностью она может принимать. Поэтому такую таблицу называют таблицей распределения случайной дискретной величины.
💡 Таблица распределения случайной дискретной величины — это таблица, которая хранит все значения, которые может принимать случайная величина, и вероятности, с которыми она эти значения принимает.
Таблицами распределения часто пользуются для описания дискретных случайных величин: они дают полную информацию о распределении в сжатой форме.
Правильный ответ
Значение случайной величины (число посетителей кофейни)
15
21
25
Вероятность этого значения
0.3
0.6
0.1
Всё так: случайная величина описывается числом и сумма всех вероятностей равна 1.
Правильный ответ
Значение случайной величины (сумма, которую потратил посетитель кофейни)
250
300
500
Вероятность этого значения
0.3
0.6
0.1
Всё верно: случайная величина описывается числом и сумма всех вероятностей равна 1.
Вероятность попасть в промежуток для дискретной случайной величины
Кратко:
Вероятность попадания в промежуток для дискретной случайной величины.
Интервалы, отрезки и полуинтервалы - виды промежутков.
Знание разных видов промежутков помогает правильно определять диапазоны значений.
Пример использования правила вычисления вероятности для промежутка.
Сумма всех значений вероятностей в таблице распределения равна 1
В прошлом уроке вы узнали, как вычислить вероятность того, что случайная величина равна некоторому значению. Однако часто хотят получить вероятность того, что величина не равна конкретному значению, а лежит в некотором наборе значений.
Например, мы хотим проанализировать случайную величину «Число новых посетителей кафе». Найдём вероятность того, что наше кафе будет успешным в следующем месяце. Допустим, что число новых посетителей должно быть больше 100. В таком случае нам не нужно искать вероятность того, что случайная величина равна определённому значению. Мы будем искать вероятность того, что случайная величина больше этого значения. О таких ситуациях и пойдёт речь в этом уроке.
Какие бывают промежутки
Когда говорят о наборах числовых значений в диапазоне, часто используют термин промежуток.
Бывает три вида промежутков:
Интервалы. Интервал от a до b обозначается (a,b). В него входят все числа от a до b, не включая самих a и b. То есть интервал (3,10) включает все числа от 3 до 10, не включая 3 и 10.
Отрезки. Отрезок от a до b обозначается [a,b]. Он содержит все числа от a до b, включая a и b. То есть отрезок [2,5] включает все числа от 2 до 5, включая 2 и 5.
Полуинтервалы. Полуинтервал от a до b может обозначаться по-разному. Полуинтервал [a,b) содержит все числа от a до b, включая a, но не включая b. А полуинтервал (a,b] включает все числа от a до b, включая b, но не включая a.
Термин «промежуток» может обозначать любой интервал, отрезок и полуинтервал.
💡 Важное замечание: часто промежуток от a до b считается непрерывным, то есть таким, который включает все возможные числа на числовой оси. В этой теме мы рассматриваем дискретные величины, поэтому промежутки будут включать только целые числа от a до b.
Знание разных видов промежутков поможет вам правильно определять диапазоны значений, когда вы будете решать задачи на вероятность.
Правильный ответ
Интервал (11,14) включает в себя числа 12,13.
Тут всё верно. Интервал записывают в круглых скобках. В него не войдут «крайние» значения 11 и 14, а 12 и 13 — вполне.
Правильный ответ
Отрезок [11,14] включает в себя числа 11,12,13,14.
Верно: отрезок записывают в квадратных скобках и в него входят крайние значения.
Правильный ответ
Полуинтервалом можно назвать промежутки [11,14) и (11,14]. В первый полуинтервал войдёт значение 11, но не войдёт 14, а во втором наоборот.
Тут всё верно.
И снова таблицы
Вернёмся к таблице распределения случайной величины, с которой вы познакомились в прошлом уроке. Возьмём новую таблицу для случайной величины X: «Час, когда посетитель пришёл в кафе». Значениями этой случайной величины будут только часы. Так, если посетитель пришёл в 11:45, то значение случайной величины будет равно 11.
Значение случайной величины
9
10
11
12
13
14
15
16
17
Вероятность того, что случайная величина равна этому значению
0.3
0.2
0.1
0.1
0.05
0.05
0.05
0.05
0.1
Можно заметить, что кафе пользуется особой популярностью по утрам. Ещё одна деталь: в кафе есть утренняя и дневная смены сотрудников, и дневная смена начинает работу в 13:00. Работники утренней смены (те, что работают с 9 до 13 ) недовольны: они обслуживают больше клиентов, чем их коллеги. Они попросили проверить, равны ли вероятности того, что:
посетитель придёт до 13 часов,
посетитель придёт после 13 часов (включительно).
Сначала вычислим вероятность того, что посетитель придёт с 9 до 13 часов. Для этого нужно сложить все вероятности значений, которые может принимать случайная величина, — те, что лежат в диапазоне с 9 до 13 часов. Рассчитаем вероятность:
Понятно недовольство сотрудников, работающих по утрам: вероятность того, что посетитель придёт в их смену, выше, чем у коллег. Может, дневной смене стоит приходить пораньше?
На основе этого примера сформулируем правило — как искать вероятность того, что дискретная величина примет значение из некоторого диапазона:
💡 Чтобы вычислить вероятность того, что случайная величина примет значения из промежутка [a, b], необходимо сложить все вероятности величин, которые может принимать случайная величина и которые лежат в промежутке [a, b]
В кафе завтраки готовят с 9:00 до 11:00. Какова вероятность, что посетитель попадёт на завтрак?
Напомним: значения этой случайной величины — целые часы. Если посетитель пришёл в 10:37, то значение случайной величины будет равно 10.
Введите ответ без пробелов, целую и дробную части разделите точкой.
Ваш ответ правильный0.5
Покажем вам свои расчёты: P(9⩽X⩽10)=P(X=9)+P(X=10)=0.3+0.2=0.5
Посетитель не пропустит завтрак с вероятностью 50 % — неплохой шанс успеть перекусить фирменной яичницей.
Из правила следует, что сумма всех значений вероятностей в таблице распределения должна быть равна 1. Ведь вероятность того, что случайная величина примет какое-либо значение из набора, должна быть равной 1, так как это является достоверным событием — таким, которое обязательно произойдёт.
Какова вероятность того, что Джонни выбьет страйк, то есть собьёт все десять кеглей?
Правильный ответ
0.3
Нужно сложить вероятности всех значений в таблице и вычесть получившееся значение из единицы. Удачи, Джонни!
Теперь вы знаете, как вычислить вероятность того, что случайная величина принимает значение из некоторого диапазона. Это умение пригодится вам в следующем уроке!
Кумулятивная функция для дискретной случайной величины
Кратко:
Кумулятивная функция вероятности - функция F(x), которая показывает вероятность того, что случайная величина принимает значение меньше x.
Вероятность того, что случайная величина принимает значение меньше 14 часов, можно вычислить как сумму вероятностей того, что она примет значение в каждом из этих часов.
Кумулятивная функция не убывает и может либо не изменяться, либо возрастать, так как вероятность не может быть отрицательной.
Кумулятивная функция начинается из 0 и заканчивается на 1, так как вероятность попадания левее минимального и максимального значений случайной величины равна 0 и 1 соответственно.
Кумулятивная функция часто используется в статистике и анализе данных для решения задач, например, определения вероятности заработка компании меньше необходимой суммы или попадания нового пользователя приложения в определенную возрастную группу.
Вы уже умеете находить вероятность того, что случайная величина принимает значение из диапазона. Теперь расскажем, как посчитать вероятность того, что она принимает значение меньше некоторого x.
Вернёмся к примеру с кафе. Возьмём таблицу вероятностей из прошлого урока:
Значение случайной величины
9
10
11
12
13
14
15
16
17
Вероятность того, что случайная величина равна этому значению
0.3
0.2
0.1
0.1
0.05
0.05
0.05
0.05
0.1
Допустим, мы хотим вычислить вероятность того, что посетитель пришёл раньше 14 часов. Сначала запишем эту вероятность математически: P(X⩽13). Кафе открывается в 9, поэтому вероятность прийти раньше 9 утра равна 0. Распишем интересующую нас вероятность как сумму вероятностей того, что посетитель придёт в каждый час с 9 до 14:
В меню кафе есть позиция «Кофе дня» — его готовят в любое время до 13. Какова вероятность, что посетитель попадёт на кофе дня? Введите ответ без пробелов, целую и дробную части разделите точкой.
Ваш ответ правильный0.7
Посчитаем эту вероятность: P(9⩽X⩽12)=P(X=9)+P(X=10)+P(X=11)+P(X=12)=0.3+0.2+0.1+0.1=0.7
Вероятность выпить вкусный кофе ещё выше у тех, кто прочтёт этот урок до конца. Не спрашивайте, откуда мы знаем.
Необязательно каждый раз пересчитывать такую вероятность. Существует функция, которая нам поможет:
💡 Кумулятивной функцией вероятности называется функция F(x), которая в каждой точке показывает вероятность того, что P(X⩽x).
Перед тем как построить график этой функции, найдём её значения в каждой точке.
Посетители не могут прийти раньше 9 часов, поэтому:
P(X⩽8)=0.
Чтобы вычислить вероятность того, что посетители придут до 10, сложим вероятность прийти до 99 и вероятность прийти с 9 до 10:
P(X⩽9)=P(X⩽8)+P(X=9)=0+0.3=0.3
Аналогично поступим с вероятностью того, что посетители придут до 11:
P(X⩽10)=P(X⩽9)+P(X=10)=0.3+0.2=0.5
Похожим образом вычислим остальные значения:
P(X⩽11)=P(X⩽10)+P(X=11)=0.5+0.1=0.6;
P(X⩽12)=P(X⩽11)+P(X=12)=0.6+0.1=0.7;
P(X⩽13)=P(X⩽12)+P(X=13)=0.7+0.05=0.75;
P(X⩽14)=P(X⩽13)+P(X=14)=0.75+0.05=0.8;
P(X⩽15)=P(X⩽14)+P(X=15)=0.8+0.05=0.85;
P(X⩽16)=P(X⩽15)+P(X=16)=0.85+0.05=0.9;
P(X⩽17)=P(X⩽16)+P(X=17)=0.9+0.1=1
Теперь мы знаем значения кумулятивной функции вероятности в каждой точке, а значит, можем построить её график:
По определению, кумулятивная функция в точке показывает вероятность того, что случайная величина приняла значение левее этой точки. С этим связано несколько свойств функции, которые обязательно должны выполняться:
Кумулятивная функция не убывает. Она может либо не изменяться, либо возрастать. Это происходит потому, что вероятность не может быть отрицательной. Если мы добавляем новые значения к диапазону, то вероятность в них попасть или положительна, или равна нулю. Благодаря этому, когда мы добавляем эту вероятность к значениям кумулятивной функции, мы можем получить или такое же значение, или большее. В примере с кафе вероятность того, что посетитель придёт в некоторый час не может быть отрицательной. Поэтому кумулятивная функция не может убывать: она может либо увеличиться, либо не меняться вообще.
Кумулятивная функция начинается из 0. Она показывает вероятность того, что значение случайной величины будет левее некоторого значения. Если мы возьмём минимальное возможное значение случайной величины, то вероятность попасть левее будет равна 0, а значит, кумулятивная функция будет равна 0. На примере кафе станет понятно, что вероятность того, что посетитель пришёл раньше 9, равна 0.
Кумулятивная функция приходит в 1. Если мы возьмём максимальное возможное значение случайной величины, вероятность попасть левее будет равна 1, а значит, кумулятивная функция равна 1. Допустим, мы точно уверены, что за день к нам придёт хотя бы один посетитель. Поэтому вероятность того, что посетитель придёт до 18 часов (в это время кафе закрывается), равна 1.
Правильный ответ
Верно, эта функция удовлетворяет всем свойствам выше.
Кумулятивная функция вероятности часто встречается в статистике и анализе данных. Она часто помогает решать задачи в реальной жизни. Например, если нужно найти вероятность того, что компания заработает меньше необходимой суммы или что новым пользователем приложения будет человек моложе 35 лет.
Математическое ожидание дискретной случайной величины - аналог среднего и дисперсии.
Вычисляется по формуле: E[X] = ∑_i=1^n P(X = x_i)x_i.
Основная причина приближения среднего к математическому ожиданию - закон больших чисел.
В анализе случайных величин математическое ожидание позволяет понять, к чему приближается среднее значение при бесконечном количестве повторений.
В случае равновероятных исходов формула математического ожидания превращается в формулу среднего для n значений
Вы уже многое знаете о случайных величинах, и в этом уроке расскажем об их характеристиках. Чаще всего рассматривают две характеристики, которые являются аналогами среднего и дисперсии. Аналогично описательным статистикам набора данных, они описывают центр и разброс случайной величины: это математическое ожидание и дисперсия. Этот урок посвящён математическому ожиданию.
Математическое ожидание случайной величины X записывается так: E[X]. А вычисляется по формуле:
💡 Математическое ожидание случайной величиныX равно
E[X]=∑P(X=xi)xi
где:
∑ — это сумма всех значений с индексами от 1 до n;
xi — это значение, которое может принимать случайная величина;
P(X=xi) — вероятность, с которой случайная величина принимает это значение.
Формула напугала даже нас, но потом мы поняли, что по этой формуле нужно просто найти сумму всех произведений вероятности значения на само значение из таблицы распределения.
Математическое ожидание — важная концепция в анализе случайных величин. Оно позволяет понять, к чему приближается среднее значение случайной величины в случае, если повторений будет бесконечно много.
Вспомните закон больших чисел: для его выполнения нужно бесконечное количество повторений, поэтому среднее значение никогда не будет равно математическому ожиданию, а будет только приближаться к нему. Именно поэтому величина называется ожиданием: ожидают, что среднее будет ей равно, но проверить это на практике невозможно.
Почему же среднее будет приближаться к математическому ожиданию? Основная причина — закон больших чисел. Этот закон говорит о том, что с увеличением числа повторений эксперимента вычисленные вероятности будут приближаться к теоретической вероятности. Если посчитанные вероятности стремятся к своим истинным значениям, значит, сумма произведений вероятностей на значения случайной величины будет приближаться к математическому ожиданию.
Правильный ответ
Среднее значение случайной величины будет стремиться к её математическому ожиданию при бесконечном числе повторений.
👍🏼
Правильный ответ
Связь между математическим ожиданием и средним значением случайной величины обоснована законом больших чисел.
👍🏼
Вернёмся в уже знакомое вам кафе. Чтобы применить формулу математического ожидания, конечно. Теперь мы будем анализировать не время прихода посетителя, а то, сколько посетителей и с какой вероятностью могут прийти за день. Так мы поможем поварам рассчитать, сколько булочек приготовить с утра для продажи в течение дня. Булочек не должно быть слишком много или слишком мало.
Мы раздобыли таблицу распределения случайной величины X: «Число посетителей за день». Вот она:
Значение случайной величины (число посетителей за день)
10
11
15
18
20
Вероятность того, что случайная величина равна этому значению
0.3
0.2
0.1
0.15
0.25
Перед тем как вычислить математическое ожидание случайной величины X, немного подготовимся. Добавим в таблицу дополнительную строку, в которую запишем произведение значения случайной величины на её вероятность: xi⋅P(X=xi). Тогда получим:
Значение случайной величины xixi (число посетителей за день)
10
11
15
18
20
Вероятность того, что случайная величина равна этому значению, P(X=xi)P(X=xi)
0.3
0.2
0.1
0.15
0.25
Произведение значения случайной величины на его вероятность xi⋅P(X=xi)xi⋅P(X=xi)
3
2.2
1.5
2.7
5
Чтобы вычислить математическое ожидание, сложим все значения из новой строки:
Математическое ожидание случайной величины X равно 14.4, а значит, именно столько посетителей стоит в среднем ожидать в кафе в течение дня. Мы передали эту информацию поварам — теперь они высчитывают, сколько нужно теста на 14.4 булочек.
Изучите таблицу вероятностей случайной величины X: «Сумма, которую потратил посетитель».
Значение случайной величины (сумма, которую потратил посетитель)
100
150
200
250
350
Вероятность того, что случайная величина равна этому значению
0.4
0.1
0.1
0.2
0.2
Ниже укажите математическое ожидание этой случайной величины.
Разберём решение. Дополним таблицу строкой с произведением значения случайной величины и вероятности того, что случайная величина примет это значение:
Значение случайной величины xixi (сумма, которую потратил посетитель)
100
150
200
250
350
Вероятность того, что эта случайная величина равна этому значению, P(X=xi)
0.4
0.1
0.1
0.2
0.2
Произведение значения случайной величины и вероятности этого значения xi⋅P(X=xi)
40
15
20
50
70
Вычислим математическое ожидание этой случайной величины:
E[X]=∑p(xi)⋅xi=∑xi⋅p(xi)=
=x1⋅p(x1)+x2⋅p(x2)+x5⋅p(x5)=
=0.4⋅100+0.1⋅150+0.1⋅200+0.2⋅250+0.2⋅350=
=40+15+20+50+70=195
Если вероятности равны
А что, если все значения дискретной случайной величины будут равновероятны? Тогда вероятность каждого исхода будет равна p(xi)=1/n, где n — это количество значений случайной величины.
Представим, что посетитель только что открывшегося магазина вытаскивает лотерейный билет с числом призов. Их может быть от 1 до 5. Количество билетов с 1, 2, 3, 4 и 5 призами одинаково, поэтому и одинаковы вероятности: p(xi)=1/n=1/5=0.2. Получится такая таблица распределения для этой случайной величины:
1
2
3
4
5
0.2
0.2
0.2
0.2
0.2
Теперь к расчётам:
Математическое ожидание будем считать по формуле:
E[X]=∑p(xi)⋅xi=∑xi⋅p(xi)=
=x1⋅p(x1)+x2⋅p(x2)+...+x5⋅p(x5)
Все вероятности в формуле выше равны, поэтому вынесем общий множитель p(xi)p(xi) за скобки и получим:
p(xi)⋅∑xi=1/n⋅∑xi.
Посчитаем мат. ожидание:
E[X]=1/n⋅∑xi=0.2⋅(1+2+3+4+5)=3
Вывод — в случае равновероятных исходов формула математического ожидания превращается в формулу среднего для nn значений.
В этом уроке вы познакомились с математическим ожиданием случайной величины. Это очень важная характеристика — она позволяет понять, какое значение можно в среднем ожидать от случайной величины. Поэтому математическое ожидание неплохо описывает, вокруг какого значения будут распределены остальные. А как они будут разбросаны вокруг этого значения, вы узнаете в следующем уроке.
Дисперсия дискретной случайной величины
Кратко:
Статья посвящена дисперсии дискретной случайной величины.
Дисперсия характеризует разброс случайных величин и равна сумме произведений квадратов отклонений от математического ожидания и вероятности этих отклонений.
Есть две формулы дисперсии: Var[X] = E[X^2] - (E[X])^2.
Свойства математического ожидания и дисперсии случайной величины: если случайная величина меняется на a, то математическое ожидание также сместится на a, а дисперсия не изменится.
Если случайная величина меняется в a раз, математическое ожидание изменится в a раз, а дисперсия изменится в a^2 раз.
В этом уроке поговорим о характеристике разброса случайных величин. Она также называется дисперсией, но формула её расчёта немного отличается.
💡 Дисперсия дискретной случайной величины XX равна
Var[X]=∑(xi−E[X])^2⋅P(X=xi)
где:
∑ — сумма значений;
xi — это значение, которое может принимать случайная величина;
P(X=xi) — вероятность, с которой случайная величина принимает это значение;
E[X] — это математическое ожидание случайной величины X.
Несмотря на устрашающий вид формулы, расчёты не должны вас пугать. Вы увидите, что они состоят из уже знакомых вам вычислений.
Скорее разберём пример. Посчитаем дисперсию случайной величины XX: «Число посетителей за день». Вспомните, как выглядит таблица распределения этой случайной величины:
Значение случайной величины (число посетителей за день)
10
11
15
18
20
Вероятность того, что случайная величина равна этому значению
0.3
0.2
0.1
0.15
0.25
Ещё в прошлом уроке вы узнали, что математическое ожидание случайной величины X равно E[X]=14.4 Используем ту же тактику, с помощью которой рассчитывали математическое ожидание.
Сделаем несколько шагов:
Добавим дополнительную строку, в которой вычислим отклонение каждого значения от математического ожидания xi−E[X]:
Значение случайной величины xixi (число посетителей за день)
10
11
15
18
20
Вероятность того, что случайная величина равна этому значению, P(X=xi)
0.3
0.2
0.1
0.15
0.25
Отклонение значения от математического ожидания xi−E[X]
-4.4
-3.4
0.6
3.6
5.6
Теперь добавим новую строку, в которой вычислим квадрат этого отклонения (xi−E[X])^2
Значение случайной величины xixi (число посетителей за день)
10
11
15
18
20
Вероятность того, что эта случайная величина равна этому значению, P(X=xi)
0.3
0.2
0.1
0.15
0.25
Отклонение значения от математического ожидания xi−E[X]
-4.4
-3.4
0.6
3.6
5.6
Квадрат отклонения значения от математического ожидания (xi−E[X])^2
19.36
11.56
0.36
12.96
31.36
Теперь мы должны добавить ещё одну строку, в которой вычислим произведение квадрата отклонения и вероятности этого значения (xi−E[X])^2⋅P(X=xi):
Значение случайной величины xixi (число посетителей за день)
10
11
15
18
20
Вероятность того, что эта случайная величина равна этому значению, P(X=xi)
0.3
0.2
0.1
0.15
0.25
Отклонение значения от математического ожидания xi−E[X]
-4.4
-3.4
0.6
3.6
5.6
Квадрат отклонения значения от математического ожидания (xi−E[X])^2
19.36
11.56
0.36
12.96
31.36
Произведение квадрата отклонения значения случайной величины и вероятности этого значения (xi−E[X])^2⋅P(X=xi)
5.808
2.312
0.036
1.944
7.84
А теперь финальный шаг! Сложим все значения из последней получившейся строки. В итоге мы получим долгожданное значение дисперсии случайной величины X:
Получилось! Но что даёт это значение? С его помощью можно понять, насколько сильно значения разбросаны вокруг математического ожидания. Вспомните описательную статистику: у дисперсии есть «младший брат» — стандартное отклонение, которое равно корню из дисперсии.
s=Var[X]**0.5=17.94**0.5≈4.24
В теме про описательную статистику вы узнали, что у большинства наборов данных, которые встречаются на практике, от 97 % до 99 % значений (а то и все 100 %) лежат в пределах некоторого промежутка. Он определяется так: [среднее − 3 стандартных отклонения, среднее + 3 стандартных отклонения].
То же самое можно сказать и про случайные величины. Почти то же самое: вместо среднего нужно взять математическое ожидание, а вместо доли выходящих за эти границы значений — вероятность того, что случайная величина примет значение вне этого промежутка.
Вероятность, с которой случайная величина примет значение из промежутка [E[X]−3s,E[X]+3s], для практически любой случайной величины близка к 1.
Значит, мы можем со всей уверенностью заявить, что число посетителей нашего кафе за день наверняка будет лежать в промежутке:
Действительно, из распределения этой случайной величины видно, что минимальное количество посетителей — 10, а максимальное — 20. Всё сходится!
Изучите таблицу вероятностей случайной величины XX: «Сумма, которую потратил посетитель».
Значение случайной величины (сумма, которую потратил посетитель)
100
150
200
250
350
Вероятность того, что случайная величина равна этому значению
0.4
0.1
0.1
0.2
0.2
Вычислите дисперсию этой случайной величины. Напомним, её математическое ожидание равно 195.
Разберём решение по шагам:
Добавим дополнительную строку, в которой будем вычислять отклонение каждого значения от математического ожидания xi−E[X]:
Значение случайной величины xixi (сумма, которую потратил посетитель)
100
150
200
250
350
Вероятность того, что случайная величина равна этому значению, P(X=xi)P(X=xi)
0.4
0.1
0.1
0.2
0.2
Отклонение значения от математического ожидания xi−E[X]
-95
-45
5
55
155
Теперь добавим новую строку, в которой вычислим квадрат этого отклонения (xi−E[X])^2:
Значение случайной величины xixi (сумма, которую потратил посетитель)
100
150
200
250
350
Вероятность того, что случайная величина равна этому значению, P(X=xi)P(X=xi)
0.4
0.1
0.1
0.2
0.2
Отклонение значения от математического ожидания xi−E[X]
-95
-45
5
55
155
Квадрат отклонения значения от математического ожидания (xi−E[X])^2
9025
2025
25
3025
24025
Теперь мы должны добавить ещё одну строку, в которой будем вычислять произведение квадрата отклонения и вероятности этого значения (xi−E[X])^2⋅P(X=xi):
Значение случайной величины xi (сумма, которую потратил посетитель)
100
150
200
250
350
Вероятность того, что случайная величина равна этому значению, P(X=xi)
0.4
0.1
0.1
0.2
0.2
Отклонение значения от математического ожидания xi−E[X]
-95
-45
5
55
155
Квадрат отклонения значения от математического ожидания (xi−E[X])^2
9025
2025
25
3025
24025
Произведение квадрата отклонения значения случайной величины и вероятности этого значения (xi−E[X])^2⋅P(X=xi)
3610
202.5
2.5
605
4805
В конце мы должны сложить все значения из последней строки таблицы. Мы получим значение дисперсии случайной величины X:
У дисперсии не одна формула расчёта, а целых две. Иногда удобно пользоваться одной, а иногда другой. Скорее познакомим вас со второй формулой:
Var[X]=E[X^2]−(E[X])^2
Соберём их всех:
💡 Дисперсия дискретной случайной величины X равна
Var[X]=E[X^2]−(E[X])^2=∑(xi−E[X])^2⋅P(X=xi),
где:
xi — это значение, которое может принимать случайная величина;
P(X=xi) — вероятность, с которой случайная величина принимает это значение;
E[X] — это математическое ожидание случайной величины X.
Проверим, что обе формулы дают одинаковый результат. Вычислим дисперсию случайной величины X «Число посетителей за день» с помощью второй формулы:
Var[X]=E[X^2]−(E[X])^2
Значение случайной величины (число посетителей за день)
10
11
15
18
20
Вероятность того, что случайная величина равна этому значению
0.3
0.2
0.1
0.15
0.25
Как мы помним, математическое ожидание случайной величины X равно E[X]=14.4, а значит, выражение (E[X])^2 можно легко посчитать: (E[X])^2=207.36
Теперь вычислим выражение E[X2]. Добавим дополнительную строчку в таблицу — в ней будут квадраты значений, которые может принимать случайная величина xi^2:
Значение случайной величины xi (число посетителей за день)
10
11
15
18
20
Вероятность того, что случайная величина равна этому значению, P(X=xi)
0.3
0.2
0.1
0.15
0.25
Квадрат значения случайной величины xi^2
100
121
225
364
400
Теперь добавим новую строку. В ней мы умножим квадрат значения на вероятность того, что квадрат случайной величины примет это значение: xi^2⋅P(X2=xi2)xi^2⋅P(X2=xi^2). Так как все наши величины положительные, то P(X2=xi^2)=P(X=xi)P(X2=xi^2)=P(X=xi). Значит, достаточно добавить новую строку, в которой мы вычислим xi^2⋅P(X=xi)xi^2⋅P(X=xi):
Значение случайной величины xi (число посетителей за день)
10
11
15
18
20
Вероятность того, что случайная величина равна этому значению, P(X=xi)
0.3
0.2
0.1
0.15
0.25
Квадрат значения случайной величины xi^2
100
121
225
324
400
Произведение вероятности на квадрат значения xi^2⋅P(X=xi)
30
24.2
22.5
48.6
100
Чтобы вычислить E[X^2], сложим все значения из последней строки в таблице E[X2]=30+24.2+22.5+48.6+100=225.3 Тогда значение дисперсии можно вычислить так: Var[X]=E[X^2]−(E[X])^2=225.3−207.36=17.94.
Тот же самый ответ! Значит, это действительно эквивалентные формулы. Вряд ли математики хотели нас обмануть, но перепроверить не помешает.
Эти вероятности равны:
вероятность того, что квадрат случайной величины XX окажется равен одному из значений этой случайной величины в квадрате;
вероятность того, что случайная величина XX примет это значение.
Иначе это можно записать так: P(X^2=xi^2)=P(X=xi).
Этот факт мы использовали во время вычисления дисперсии.
Свойства математического ожидания и дисперсии случайной величины
Вы изучили основные характеристики случайной величины, теперь обсудим их свойства. Представим, что в кафе проводят акцию «Второй кофе в подарок». Таблица вероятностей изменилась: по сравнению с первой таблицей каждое значение случайной величины увеличилось на 5 в первый день акции. А во второй день — увеличилось в 2 раза. Видимо, все рассказали об акции друзьям.
Нужно ли теперь пересчитывать все характеристики этой случайной величины? На самом деле нет. Всё дело в свойствах математического ожидания и дисперсии.
Характеристики меняются, если меняется сама случайная величина, и вот как это происходит:
Если случайная величина меняется на a, то значение математического ожидания также сместится на a.
Если случайная величина меняется в a раз, то значение математического ожидания также изменится в a раз.
Если случайная величина меняется на a, значение дисперсии не изменится.
Если случайная величина меняется в a раз, значение дисперсии изменится в a^2 раз.
Используем эти свойства на примере с акцией в кафе:
В первый день акции математическое ожидание числа клиентов увеличится на 5, так как мы увеличили каждое значение случайной величины на 5.
В первый день акции дисперсия числа клиентов не изменится, добавление 5 посетителей никак на неё не повлияет.
Во второй день акции математическое ожидание числа клиентов увеличится в 2 раза, так как мы увеличили каждое значение случайной величины в 2 раза.
Во второй день акции дисперсия числа клиентов увеличится в 4 раза, так как увеличение в aa раз изменит дисперсию в a^2 раз.
Правильный ответ
В первый день математическое ожидание увеличится на 1515, а дисперсия не изменится.
👍🏼
Правильный ответ
Во второй день акции математическое ожидание увеличится в 55 раз, а дисперсия — в 2525 раз.
👍🏼
Заключение
Кратко:
Основы случайных величин изучены.
Случайные величины задаются и вычисляются вероятности.
Математическое ожидание и дисперсия определены и используются.
Свойства математического ожидания и дисперсии изучены.
Событие отличается от случайной величины.
Дискретные случайные величины изучены.
Шпаргалка темы рекомендуется для сохранения информации
В этой теме вы познакомились с основами случайных величин.
Вы научились
задавать случайные величины и вычислять для них вероятности;
считать математическое ожидание и дисперсию случайной величины (с помощью даже двух формул);
использовать свойства математического ожидания и дисперсии, чтобы анализировать их изменение.
Важный результат — вы разобрались, чем событие отличается от случайной величины, и узнали многое про дискретные случайные величины!
Чтобы пройти тест нужно правильно ответить на 6 вопросов из 10. Время на прохождение: 25 минут
Задание 1 из 10
Выберите из списка верно описанные случайные величины.
Правильный ответ
Число новых пользователей на сайте
Правильный ответ
Число кликов пользователя на сайте
Случайная величина может принимать только числовые значения. Поэтому число новых пользователей и число кликов подойдут. А самый популярный товар и имя пользователя — это не числа. Они не будут случайными величинами.
Задание 2 из 10
Из представленных таблиц выберите таблицы распределения случайной величины.
Значение случайной величины (число новых посетителей на сайте)
40
50
60
Вероятность этого значения
0.3
0.6
0.1
Правильный ответ
Значение случайной величины (время в минутах, которое пользователь провёл на сайте)
20
30
40
Вероятность этого значения
0.3
0.6
0.1
В первой таблице величина принимает нечисловые значения, поэтому она не может быть таблицей распределения случайной величины. С последней таблицей тоже проблема: сумма вероятностей всех исходов не равна 1.
Задание 3 из 10
Проанализируйте случайную величину X: «Число новых пользователей на сайте». Вот её таблица вероятностей:
0
1
2
3
4
5
6
7
8
9
10
0.05
0.1
0.05
0.07
0.03
0.1
0.06
0.04
0.1
0.1
?
Какова вероятность того, что на сайт придут 10 новых пользователей?
Правильный ответ
0.3
Нужно сложить вероятности всех значений в таблице и вычесть получившееся значение из единицы. Получится, что вероятность равна P(X=10)=0.3.
Задание 4 из 10
Сотрудники серверной поддержки сообщили, что завтра будет производиться техническое обслуживание серверов. Более 5 новых пользователей зайти на сайт не смогут. Проанализируйте случайную величину X: «Число новых пользователей до техобслуживания». Вот её таблица распределения:
Число новых пользователей до техобслуживания
0
1
2
3
4
5
6
7
8
9
10
Вероятность
0.05
0.1
0.05
0.07
0.03
0.1
0.06
0.04
0.1
0.1
0.3
Пройдут ли технические работы незаметно для пользователей? Чтобы это оценить, посчитайте, какова вероятность того, что на сайт придёт от 6 до 10 новых пользователей?
Правильный ответ
0.6
Нужно сложить вероятности всех значений больше 5 в таблице. В результате получим, что вероятность того, что на сайт придёт больше 5 новых пользователей, равна: P(X>5)=P(X=6)+P(X=7)+P(X=8)+P(X=9)+P(X=10)=0.06+0.04+0.1+0.1+0.3=0.6
Вывод: нужно поторопить коллег, чтобы закончили работы поскорее!
Задание 5 из 10
Во время обслуживания серверов решили собрать статистику по новым пользователям. В результате получили таблицу ниже:
Число новых пользователей во время технического обслуживания
0
1
2
3
4
5
Вероятность
0.05
0.2
0.5
0.05
0.15
0.05
Для новых значений решили построить кумулятивную функцию вероятности. Из вариантов ниже выберите те значения, которые получатся при построении функции.
Посчитаем значение кумулятивной функции распределения в каждой точке: F(0)=P(X⩽0)=P(X=0)=0.05;
F(1)=P(X⩽1)=P(X⩽0)+P(X=1)=0.05+0.2=0.25;
F(2)=P(X⩽2)=P(X⩽1)+P(X=2)=0.25+0.5=0.75;
F(3)=P(X⩽3)=P(X⩽2)+P(X=3)=0.75+0.05=0.8;
F(4)=P(X⩽4)=P(X⩽3)+P(X=4)=0.8+0.15=0.95;
F(5)=P(X⩽5)=P(X⩽4)+P(X=5)=0.95+0.05=1 Именно такие значения будет принимать кумулятивная функция вероятности случайной величины X.
Задание 6 из 10
Из графиков ниже выберите тот, который может являться графиком кумулятивной функции распределения случайной величины из прошлого задания.
Правильный ответ
Задание 7 из 10
Во время технического обслуживания решили проверить, чему равно математическое ожидание числа новых пользователей сайта. Так в будущем можно вычислить разницу математических ожиданий до и после техобслуживания.
Число новых пользователей во время технического обслуживания
0
1
2
3
4
5
Вероятность
0.05
0.2
0.5
0.05
0.15
0.05
Выберите верное математическое ожидание случайной величины X: «Число новых пользователей во время технического обслуживания».
Правильный ответ
2.2
Чтобы вычислить математическое ожидание дискретной случайной величины «Число новых пользователей во время технического обслуживания» по формуле E[X]=∑P(X=xi)xi, добавим в таблицу строчку с величиной произведения значения случайной величины на её вероятность xi⋅P(X=xi):
Теперь сложим все значения в получившейся строке, чтобы получить математическое ожидание:
E[X]=∑P(X=xi)xi=0+0.2+1+0.15+0.6+0.25=2.2
Задание 8 из 10
Теперь найдите разницу между математическими ожиданиями числа новых пользователей во время и после техобслуживания. Таблица вероятностей числа новых пользователей после техобслуживания приведена ниже:
Число новых пользователей
0
1
2
3
4
5
6
7
8
9
10
Вероятность
0.05
0.1
0.05
0.07
0.03
0.1
0.06
0.04
0.1
0.1
0.3
Правильный ответ
4.17
Чтобы вычислить математическое ожидание дискретной случайной величины «Число новых пользователей после технического обслуживания» по формуле E[X]=∑P(X=xi)xi, добавим в таблицу строчку с величиной произведения значения случайной величины на её вероятность xi⋅P(X=xi)):
Теперь сложим все значения в получившейся строке, чтобы получить математическое ожидание: E[X]=∑P(X=xi)xi=0+0.1+0.1+0.21+0.12+0.5+0.36+0.28+0.8+0.9+3=6.37. А значит, разница между двумя математическими ожиданиями равна: 6.37−2.2=4.17.
Задание 9 из 10
Чему равна дисперсия случайной величины X: «Число новых пользователей во время технического обслуживания»?
Число новых пользователей во время технического обслуживания
0
1
2
3
4
5
Вероятность
0.1
0.2
0.3
0.05
0.3
0.05
Правильный ответ
2.14
Вычислим дисперсию дискретной случайной величины «Число новых пользователей во время технического обслуживания» по формуле Var[X]=E(X^2)−(E(X))^2. Добавим в нашу таблицу строчку с величиной квадрата значения случайной величины xi^2:
Далее добавим новую строку с произведением вероятности на квадрат значения xi^2⋅P(X=xi):
Чтобы вычислить E[X^2], сложим все значения из последней строки в таблице E[X^2]=0+0.2+1.2+0.45+4.8+1.25=7.9. Тогда значение дисперсии можно вычислить так: Var[X]=E[X^2]−(E[X])^2=7.9−2.42=7.9−5.76=2.14.
Задание 10 из 10
Найдите стандартное отклонение случайной величины X: «Количество добавленных в корзину товаров». Известно, что её дисперсия Var[X равна 6.0025.
Правильный ответ
2.45
Стандартное отклонение равно корню из дисперсии, а значит: s=Var[X]**0.5=6.0025=2.45