Числовые характеристики случайных величин, их статистические и вероятностные значения. Центрированные случайные величины

Полной характеристикой случайной величины является закон распределения. На практике такая характеристика не всегда может быть получена из-за ограниченности экспериментальных результатов. В этих случаях вместо законов распределения используют приближенное описание случайных величин, которая получается с помощью минимального числа неслучайных характеристик. Количество этих характеристик должно быть небольшим, но должно отражать наиболее существенные особенности распределении:

· математическое ожидание случайной величины;

· дисперсия (момент нулевого порядка, 1-го).

Простейшей числовой характеристикой дискретной случайной величины Х – среднее значение: , где - среднее значение случайной величины; N – число испытаний; - значение случайной величины, которое оно принимает при N испытаний.

Для характеристики разброса значений дискретной случайной величины в данной серии опытов используется квадрат разности между значениями случайно величины и её средним значением: , где - статистическая дисперсия случайно величины Х. При практических расчетах вместо дисперсии применяется среднеквадратическое отклонение: , чем меньше , тем теснее группируются значения случайной величины около её среднего значения .

Если результаты экспериментов характеризуются не одной случайной величиной, а несколькими, то кроме рассмотренных характеристик вводятся величины, характеризующие степень зависимости между этими случайными величинами. В качестве такой характеристики, например для 2-х случайных величин х и у в данной серии опытов принята величина: . Равенство (4) статическим корреляционным моментом. При увеличении опытов значение частоты появления данного события будет приближаться к вероятности . А среднее арифметическое значение будет стремится к её математическому ожиданию : , где вероятность появления значения . Таким образом, математическим ожиданием дискретной случайной величины Х называется сумма произведений всех её возможных значений х на вероятность появления этих значений . , дисперсией случайной величины называется её математическое ожидание квадрата отклонения от этой величины от её математического ожидания. , где центрированная случайная величина, , . Корреляционный момент: , где - это вероятность того, что случайная величина х, у примут значения x i , y i , .

Для непрерывных случайных величин математическое ожидание, дисперсия и корреляционный момент определяются через плотность: .

Для независимых случайных величин: тогда , . Согласно (9) для независимых случайных величин потому, если двух случайных величин отличен от 0, то это указывает на наличие зависимости между этими случайными. Случайные величины для которых называются некорреляционными случайными величинами. характеризует не только зависимость величин, но и их рассеивание. Если, например, одна из величин Х или У мало отклоняется от своего математического ожидания, то корреляционный момент будет мал какой бы зависимостью эти величины мужду собой не обладали.



Для устранения этого недостатка вводится безразмерная характеристика, которая называется коэффициентом корреляции: . Если пользоваться механической интерпретацией, то абсциссу можно представить как центр тяжести фигуры, а дисперсию как момент инерции плоской фигуры.

имеет дисперсию равную 1 и математическое ожидание равное 0.

Нормированная случайная величина V – это отношение данной случайной величины X к ее среднему квадратичному отклонению σ

Среднее квадратичное отклонение – это квадратный корень из дисперсии

Математическое ожидание и дисперсия нормированной случайной величины V выражаются через характеристики X так:

MV= M(X)σ=1v, DV= 1,

где v – коэффициент вариации исходной случайной величины X.

Для функции распределения F V (x) и плотности распределения f V (x) имеем:

F V (x) = F(σx), f V (x) = σf(σx),

где F(x) – функция распределения исходной случайной величины Х , а f(x) – ее плотность вероятности.

Коэффициент корреляции.

Коэффициент корреляции – это показатель характера взаимного стохастического влияния изменения двух случайных величин. Коэффициент корреляции может принимать значения от -1 до +1. Если значение по модулю находится ближе к 1, то это означает наличие сильной связи, а если ближе к 0 –связь отсутствует или является существенно нелинейной. При коэффициенте корреляции равном по модулю единице говорят о функциональной связи (а именно линейной зависимости), то есть изменения двух величин можно описать линейной функцией.

Процесс называется стохастическим , если он описывается случайными переменными, значение которых меняется во времени.

Коэффициент корреляции Пирсона.

Для метрических величин применяется коэффициент корреляции Пирсона, точная формула которого была выведена Френсисом Гамильтоном. Пусть X и Y – две случайные величины, определенные на одном вероятностном пространстве. Тогда их коэффициент корреляции задается формулой:

Неравенства Чебышева.

Неравенство Маркова.

Неравенство Маркова в теории вероятностей даёт оценку вероятности, что случайная величина превзойдёт по модулю фиксированную положительную константу, в терминах её математического ожидания. Получаемая оценка обычно достаточно груба. Однако, она позволяет получить определённое представление о распределении, когда последнее не известно явным образом.

Пусть случайная величина определена на вероятностном пространстве , и её математическое ожидание конечно. Тогда

,

где a > 0.

Неравенство Чебышёва - Бьенеме.

Если E < ∞ (E – математическое ожидание), то для любого , справедливо

Закон больших чисел.

Закон больших чисел утверждает, что эмпирическое среднее (среднее арифметическое) достаточно большой конечной выборки из фиксированного распределения близко к теоретическому среднему (математическому ожиданию) этого распределения. В зависимости от вида сходимости различают слабый закон больших чисел, когда имеет место сходимость по вероятности, и усиленный закон больших чисел, когда имеет место сходимость почти всюду.



Всегда найдётся такое количество испытаний, при котором с любой заданной наперёд вероятностью частота появления некоторого события будет сколь угодно мало отличаться от его вероятности. Общий смысл закона больших чисел - совместное действие большого числа случайных факторов приводит к результату, почти не зависящему от случая.

Слабый закон больших чисел.

Тогда Sn P M(X).

Усиленный закон больших чисел.

Тогда Sn→M(X) почти наверное.

Центрированной случайной величиной, соответствующей СВ X называется разность между случайной величиной X и ее математическим ожиданием

Случайная величина называется нормированной , если ее дисперсия рана 1. Центрированная и нормированная случайная величина называетсястандартной .

Стандартная случайная величина Z , соответствующая случайной величинеX находится по формуле:

(1.24)

1.2.5. Другие числовые характеристики

Мода дискретной СВ X определяется как такое возможное значениеx m , для которого

Модой непрерывной СВ X называется действительное число M 0 (X ), определяемое как точка максимума плотности распределения вероятностей f (x ).

Таким образом, мода СВ X есть ее наиболее вероятное значение, если такое значение единственно. Мода может не существовать, иметь единственное значение (унимодальное распределение) или иметь несколько значений (мультимодальное распределение).

Медианой непрерывной СВ X называется действительное числоM D (X ), удовлетворяющее условию

Так как данное уравнение может иметь множество корней, то медиана определяется, вообще говоря, неоднозначно.

Начальным моментом m -го порядка СВ X (если он существует) называется действительное число m , определяемое по формуле

(1.27)

Центральным моментом m-го порядка СВ X (если он существует) называется число m , определяемое по формуле

(1.28)

Математическое ожидание СВ X есть ее первый начальный момент, а дисперсия – второй центральный.

Среди моментов высших порядков особое значение имеют центральные моменты 3-го и 4-го порядков.

Коэффициентом асимметрии ("скошенности") А(X ) называется величина

Коэффициентом эксцесса ("островершинности") E(X ) СВ X называется величина

1.3. Некоторые законы распределения дискретных случайных величин

1.3.1. Геометрическое распределение

Дискретная СВ X имеет геометрическое распределение, если ее возможным значениям 0, 1, 2, …,m , … соответствуют вероятности, вычисляемые по формуле

где 0 < p < 1,q = 1 –p .

На практике геометрическое распределение встречается, когда производится ряд независимых попыток достигнуть какого-то результата А и вероятность появления событияА в каждой попыткеP (A ) =P . СВX – число бесполезных попыток (до первого опыта, в котором появится событиеА ), имеет геометрическое распределение с рядом распределения:

x i

p i

q 2 p

q m p

и числовыми характеристиками:

(1.30)

1.3.2. Гипергеометрическое распределение

Дискретная СВ X с возможными значениями 0, 1, …,m , …,M имеет гипергеометрическое распределение с параметрамиN ,M ,n , если

(1.31)

где M N ,m n ,n N ,m ,n ,N ,M – натуральные числа.

Гипергеометрическое распределение возникает в случаях, подобных следующему: имеется N объектов, из которыхM обладают определенным признаком. Из имеющихсяN объектов наудачу выбираютсяn объектов.

СВ X число объектов с указанным признаком среди выбираемых, распределена по гипергеометрическому закону.

Гипергеометрическое распределение используется, в частности, при решении задач, связанных с контролем качества продукции.

Математическое ожидание случайной величины, имеющей гипергеометрическое распределение, равно:

(1.32)

Математическим ожиданием дискретной случайной величины называют сумму произведений всех ее возможных значений на их вероятности

Замечание. Из определения следует, что математическое ожидание дискретной случайной величины есть неслучайная (постоянная) величина.

Математическое ожидание непрерывной случайной величины, можно вычислить по формуле

M(X) =
.

Математическое ожидание приближенно равно (тем точнее, чем больше число испытаний)среднему арифметическому наблюдаемых значений случайной величины .

Свойства математического ожидания.

Свойство 1. Математическое ожидание постоянной величины равно самой постоянной:

Свойство 2. Постоянный множитель можно выносить за знак математического ожидания:

Свойство 3. Математическое ожидание произведения двух независимых случайных величин равно произведению их математических ожиданий:

M(XY) =M(X) *M(Y).

Свойство 4. Математическое ожидание суммы двух случайных величин равно сумме математических ожиданий слагаемых:

M(X+Y) =M(X) +M(Y).

12.1. Дисперсия случайной величины и ее свойства.

На практике часто требуется выяснить рассеяние случайной величины вокруг ее среднего значения. Например, в артиллерии важно знать, насколько кучно лягут снаряды вблизи цели, которая должна быть поражена.

На первый взгляд может показаться, что для оценки рассеяния проще всего вычислить все возможные значения отклонения случайной величины и затем найти их среднее значение. Однако такой путь ничего не даст, так как среднее значение отклонения, т. е. M, для любой случайной величины равно нулю.

Поэтому чаще всего идут по другому пути – используют для вычисления дисперсию.

Дисперсией (рассеянием) случайной величины называют математическое ожидание квадрата отклонения случайной величины от ее математического ожидания:

D(X) = M 2 .

Для вычисления дисперсии часто бывает удобно пользоваться следующей теоремой.

Теорема. Дисперсия равна разности между математическим ожиданием квадрата случайной величины X и квадратом ее математического ожидания.

D(X) = M(X 2) – 2 .

Свойства дисперсии.

Свойство 1. Дисперсия постоянной величины C равна нулю:

Свойство 2. Постоянный множитель можно возводить за знак дисперсии возводя его в квадрат:

D(CX) =C 2 D(X).

Свойство 3. Дисперсия суммы двух независимых случайных величин равна сумме дисперсий этих величин:

D(X+Y) =D(X) +D(Y).

Свойство 4. Дисперсия разности двух независимых случайных величин равна сумме их дисперсий:

D(X–Y) =D(X) +D(Y).

13.1. Нормированные случайные величины.

имеет дисперсию равную 1 и математическое ожидание равное 0.

Нормированная случайная величина V – это отношение данной случайной величины X к ее среднему квадратичному отклонению σ

Среднее квадратичное отклонение – это квадратный корень из дисперсии

Математическое ожидание и дисперсия нормированной случайной величиныVвыражаются через характеристики X так:

где v – коэффициент вариации исходной случайной величины X.

Для функции распределения F V (x) и плотности распределения f V (x) имеем:

F V (x) =F(σx), f V (x) =σf(σx),

где F(x) – функция распределения исходной случайной величиныХ , аf(x) – ее плотность вероятности.

ХАРАКТЕРИСТИКИ РАЗБРОСА

От характеристик положения - математического ожидания, медианы, моды - перейдем к характеристикам разброса случайной величины X. дисперсии D{X) = а 2 , среднему квадратическому отклонению а и коэффициенту вариации v. Определение и свойства дисперсии для дискретных случайных величин рассмотрены в предыдущей главе. Для непрерывных случайных величин

Среднее квадратическое отклонение - это неотрицательное значение квадратного корня из дисперсии:

Коэффициент вариации - это отношение среднего квадратического отклонения к математическому ожиданию:

Коэффициент вариации - применяется при М(Х) > О - измеряет разброс в относительных единицах, в то время как среднее квадратическое отклонение - в абсолютных.

Пример 6. Для равномерно распределенной случайной величины X найдем дисперсию, среднеквадратическое отклонение и коэффициент вариации. Дисперсия равна:

Замена переменной дает возможность записать:

где с = ф - аУ2.

Следовательно, среднее квадратическое отклонение равно а коэффициент вариации таков:

ПРЕОБРАЗОВАНИЯ СЛУЧАЙНЫХ ВЕЛИЧИН

По каждой случайной величине X определяют еще три величины - центрированную Y, нормированную V и приведенную U. Центрированная случайная величина Y - это разность между данной случайной величиной X и ее математическим ожиданием М(Х), т.е. Y = X - М(Х). Математическое ожидание центрированной случайной величины Y равно 0, а дисперсия - дисперсии данной случайной величины:

Функция распределения Fy(x) центрированной случайной величины Y связана с функцией распределения F(x ) исходной случайной величины X соотношением:

Для плотностей этих случайных величин справедливо равенство

Нормированная случайная величина V - это отношение данной случайной величины X к ее среднему квадратическому отклонению а, т.е. V = XIо. Математическое ожидание и дисперсия нормированной случайной величины V выражаются через характеристики X так:

где v - коэффициент вариации исходной случайной величины X. Для функции распределения Fv(x) и плотности fv(x) нормированной случайной величины V имеем:

где F{x) - функция распределения исходной случайной величины X; fix) - ее плотность вероятности.

Приведенная случайная величина U - это центрированная и нормированная случайная величина:

Для приведенной случайной величины

Нормированные, центрированные и приведенные случайные величины постоянно используются как в теоретических исследованиях, так и в алгоритмах, программных продуктах, нормативно-технической и инструктивно-методической документации. В частности, потому, что равенства M{U) = 0, D(lf) = 1 позволяют упростить обоснования методов, формулировки теорем и расчетные формулы.

Используются преобразования случайных величин и более общего плана. Так, если У = аХ + Ь, где а и b - некоторые числа, то

Пример 7. Если а = 1/G, b = -M(X)/G, то У - приведенная случайная величина, и формулы (8) переходят в формулы (7).

С каждой случайной величиной X можно связать множество случайных величин У, заданных формулой У = аХ + b при различных а > 0 и Ь. Это множество называют масштабно- сдвиговым семейством, порожденным случайной величиной X. Функции распределения Fy(x ) составляют масштабно-сдвиговое семейство распределений, порожденное функцией распределения F(x). Вместо У = аХ + b часто используют запись

Число с называют параметром сдвига, а число d - параметром масштаба. Формула (9) показывает, что X - результат измерения некоторой величины - переходит в К - результат измерения той же величины, если начало измерения перенести в точку с, а затем использовать новую единицу измерения, в d раз большую старой.

Для масштабно-сдвигового семейства (9) распределение X называют стандартным. В вероятностно-статистических методах принятия решений и других прикладных исследованиях используют стандартное нормальное распределение, стандартное распределение Вейбулла-Гнеденко, стандартное гамма-

распределение и др. (см. ниже).

Применяют и другие преобразования случайных величин. Например, для положительной случайной величины X рассматривают Y = IgX, где IgX - десятичный логарифм числа X. Цепочка равенств

связывает функции распределения X и Y.



Поделиться