Лекция №7. Числовые характеристики выборки ТЕМА. Числовые характеристики выборки Следующим этапом обработки данных является вычисления числовых характеристик выборки. Главные из них: среднее значение, дисперсия, среднее квадратическое значение , моменты. Так как функцию выборочных значений называют статистикой, то числовые характеристики, вычисленные по выборке, также называют статистиками. Числовые характеристики, вычисленные по генеральной совокупности, называют пара метрами генеральной совокупности. 7.1 Выборочное среднее Для конкретной выборки объема n ее выборочное среднее определяется соотношением где хi – значение элемента выборки. Обычно требуется описать статистические свойства произвольных случайных выборок одного объема, а не одной из них. Это значит, что рассматривается математическая модель, которая предполагает достаточно большое количество выборок объема n. В этом случае элементы выборки рассматриваются как независимые случайные величины Хi, принимающие значения хi с одной и тоже плотностью вероятностей f(x), являющейся плотностью вероятностей генеральной совокупности . Тогда выборочное среднее также является случайной величиной , равной Среднее значение генеральной совокупности, из которой производится выборка, будем называть генеральным средним и обозначать mх. При значительном объеме выборки можно ожидать, что выборочное среднее не будет заметно отличаться от генерального среднего. Поскольку выборочное среднее является случайной величиной, то для нее можно найти математическое ожидание: 1/6 Лекция №7. Числовые характеристики выборки Таким образом, математическое ожидание выборочного среднего равно генеральному среднему . В этом случае говорят, что выборочное среднее является н есмещенной оценкой генерального среднего. В дальнейшем мы вернемся к этому термину. Так как выборочное среднее является случайной величиной, флуктуирующей вокруг генерального среднего, то желательно оценить эту флуктуацию с помощью дисперсии выборочного среднего. Рассмотрим выборку, объем которой n значительно меньше объема генеральной совокупности N ( n << N ). Предположим, что при формировании выборки характеристики генеральной совокупности не меняются, что эквивалентно предположению N = ¥. Тогда Случайные величины Хi и Xj (i¹j) независимы, следовательно, Подставим полученный результат в формулу для дисперсии: , где 2/6 Лекция №7. Числовые характеристики выборки выборочного – дисперсия среднего генеральной совокупности. Тогда среднее квадратическое отклонение равно: . Из этой формулы выборочного около среднего следует, что генерального с увеличением уменьшаются объема выборки как флуктуации среднего . Проиллюстрируем математическим ожиданием сказанное и дисперсией, примером. Пусть соответственно имеется случайный равными mx сигнал = 10,с =Отсчеты 9. сигнала берутся в равноотстоящие моменты времени t1, t2, ... , tn. Так являются случайными величинами, будем их обозначать X(t1), X(t2) , ... , как отсчеты X(tn). Поскольку математического Определим количество ожидания отсчетов, сигнала не превысило среднее квадратическое 1%то его математического отклонение ожидания. оценки mx=10, то нужно, чтобы чтобы С другой стороны поэтому или Отсюда получаем, что n ³ 900 отсчетов. 7.2. Выборочная дисперсия По выборочным данным важно знать не только выборочное среднее, но и разброс выборочных значений около выборочного среднего. Если выборочное среднее является 3/6 Лекция №7. Числовые характеристики выборки оценкой (приближенным значением) генерального среднего, то выборочная дисперсия должна быть оценкой генеральной дисперсии. Выборочная дисперсия для выборки, состоящей из случайных величин , определяется следующим образом: Используя это представление выборочной дисперсии, найдем ее математическое ожидание Таким образом, мы получили, что . Это значит, что выборочная дисперсия является смещенной оценкой генеральной дисперсии. Чтобы получить несмещенную оценку, нужно величину умножить на тогда и выборочная дисперсия принимает вид: 4/6 Лекция №7. Числовые характеристики выборки = Итак, мы получили следующий результат. Если в результате n независимых измерений случайной величины Х с неизвестным математическим ожиданием и дисперсией нам нужно по полученным данным определить эти параметры, то следует пользоваться такими оценками: В случае, если известно математическое ожидание генеральной совокупности mx, то выборочную дисперсию следует вычислять по формуле = которая также является несмещенной оценкой. Относительной оценкой степени разброса случайной величины Х по отношению к выборочному среднему является коэффициент вариации V статистического распределения выборки : . Часто по выборочным данным нужно знать оценки таких параметров генеральной совокупности как: центрального (начального) момента k – го порядка, коэффициента асимметрии As, эксцесса Ех. Выборочным центральным (начальным) моментом k – го порядка ( )называют величину ( ) Для оценки отклонения статистического распределения выборки от нормального 5/6 Лекция №7. Числовые характеристики выборки распределения используют числовые характеристики - выборочный коэффициент асимметрии и выборочный эксцесс . Выборочным коэффициентом называют число, которое вычисляется по формуле: . Выборочным эксцессом статистического распределения называют число . Заметим, что представленные формулы записаны с использованием статистического ряда. В случае интервального вариационного ряда эти формулы преобразуются путем введения весов, равных частоте появления варианты хj. Эти характеристики называются взвешенными числовыми характеристиками. Так взвешенный центральный ( начальный ) момент k – го порядка будет иметь вид: ( ), где nj – частота варианты xj ( ) 6/6