3.1. Основные понятия

реклама
3.1. Основные понятия
Пусть требуется изучить некоторую совокупность однородных объектов
относительно качественного или количественного признака, характеризующего
эти объекты. В большинстве случаев обследование каждого из объектов
совокупности относительно интересующего нас признака не проводится;
совокупность может содержать слишком много элементов и поэтому сплошное
обследование невозможно. В некоторых случаях обследование связано с
уничтожением объекта – в этом случае сплошное обследование бессмысленно.
В подобной ситуации пользуются выборочным методом, при котором из
совокупности выбирают ограниченное число объектов и их подвергают
изучению. Сразу же возникает вопрос, насколько результаты такого
обследования будут справедливы для всей совокупности.
Назовём множество всех изучаемых объектов генеральной
совокупностью, а их число N
– объёмом генеральной
совокупности. Выборочной совокупностью, или кратко выборкой,
назовём объекты, отобранные для исследования из генеральной
совокупности, а их число n – объёмом выборки.
Для того, чтобы по данным выборки можно было достаточно уверенно
судить об интересующем нас признаке генеральной совокупности, необходимо,
чтобы объекты выборки правильно его представляли. Кратко это требование
звучит так – выборка должна быть репрезентативной (представительной), для
чего каждый из её объектов должен быть отобран из генеральной совокупности
случайным образом, то есть все объекты генеральной совокупности случайных
объектов должны иметь одинаковую вероятность попасть в выборку.
Существуют
специальные
приёмы
отбора,
обеспечивающие
репрезентативность выборки и мы будем в дальнейшем предполагать, что это
требование выполнено.
n,
Пусть из генеральной совокупности извлечена выборка объёмом
причём, количественный признак величины x1 наблюдался n1 раз,…, xk
наблюдался nk раз.
Наблюдаемые значения количественного признака xi называются
вариантами, а последовательность вариант, записанных в
порядке возрастания – вариационным рядом. Число наблюдений
значения признака xi , то есть ni называется частотой, а  i –
отношение ni к объёму выборки n – относительной частотой
При этом справедливы соотношения
n
 ni  n;
i 1
n
n
i  i ;
n
 i  1.

i 1
(3.1)
Соответствие между вариантами, записанными в порядке возрастания, и
относительными частотами называется статистическим (эмпирическим)
распределением выборки.
Нетрудно
заметить
полную
аналогию
между
статистическим
распределением выборки и законом распределения дискретной случайной
величины, но в данном случае вместо возможных значений случайной
величины фигурируют варианты, а вместо соответствующих вероятностей –
относите5льные частоты. В силу этой аналогии по известному эмпирическому
распределению можно по тем же формулам, что и для дискретного
распределения, найти выборочные аналоги математического ожидания и
дисперсии.
Если обозначить n  x  число вариант, меньших x , то относительная частота
  x  n  . При изменении x будет меняться и
   x  . Эту зависимость назовём эмпирической
события   x будет равна 
относительная частота
n x
функцией распределения:
F *  x     x  
n  x
.
n
(3.2)
В отличии от эмпирической функции распределения F *  x  функцию
F  x  называют теоретической
функцией распределения. Различие заключается в том, что F  x  определяет
распределения генеральной совокупности
вероятность события   x , а F *  x  – его относительную частоту. Из теоремы
Бернулли следует, что относительная частота
   x  , то есть значение
F *  x  эмпирической функции распределения, стремится по вероятности к
p   x  – значению теоретической функции распределения при увеличении
объёма выборки n . Полученные из эксперимента эмпирическая функция
распределения и её числовые характеристики определяются по данным
выборки и, естественно, для различных выборок будут как-то отличаться друг
от друга. Задача заключается в том, чтобы по полученному
экспериментальному материалу сделать выводы о виде и значениях числовых
параметров теоретического распределения. Мы ограничимся случаем, когда
известен вид теоретического распределения, но не известны и подлежат
определению параметры распределения.
Скачать