Загрузил Андрей Ишпахтин

APPR LR Kantor 2023 03 12

реклама
МИНИСТЕРСТВО НАУКИ И ВЫСШЕГО ОБРАЗОВАНИЯ
РОССИЙСКОЙ ФЕДЕРАЦИИ
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ОБРАЗОВАТЕЛЬНОЕ
УЧРЕЖДЕНИЕ ВЫСШЕГО ОБРАЗОВАНИЯ
«УФИМСКИЙ ГОСУДАРСТВЕННЫЙ
НЕФТЯНОЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ»
КАФЕДРА «КОРПОРАТИВНЫЕ ФИНАНСЫ И УЧЕТНЫЕ ТЕХНОЛОГИИ»
АНАЛИТИЧЕСКАЯ ПОДДЕРЖКА
ПРИНЯТИЯ УПРАВЛЕНЧЕСКИХ РЕШЕНИЙ
учебно-методическое пособие по выполнению лабораторных работ
для всех форм обучения по направлению подготовки
09.04.01 «Информатика и вычислительная техника»
УФА 2023
Учебно-методическое пособие предназначено для выполнения лабораторных
работ по дисциплине «Аналитическая поддержка принятия управленческих
решений» для студентов, обучающихся по направлению 09.04.01 «Информатика и
вычислительная техника».
Публикуется в авторской редакции.
Составитель: Кантор О.Г., д-р физ.-мат. наук,
профессор кафедры «Корпоративные финансы и учетные технологии»
Рецензенты: Руднева О.Р., канд. экон. наук, доцент кафедры «Корпоративные финансы и учетные
технологии»
2
СОДЕРЖАНИЕ
Лабораторная работа № 1. «Методы предварительного анализа исходных данных» . 4
Лабораторная работа № 2. «Моделирование случайных величин» ............................... 9
Лабораторная работа № 3. «Проверка соответствия выборки нормальному закону
распределения» .................................................................................................................. 15
Лабораторная работа № 4. «Проверка гипотезы о показательном распределении
генеральной совокупности» ............................................................................................. 20
Лабораторная работа № 5. «Построение доверительных интервалов» ....................... 21
Лабораторная работа № 6. «Расчет показателя VaR методом исторического
моделирования» ................................................................................................................. 26
Лабораторная работа № 7. «Дисперсионный анализ» ................................................... 29
Лабораторная работа № 8. «Многомерные статистические методы: кластерный
анализ» ................................................................................................................................ 31
Приложение 1 .................................................................................................................... 32
Приложение 2 .................................................................................................................... 33
УЧЕБНО-МЕТОДИЧЕСКОЕ И ИНФОРМАЦИОННОЕ ОБЕСПЕЧЕНИЕ
ДИСЦИПЛИНЫ ................................................................................................................ 34
3
Лабораторная работа № 1. «Методы предварительного
анализа исходных данных»
Задание:
Провести первичную обработку имеющихся опытных данных с целью изучения
свойств случайной величины Х.
По имеющимся данным построить:
– сгруппированную выборку;
– вариационный ряд;
– гистограмму частот;
– эмпирическую функцию распределения.
Вариант 1
0,83
0,43
0,07
0,13
0,64
0,13
0,96
0,49
0,60
0,29
0,27
0,29
0,67
0,42
0,79
0,63
0,01
0,27
0,66
0,40
0,78
0,34
0,70
0,95
0,79
0,54
0,92
0,07
0,65
0,63
0,25
0,97
0,18
0,45
0,85
0,14
0,73
0,84
0,18
0,25
0,97
0,90
0,83
0,95
0,21
0,81
0,03
0,11
0,27
0,98
0,24
0,39
0,95
0,16
0,25
0,85
0,32
0,46
0,86
0,55
0,67
0,13
0,94
0,61
0,13
0,08
0,22
0,58
0,97
0,21
0,95
0,70
0,58
0,03
0,44
0,16
0,82
0,84
0,10
0,44
0,26
0,82
0,16
0,05
0,83
0,84
0,39
0,61
0,07
0,23
0,32
0,37
0,07
0,21
0,90
0,30
0,07
0,78
0,30
0,10
35,74
17,12
44,36
36,61
1,58
31,88
25,80
21,57
28,04
34,15
43,70
49,32
19,95
10,06
6,33
39,90
48,26
8,68
32,07
26,50
13,42
14,19
32,21
27,65
11,69
16,81
24,32
48,82
16,69
36,09
46,14
25,82
15,70
6,21
30,19
44,57
20,76
35,28
36,90
11,86
45,16
33,33
4,74
6,03
18,30
13,64
12,71
20,85
47,46
42,13
7,82
17,92
34,80
42,55
25,72
12,70
26,50
23,48
2,57
39,09
13,76
23,59
5,79
28,21
35,25
45,79
44,78
36,01
15,25
30,08
Вариант 2
20,94
21,05
49,86
1,11
23,79
42,61
45,82
26,53
25,52
9,64
34,94
8,81
12,97
7,78
26,60
5,44
21,34
12,01
45,40
4,94
5,99
49,62
13,17
22,14
17,97
7,63
21,22
36,67
39,09
4,63
4
Вариант 3
31,84
20,70
34,83
37,82
33,73
41,67
39,93
21,07
34,50
30,29
23,11
39,38
20,41
29,92
19,27
35,55
35,37
18,94
22,55
34,81
39,37
34,37
41,21
27,63
33,90
27,67
18,00
30,89
32,81
32,48
21,89
39,09
32,34
31,01
36,56
21,89
32,60
25,04
41,46
34,66
36,02
27,75
23,68
37,75
32,56
19,61
35,77
27,77
30,54
32,33
38,64
42,25
42,33
39,22
30,56
30,12
35,05
24,19
37,37
41,23
18,99
42,32
37,91
23,00
28,98
33,98
36,65
32,24
19,64
36,43
36,81
27,53
20,91
29,79
18,90
31,39
31,64
32,10
35,52
34,40
33,21
24,50
40,46
34,91
37,38
30,74
26,85
23,61
34,75
41,32
40,80
41,78
39,39
17,77
26,26
31,03
30,33
22,64
41,96
30,08
52,06
96,09
50,86
73,94
63,85
92,58
76,12
84,33
96,71
67,38
50,50
90,50
94,54
97,71
57,19
81,93
56,30
83,95
74,46
55,96
54,79
77,51
93,37
77,76
52,66
62,69
50,86
84,61
51,41
69,05
70,93
90,55
91,06
59,25
99,88
93,29
53,62
50,30
62,96
95,34
95,86
93,65
54,86
74,94
72,38
91,98
52,81
86,60
89,43
52,91
76,03
91,88
71,81
61,25
67,49
72,96
57,23
93,31
81,29
85,08
99,40
87,52
68,79
60,81
88,11
94,74
57,04
85,37
87,03
63,84
66,17
95,71
76,17
62,26
69,58
55,03
94,40
86,82
81,82
59,89
90,39
98,95
71,49
80,58
62,77
31,36
93,26
105,61
62,43
100,48
74,01
116,55
81,31
97,60
48,69
37,56
26,91
51,01
68,76
54,31
59,82
34,80
103,99
105,88
27,94
49,20
103,70
54,11
102,70
94,64
87,87
86,72
115,13
79,39
97,51
40,90
71,29
121,13
97,36
102,40
45,55
92,40
51,41
37,45
82,28
95,92
63,47
110,81
120,47
113,60
66,22
71,02
92,11
98,18
89,83
43,63
102,02
103,69
38,40
73,37
98,09
119,97
70,31
78,90
86,73
104,96
118,01
96,21
122,14
103,86
69,88
98,03
38,92
91,91
111,90
37,77
117,68
120,92
78,79
96,43
Вариант 4
87,61
77,32
64,40
59,03
77,13
66,17
50,13
94,73
58,64
83,08
94,05
76,38
84,87
67,06
92,64
89,56
99,10
81,34
64,35
55,23
Вариант 5
119,71
28,13
60,09
118,64
27,53
104,31
98,43
38,45
41,08
122,36
46,51
46,83
44,14
70,30
54,42
26,30
41,78
45,02
80,03
74,66
5
МЕТОДИЧЕСКИЕ РЕКОМЕНДАЦИИ ПО ВЫПОЛНЕНИЮ ЗАДАНИЯ
Имеются следующие данные:
16,33
14,34
15,98
15,01
10,12
15,06
14,38
15,69
19,91
17,59
11,26
17,01
13,29
11,51
17,48
19,01
16,22
15,05
18,74
19,29
13,55
12,61
10,72
13,06
15,34
14,23
11,85
12,71
19,98
10,97
16,08
15,77
13,46
18,30
15,71
16,53
17,21
18,77
19,34
13,47
14,41
14,67
17,22
18,27
14,97
14,53
16,81
17,54
15,09
13,76
16,68
10,88
13,67
13,41
17,29
11,89
17,03
18,40
19,63
15,35
19,63
19,23
10,92
13,96
15,59
15,04
14,25
14,23
14,79
15,16
14,48
16,53
18,67
19,08
16,98
12,66
15,42
13,08
16,77
16,81
17,88
13,27
13,22
12,69
10,27
14,49
18,41
12,39
14,89
15,09
19,70
14,03
11,49
10,93
16,24
11,78
14,65
16,02
19,11
17,51
Внесем массив данных в лист Excel, он займет диапазон А1:J10. Определим
объем выборки n (=СЧЁТ(значение1; значение2; ...)), минимальное
(=МИН(число1, [число2],...)) и максимальное (=МАКС(число1, [число2],...))
значения в выборке. Для построения группированной выборки вычислим число
интервалов k по формуле Стерджесса:
k = 1 + 3,322lg(n) = 1 + 3,322lg(100) = 7,644 ≈ 8,
Для этого в ячейку В14 введем формулу =ОКРУГЛ(1+3,322*LOG10(B11);0).
Для расчета длины интервала d вычислим размах выборки как разницу между
наибольшим и наименьшим значением. Длина интервала рассчитывается в ячейке
В16, по формулу =(В15)/B14 (рисунок 1).
Рисунок 1 – Расчет длины интервала d
6
Зададим массив интервалов, указывая для каждого из 8 интервалов верхнюю
границу. Для этого в ячейке D13 вычислим верхнюю границу первого интервала,
введя формулу =B12+B16; в ячейке D14 верхнюю границу второго интервала,
введя формулу =D13+B16. Для вычисления оставшихся значений верхних границ
интервалов зафиксируем номер ячейки В16 в введенной формуле при помощи
знака $, так что формула в ячейке D15 примет вид =D14+$B$16, и скопируем
содержимое ячейки D15 в ячейки Е16-Е20. Последнее полученное значение равно
вычисленному ранее в ячейке В13 максимальному значению в выборке.
Теперь заполним массив «карманов» при помощи функции ЧАСТОТА. Для
этого выделим столбец частот, введем формулу =ЧАСТОТА(А1:J10;D12:D17) и
нажмем сочетание клавиш CTRL+SHIFT+ENTER (рисунок 2).
Рисунок 2 – Вариационный ряд и гистограмма
По полученному вариационном ряду построим гистограмму: выделим столбец
частот и выберем на вкладке «Вставка» «Гистограмма». Получив гистограмму,
изменим в ней подписи горизонтальной оси на значения в диапазоне интервалов,
для этого выберем опцию «Выбрать данные» вкладки «Конструктор». В
появившемся окне выберем команду «Изменить» для раздела «Подписи
горизонтальной оси» и введем диапазон значений варианты, выделив его
«мышью» (рисунок 2).
7
Для построения эмпирической функции распределения рассчитаем в столбце
F накопленные относительные частоты (рисунок 2). Эмпирическая функция
распределения примет вид:
Построим на графике эмпирическую функцию распределения (рисунок 3):
1
0,9
0,8
0,7
0,6
0,5
0,4
0,3
0,2
0,1
0
Рисунок 3 – Эмпирическая функция распределения
8
Лабораторная работа № 2. «Моделирование случайных
величин»
Задание:
Смоделировать реализацию случайной величины, распределенную:
1) равномерно в интервале (а, b);
2) по закону Пуассона с параметром λ;
3) по экспоненциальному закону с параметром θ;
4) по нормальному закону с параметрами Mx,  x .
Вариант
1
2
3
4
5
6
7
8
9
10
равномерное
а
b
2
3
4
5
6
7
8
9
10
11
30
29
28
27
26
25
24
23
22
20
Распределение
Пуассона
экспоненциальное
λ
θ
1,1
1,2
1,3
1,4
1,5
1,6
1,15
1,25
1,35
1,45
0,6
0,7
0,5
0,4
0,65
0,75
0,45
0,55
0,35
0,3
нормальное
Мх

x
0,2
0,3
0,25
0,35
0,4
0,2
0,3
0,25
0,35
0,4
0,3
0,4
0,3
0,4
0,5
0,35
0,45
0,4
0,45
0,45
1. Сгенерировать по 30 случайных величин для каждого типа распределения.
2. Рассчитать математические ожидания и дисперсии сгенерированных
случайных величин. Сравнить их с теоретическими значениями (таблица 1):
Таблица 1 – Параметры теоретических распределений
Распределение
Равномерное
Пуассона
Математическое
ожидание
Дисперсия
ba
2
b  a 2


2
9
График плотности
распределения вероятностей
Распределение
Экспоненциальное
Нормальное
Математическое
ожидание
1
Дисперсия

1
2
Мх
 x2
График плотности
распределения вероятностей
3. Построить гистограмму относительных частот, воспользовавшись методом
обработки данных, аналогично тому, который применялся в лабораторной работе 1.
(Число разбиений интервала значений случайной величины принять равным 6-ти.).
Сделать вывод о степени соответствия расчетных значений теоретическим.
4. Повторить задания 1-3 при увеличении количества сгенерированных
значений случайных величин до 100.
5. Сравнить полученные результаты для выборок различного объема. Сделать
вывод.
10
МЕТОДИЧЕСКИЕ РЕКОМЕНДАЦИИ ПО ВЫПОЛНЕНИЮ ЗАДАНИЯ
Пусть даны следующие параметры распределений:
Распределение
Параметры
Значения
параметров
Равномерное
а
b
5
15
Пуассоновское
λ
Экспоненциальное
θ
1,55
0,25
Нормальное
x
Мх
0,15
0,2
1. Для генерации случайных величин воспользуемся Microsoft Excel.
Значения случайной величины, распределенной равномерного в пределах (a, b),
определяется с помощью функции СЛЧИС()*(b-a)+a. В нашем случае
СЛЧИС()*10+5.
Для построения случайной величины, распределенной по закону Пуассона с
параметром λ, воспользуемся Пакетом «Анализ данных» в MS Excel. В открывшемся
окне выбираем Генерация случайных чисел, задаем Распределение: Пуассона, число
переменных: 1, число случайных чисел: 30, Лямбда: 1,55. Также укажем выходной
интервал.
Для экспоненциального распределения случайное число определяется
с
помощью функции -1/λ*ln(СЛЧИС()), в нашем случае -1/0,25*ln(СЛЧИС()).
Для построения нормального распределения также воспользуемся «Анализом
данных». В открывшимся окне в качестве распределения выберем Нормальное, в
качестве параметров  Среднее: Значение 0,15. Стандартное отклонение 0,2.
2.
Математическое ожидание полученной случайной величины оцениваем
как среднее значение случайных чисел: СРЗНАЧ(число1;число2;...). Дисперсия
полученной случайной величины рассчитывается с помощью функции
ДИСП(число1;число2;...).
Результаты этапа 1 и частично этапа 2 представлены на рисунке 4.
На основании представленных ниже данных можно сделать вывод, что
сгенерированные выборки не обеспечивают хорошего соответствия теоретических и
расчетных значений числовых характеристик исследуемых распределений.
Распределение
Равномерное
Пуассона
Экспоненциальное
Нормальное
Математическое ожидание
теоретическое
расчетное
10
10,027
1,55
1,133
4
4,104
0,15
0,190
11
Дисперсия
теоретическая
50
1,55
16
0,04
расчетная
9,367
0,947
14,537
0,035
Рисунок 4 – Моделирование случайных величин
3. Построим гистограммы относительных частот. Выявленное несоответствие
на втором этапе проявилось и при анализе графиков относительных частот (рисунки
58), вид которых только для распределения Пуассона и экспоненциального
распределения идентичен графикам теоретических функций плотностей
распределения.
12
Рисунок 5 – Равномерное распределение при a = 5, b = 15.
Рисунок 6 – Распределение Пуассона при λ = 1,55.
Рисунок 7 – Экспоненциальное распределение при θ = 0,25.
13
Рисунок 8 – Нормальное распределение при Мх = 0,15 и  x = 0,2.
4. Проделать действия, аналогичные перечисленным выше, для объемов
выборок 100.
5. Сделать выводы (самостоятельно).
14
Лабораторная работа № 3. «Проверка соответствия выборки
нормальному закону распределения»
Задание:
На основе собранных или предоставленных данных выполнить следующее:
1) построить
эмпирическую (полигон) и теоретическую (нормальную)
кривые распределения.
2) проверить согласованность эмпирического распределения с теоретическим
нормальным, применяя критерии:
а) критерий Пирсона;
б) критерий Романовского
в) один из критериев: Колмогорова (чѐтный вариант), Ястремского (нечѐтный)
г) приближенный критерий.
Сделать вывод по результатам работы.
МЕТОДИЧЕСКИЕ РЕКОМЕНДАЦИИ ПО ВЫПОЛНЕНИЮ ЗАДАНИЯ
Эмпирическая кривая распределения представляет собой полигон частот
(𝑥𝑖 , 𝑛𝑖 ).
Для построения теоретической (нормальной кривой) найти координаты точек
′
(𝑥𝑖 , 𝑛𝑖 ), для чего рассчитать теоретический частоты 𝑛𝑖′ , пользуясь таблицей значений
𝜑(𝑢𝑖 ) (приложение 1). Для удобства все расчеты свести в таблицу 2.
Таблица 2 – Структура данных для определения теоретических значений нормальной
кривой
𝑥𝑖
𝑛𝑖
𝑥𝑖 − 𝑥
…
…
…
𝑥𝑖 − 𝑥
𝑆
…
𝜑(𝑢𝑖 )
𝑢𝑖 =
…
𝑦𝑖 =
𝑛ℎ
𝜑(𝑢𝑖 )
𝑆
…
𝑛𝑖′
…
На основании построенных графиков сделать выводы о распределении
выборки.
15
Для вычисления теоретических частот составить таблицу 3.
Таблица 3 – Структура данных для определения теоретических частот
𝑥𝑖
𝑛𝑖
𝑥𝑖 − 𝑥
…
…
…
𝑥𝑖 − 𝑥
𝑆
…
𝜑(𝑢𝑖 )
𝑢𝑖 =
…
𝑛𝑖′ =
𝑛ℎ
𝜑(𝑢𝑖 )
𝑆
…
Полученные частоты 𝑛𝑖′ округлить до целых.
2
3. Вычислить величину 𝜒 по формуле
χ 2набл 
Расчеты свести в таблицу 4.
16
n  n 

' 2
i
i
n'i
и обозначить ее 𝜒02 .
Таблица 4 – Структура данных для определения критерия 𝜒02
𝑛𝑖
𝑛𝑖′
𝑛𝑖 −
…
…
…
𝑛𝑖′
(𝑛𝑖 − 𝑛𝑖′ )2
…

(𝑛𝑖 − 𝑛𝑖′ )2
𝑛𝑖′
…
𝜒02 =
4. Найти число степеней свободы k (параметр распределения Пирcона) по формуле
𝑘 = 𝑠 − 𝑟 = 𝑠 − 3, где s — число интервалов вариационного ряда, r — сумма числа
параметров теоретического закона распределения. Для нормального распределения
признака Х принято 𝑟 = 3 (учитываются параметры нормального распределения 𝑀𝑥 ,
𝜎 , а также объем выборки n).
5. Выбрать уровень значимости .
6. По найденному числу степеней свободы k и уровню значимости , пользуясь
2
таблицей значений (Приложение 2), определить значение
𝜒кр
. Если
2
𝜒02 < 𝜒кр
, то нет достаточных оснований отвергнуть выдвинутую гипотезу о
нормальном распределении признака X. В противном случае гипотеза о нормальном
распределении признака X отвергается.
Критерий Романовского
Для оценки близости эмпирического распределения признака Х к нормальному
теоретическому Романовский предложил вычислять отношение:
|
𝜒2 − 𝑘
√2𝑘
|,
𝜒 2 – статистика критерия Пирсона, используя опытные данные, 𝑘 = 𝑠 − 3 – число
степеней свободы. Если указанное отношение по модулю меньше трех, то
расхождение между теоретическим и эмпирическим распределениями считается
несущественным, т.е. можно принять, что данное эмпирическое распределение
моделируется нормальным распределением. Если отношение больше трех, нет
оснований считать, что эмпирическое распределение признака Х подчиняется
нормальному закону распределения.
Критерий Колмогорова
Критерий Колмогорова в своем классическом виде является более мощным, чем
критерий Пирсона, и может быть использован для проверки гипотезы о соответствии
эмпирического
распределения
любому
теоретическому
непрерывному
распределению F(x) с заранее известными параметрами. Однако параметры функции
распределения F(x), как правило, нам неизвестны, и их оценка производится по
данным самой выборки. Это обстоятельство накладывает ограничения на
возможность широкого практического применения критерия: он может быть
использован только для проверки соответствия опытных данных лишь некоторым
конкретным функциям распределения. Для проверки соответствия эмпирического
17
распределения теоретическому нормальному распределению критерий Колмогорова
применяют следующим образом.
Вычисляется статистика  критерия Колмогорова по формуле:
 = 𝐷⁄ ,
√𝑛
где 𝐷 = max|𝑀 − 𝑀′| – максимум абсолютного значения разности между
накопленными эмпирическими частотами M и накопленными теоретическими
частотами 𝑀′, n – объем выборки.
По вычисленному  находят значение вероятности того, что параметр  примет
расчетное значение:
∞
𝐾() = 1 − ∑(−1)𝑘 𝑒 −2𝑘
−∞
2 2
.
Если 𝐾() < 0,05, то имеет место существенное расхождение между
эмпирическим и теоретическим распределениями, которое нельзя считать
случайным. Следовательно, рассматриваемая выборка не может быть смоделирована
нормальным законом распределения. Если вероятность 𝐾() > 0,05, то расхождение
между частотами может быть случайным, и распределения хорошо соответствуют
одно другому.
Значения 𝐾() находят по таблице 5.
Таблица 5 – Таблица значений функции 𝐾()
18
Критерий Ястремского
Для проверки соответствия данной выборочной совокупности признака X
нормальному распределению составляется неравенство:
𝐽 ≤ √2𝑙 + 4𝑄,
где 𝐽 = |𝑐 − 𝑙|
(𝑛𝑖 − 𝑛𝑖′ )2
𝑐=∑
,
𝑛𝑖′ 𝑞𝑖′
𝑛𝑖
𝑞𝑖′ = 1 − 𝑝𝑖′ = 1 −
𝑛
𝑛𝑖 – эмпирические частоты
𝑛𝑖′ – теоретические частоты
l – число столбцов дискретного вариационного ряда
n – объем выборки.
Если 𝑙 < 20, то 𝑄 = 0,6.
Если неравенство 𝐽 ≤ √2𝑙 + 4𝑄 выполняется, то гипотеза
о
близости
эмпирического распределения признака Х к нормальному закону распределения
принимается. В противном случае расхождения между эмпирическим и
теоретическим распределениями признаются существенными. В этом случае данные
выборки не будут подчиняться нормальном закону распределения.
Для проведения вычислений по критерию Ястремского составить таблицу 6.
Таблица 6 – Структура данных для определения теоретических частот
𝑥𝑖
𝑛𝑖
…
…
𝑛𝑖′
𝑝𝑖′
𝑞𝑖′
𝑛𝑖 − 𝑛𝑖′
(𝑛𝑖 − 𝑛𝑖′ )2
𝑛𝑖′ 𝑞𝑖′
…
…
…
…
…

(𝑛𝑖 − 𝑛𝑖′ )2
𝑛𝑖′ 𝑞𝑖′
…
c=
Приближенные критерии нормальности распределения
Для проверки гипотезы о соответствии данной выборки нормальному закону
распределения используют выборочные статистики: асимметрию (𝐴𝑆 ) и эксцесс (𝐸𝑥 ).
вычисляют
средние квадратические
отклонения
по формулам:
ЗатемЗатем
вычисляют
ихихсредние
квадратические
отклонения
по формулам:
6n 1
SA 
;
s
n 1n  3
S E 
x
24nn  2n  3
.
n 12 n  3n  5
Если |𝐴𝑆 | < 𝑆𝐴𝑥 и |𝐸𝑥 | < 𝑆𝐸𝑥 , то выборочная совокупность подчиняется
нормальному закону распределения. Если асимметрия и эксцесс заметно больше
своих средних квадратических отклонений, то выборочная совокупность не будет
распределена по нормальному закону.
19
Лабораторная работа № 4. «Проверка гипотезы о
показательном распределении генеральной совокупности»
Задание:
На основе собранных или предоставленных данных выполнить следующее:
1) построить эмпирическую и теоретическую кривые распределения.
2) проверить согласованность эмпирического распределения с теоретическим
показательным.
Сделать вывод по результатам работы.
МЕТОДИЧЕСКИЕ РЕКОМЕНДАЦИИ ПО ВЫПОЛНЕНИЮ ЗАДАНИЯ
Пусть задано эмпирическое распределение непрерывной случайной величины
Х в виде последовательности интервалов 𝑥𝑖 − 𝑥𝑖+1 и соответствующих им частот 𝑛𝑖 ,
причем ∑ 𝑛𝑖 = 𝑛 (объем выборки). Требуется, используя критерий Пирсона,
проверить гипотезу о том, что случайная величина Х имеет показательное
распределение.
Для того чтобы при уровне значимости 𝛼 проверить гипотенузу о том, что
непрерывная случайная величина распределена по показательному закону, надо:
1. Найти по заданному эмпирическому распределению выборочную среднюю
𝑥̅в . Для этого, приняв в качестве «представителя» 𝑖 − го интервала его середину 𝑥𝑖∗ =
(𝑥𝑖 + 𝑥𝑖+1 )/2 , составляют последовательность равноотстоящих вариант и
соответствующих им частот.
2. Принять в качестве оценки параметра λ показательного распределения
величину, обратную выборочной средней:
𝜆∗ = 1/𝑥̅в .
3. Найти вероятности попадания X в частичные интервалы (𝑥𝑖 , 𝑥𝑖+1 )
формуле
по
𝑃𝑖 = 𝑃(𝑥𝑖 < 𝑋 < 𝑥𝑖+1 ) = 𝑒 −𝜆𝑥𝑖 − 𝑒 −𝜆𝑥𝑖+1 .
4. Вычислить теоретические частоты:
где 𝑛 = ∑ 𝑛𝑖 − объем выборки.
𝑛́𝑖 = 𝑛𝑖 × 𝑃𝑖 ,
5. Сравнить эмпирические и теоретические частоты с помощью критерия
Пирсона, приняв число степеней свободы 𝑘 = 𝑠 − 2 , где s – число первоначальных
интервалов выборки. Если было произведено объединение малочисленных частот,
следовательно, и самих интервалов, то s – число интервалов, оставшихся после
объединения.
20
Лабораторная работа № 5. «Построение доверительных интервалов»
Задание:
На основе собранных или предоставленных данных выполнить следующее:
1) определить описательные статистики посредством функции Пакет анализа
программы Excel, интерпретировать полученные результаты;
2) рассчитать границы доверительных интервалов с различным уровнем
значимости α для основных числовых характеристик.
МЕТОДИЧЕСКИЕ РЕКОМЕНДАЦИИ ПО ВЫПОЛНЕНИЮ ЗАДАНИЯ
В статистике существует два вида оценок: точечные и интервальные.
Точечная оценка представляет собой отдельную выборочную статистику,
которая используется для оценки параметра генеральной совокупности.
Например, выборочное среднее ̅
Х — это точечная оценка математического
ожидания генеральной совокупности, а выборочная дисперсия S2 — точечная оценка
дисперсии генеральной совокупности.
Доверительным интервалом называется интервал, построенный с помощью
случайной выборки из распределения с неизвестным параметром, такой, что он
содержит данный параметр с заданной вероятностью P.
Интервальная оценка математического ожидания генеральной совокупности,
доверительный уровень которой равен 95%, интерпретируется следующим образом:
если из генеральной совокупности извлечь все выборки, имеющие объем n, и
вычислить их выборочные средние, то 95% доверительных интервалов, построенных
на их основе, будут содержать математическое ожидание генеральной совокупности,
а 5% - нет.
В некоторых ситуациях желательно иметь более высокий доверительный
уровень, а, следовательно, точность оценки величины ц (например, 99%). Но иногда
можно ограничиться и менее точной оценкой (например, 90%).
Как правило, доверительный уровень обозначают (1-α)*100%, где величина α
представляет собой площадь, ограниченную хвостом распределения, выходящим за
пределы доверительного интервала.
Величину α называют уровнем значимости доверительного интервала. Кроме
того, в качестве синонима для доверительного уровня иногда употребляется
выражение «доверительная вероятность».
Площади, ограниченные как левым, так и правым хвостами распределения,
выходящими за пределы доверительного интервала, равны α/2.
Построение доверительного интервала для математического ожидания
генеральной совокупности при известном стандартном отклонении:
𝑋̅ − 𝑍
𝜎
√𝑛
≤ µ ≤ 𝑋̅ + 𝑍
𝜎
√𝑛
,
где Z — значение стандартизованной нормально распределенной случайной
величины, соответствующее интегральной вероятности, равной 1-α/2, σ – стандартное
отклонение генеральной совокупности.
21
Построение доверительного интервала для математического ожидания
генеральной совокупности при неизвестной дисперсии:
𝑋̅ − 𝑡𝑛−1
𝜎
√𝑛
≤ µ ≤ 𝑋̅ + 𝑡𝑛−1
𝜎
√𝑛
,
где 𝑡𝑛−1 — критическое значение t-распределения с n - 1 степенями свободы,
соответствующее площади, ограниченной правым хвостом и равной α/2.
Определение объема выборки проводится по формуле:
𝑍2𝜎 2
𝑛= 2 ,
𝑒
где е – ошибка выборочного исследования.
Вычисление доверительного интервала с использованием функции «Анализ
данных», режима работы «Описательная статистика»
Пример. Затраты, связанные с изготовлением бракованной продукции по
каждому из цехов предприятия «AA» за 20XX год, приведены в таблице 7.
Необходимо рассчитать основные показатели описательной статистики и
сделать соответствующие выводы.
Таблица 7 – Затраты, связанные с изготовлением бракованной продукции (фрагмент
таблицы Excel)
1
2
3
4
5
6
7
8
9
10
A
В
Затраты, связанные с изготовлением бракованной продукции
по каждому из цехов за 2008 г., тыс. руб.
Цех № 1
389,04
Цех № 2
417,78
Цех № 3
394
Цех № 4
371,96
Цех № 5
525,96
Цех № 6
405,12
Цех № 7
419,52
Цех № 8
401,93
Цех № 9
418,97
Для решения задачи используем режим работы «Описательная статистика».
Показатели, рассчитанные в данном режиме, представим в таблице 8 (результаты
округлены до двух значащих цифр).
22
Таблица 8 – Описательная статистика (фрагмент таблицы Excel)
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
A
Столбец 1
B
Среднее
Стандартная ошибка
Медиана
Мода
Стандартное отклонение
Дисперсия выборки
Эксцесс
Асимметричность
Интервал
Минимум
Максимум
Сумма
Счет
Наибольший (1)
Наименьший (1)
Уровень надежности (95,0 %)
416,0311111
14,71123677
405,12
#Н/Д
44,13371031
1947,784386
6,063066502
2,259263465
154
371,96
525,96
3744,28
9
525,96
371,96
33,9241728
На основании проведенного выборочного обследования и рассчитанных по
данной выборке показателей описательной статистики (таблица 8) с уровнем
надежности 95 % можно предположить, что средние затраты, связанные с
изготовлением бракованной продукции по каждому из цехов предприятия «АА» за
20ХХ год, находились в пределах от 382,11 до 449,95 тыс. руб.
Поясним, на основании каких показателей описательной статистики был
сформирован соответствующий вывод. Такими показателями являются средняя
арифметическая выборки ~x (показатель Среднее в таблице 8) и предельная ошибка
выборки  ~x (показатель Уровень надежности (95,0 %) в таблице 8). Из выражения
для доверительного интервала:
𝑥̃ − ∆𝑥̃ ≤ 𝑥̅ ≤ 𝑥̃ + ∆𝑥̃
находим: 416,03 – 33,92 = 382,11 – левая граница; 416,03 + 33,92 = 49,95 – правая
граница.
Вычисление доверительного интервала для математического ожидания при
известном стандартном отклонении
Чтобы вычислить доверительный интервал для математического ожидания при
известном стандартном отклонении, создадим рабочий лист, использующий
функцию ДОВЕРИТ. Вызов этой функции выглядит следующим образом.
ДОВЕРИТ (1-доверительный уровень, стандартное отклонение; объем
выборки) (рис. 9). Для вычисления нижней и верхней доверительной границы ширина
23
доверительного интервала, возвращаемая функцией ДОВЕРИТ, делится пополам и
прибавляется к выборочному среднему. На листе также продемонстрированы
вычисления стандартной ошибки и величины Z.
Рисунок 9 – Шаблон рабочего листа «Доверительный интервал»
При реализации этого шаблона ячейку В7 следует отформатировать так, чтобы
величина 0,95 была представлена как 95%. В этом случае величина 0,95 будет
представлена как 95%. Если при решении аналогичной задачи выборочное среднее не
известно и подлежит вычислению, необходимо заменить формулу в ячейке В5
формулой =СРЗНАЧ (диапазон).
Вычисление доверительного интервала для математического ожидания при
неизвестном стандартном отклонении
Чтобы вычислить доверительный интервал для математического ожидания при
неизвестном стандартном отклонении, создадим рабочий лист, использующий
функцию СТЬЮДРАСПОБР. Вызов этой функции выглядит следующим образом.
СТЬЮДРАСПОБР (1-доверительный уровень; степени_свободы) (рис. 10). Для
вычисления половины доверительного интервала, содержащего математическое
ожидание, t-значение распределения Стьюдента, возвращаемое функцией
СТЬЮДРАСПОБР, умножается на стандартную ошибку среднего и делится пополам.
24
Рисунок 10 – Шаблон рабочего листа «Доверительный интервал»
Определение объема выборки для математического ожидания генеральной
совокупности
Создадим рабочий лист, использующий функцию НОРМСТОБР для
определения объема выборки, необходимой для вычисления доверительного
интервала, содержащего математическое ожидание генеральной совокупности.
Вызов этой функции имеет вид НОРМСТОБР (вероятность), где аргумент
вероятность представляет собой площадь фигуры, ограниченной кривой
стандартизованного нормального распределения и лежащей левее числа X (рис. 11).
Для вычисления объема выборки, необходимой для вычисления
доверительного интервала, содержащего среднюю сумму накладных, используется
значение Z, возвращаемое функцией НОРМСТОБР. Объем выборки округляется с
помощью функции ОКРУГЛВВЕРХ.
Рисунок 11 – Шаблон рабочего листа «Доверительный интервал»
25
Лабораторная работа № 6. «Расчет показателя VaR методом исторического
моделирования»
Задание:
На основе собранных или предоставленных данных выполнить следующее:
1) построить эмпирическое распределение в табличном и графическом виде;
2) рассчитать 𝑉𝑎𝑅0,99 и 𝑉𝑎𝑅0,95 , дать интерпретацию полученным результатам.
МЕТОДИЧЕСКИЕ РЕКОМЕНДАЦИИ ПО ВЫПОЛНЕНИЮ ЗАДАНИЯ
В качестве меры риска могут быть выбраны квантили – специфические
показатели, в той или иной мере характеризующие возможный ущерб и закон его
распределения.
В общем случае под квантилем, соответствующим доверительной вероятности
α понимается уровень ущерба, вероятность превышения которого равна α
(соответственно вероятность непревышения равна 1  α). Иными словами, квантиль
X   inf x : Fx  1  α, где F    Px    – функция распределения потерь x.
В финансовой сфере при достаточно малых значениях   0,01  0,05 квантили
X  именуют термином VaR (Value at Risk).
К группе финансовых рисков, помимо прочих, относится рыночный риск, под
которым понимается возможность несоответствия (как в одну, так и в другую
стороны) характеристик экономического состояния объекта ожидаемым значениям в
силу воздействия рыночных факторов. Однако в методологии VaR используется
понятие риска, связанное лишь с возможностью неблагоприятных исходов, убытков
и негативных последствий.
Метод VаR используется в качестве основы международными банковскими
организациями (например, BIS) при установлении нормативов величины капитала
банка относительно риска его активов. Методология VaR стала применяться также
для оценки рисков контрагентов и оценки операционных рисков.
Метод VаR был разработан для того, чтобы с помощью одного единственного
числа отобразить информацию о риске портфеля. VaR – (дословно «стоимость под
риском») – выраженная в данных денежных единицах (базовой валюте) оценка
величины, которую не превысят ожидаемые в течение данного периода времени
потери с заданной вероятностью.
Данный показатель позволяет количественно оценить ожидаемые потери в
стоимости актива в нормальных условиях функционирования рынка. В таких
условиях VaR актива для доверительного уровня (1  α) и периода поддержания
позиций t определяется как такое значение, которое обеспечивает покрытие
возможных потерь x держателя портфеля за время t с вероятностью (1  α):
𝑃(𝑉𝑎𝑅 ≥ 𝑥) = 1 − 𝛼.
Как следует из определения, VaR – наибольший ожидаемый убыток,
обусловленный колебаниями цен на финансовых рынках, который рассчитывается:
26
 на определенный период времени в будущем (временной горизонт);
 с заданной вероятностью его непревышения (уровень доверия);
 при данных предположениях о характере поведения рынка (метод расчета).
Доверительный интервал и временной горизонт – ключевые параметры, без
которых невозможен ни расчет, ни интерпретация показателя VaR.
Например, VaR в 10 млн рублей для временного горизонта 1 день и
доверительной вероятности 99% будет означать (при условии сохранения тенденций
рыночной конъюнктуры), что:
 вероятность того, что в течение следующего дня мы потеряем меньше чем 10
млн рублей, составляет 99%;
 вероятность того, что убытки превысят 10 млн рублей составляет 1%;
 убытки, превышающие 10 млн рублей, ожидаются в среднем один раз в 100
дней торгов.
Для расчета VaR необходимо выбрать факторы, которые влияют на уровень
волатильности доходности в торговом или инвестиционном портфеле. Например, в
случае портфеля ценных бумаг факторы риска – это цены на конкретные бумаги,
входящие в портфель. Затем можно использовать эти факторы для получения
распределения ценности портфеля для конкретного временного горизонта риска (или
распределения изменений ценности портфеля). После получения распределения
можно рассчитать среднее и квантили этого распределения для получения VaR
портфеля.
Определив факторы риска, которые приводят к волатильности доходности
портфеля, риск-аналитик должен выбрать соответствующую методологию получения
распределения. Существуют три способа:
1) метод исторического моделирования;
2) аналитический (параметрический) подход;
3) метод моделирования Монте-Карло.
Метод исторического моделирования
Исторический метод заключается в исследовании изменения стоимости такого
портфеля за предыдущий исторический период.
Для вычисления VаR составляется база данных за определенный исторический
период значений цен анализируемого инструмента. После этого вычисляются
изменения цен инструмента за промежуток времени, для которого рассчитывается
VаR. Затем необходимо проранжировать полученные данные, построить гистограмму
распределения изменений стоимости актива и найти значение VаR, соответствующее
выбранному значению вероятности.
Пример 1. Рассчитать однодневный VaR с доверительной вероятностью 99%,
95% для инструмента, по которому имеется информация, приведенная в таблице 9
(строки 1 и 2).
27
Таблица 9 – Данные для примера 1
Однодневный
доход, тыс. у. е.
–15
–14
–10
–8
–6
–4
2
4
6
8
10
Кол-во наблюдений
1
1
2
3
13
12
20
15
14
13
6
Накопленная частота
(вероятность)
0,01 0,02 0,04 0,07
0,2
0,32 0,52 0,67 0,81 0,94
1
Рассчитаем накопленные частоты (строка 3 в таблице 9). Получим:
𝑉𝑎𝑅0,99 = 15 тыс. у. е.
Воспользовавшись линейной интерполяцией (для чисел -10 и -8 в 1-й строке
таблицы 9), получим:
𝑉𝑎𝑅0,95 = 9,33 тыс. у. е.
То есть однодневный убыток по данному активу не превысит 15 тыс. у.е. с
вероятностью 99% и 9,33 тыс. у.е. с вероятностью 95%. Геометрическая
интерпретация представлена на рисунке 12.
Рисунок 12 – Эмпирическое распределение данных примера 1
28
Лабораторная работа № 7. «Дисперсионный анализ»
Задание:
Имеются данные, характеризующие качество некоторого объекта по трем
уровням F1-F3 фактора:
Номер наблюдения
1
2
3
4
F1
38
36
35
31
F2
20
24
26
30
F3
21
22
31
34
Предполагается, что выборки извлечены из нормальных совокупностей с
одинаковыми дисперсиями.
Требуется: при уровне значимости 𝛼 = 0,05 проверить гипотезу о влиянии
фактора на качество объекта.
МЕТОДИЧЕСКИЕ РЕКОМЕНДАЦИИ ПО ВЫПОЛНЕНИЮ ЗАДАНИЯ
Основное тождество дисперсионного анализа имеет следующий вид:
29
𝑄 = 𝑄1 + 𝑄2 ,
30
Лабораторная работа № 8. «Многомерные статистические методы:
кластерный анализ»
Задание:
Провести кластеризацию регионов Российской Федерации по показателю
«Численность врачей на 10 000 человек населения (на конец года, человек)»
(таблица 10).
Таблица 10 – Исходные значения для лабораторной работы № 8 (фрагмент)
Российской Федерации
Белгородская область
Брянская область
Владимирская область
Воронежская область
Ивановская область
Калужская область
Костромская область
Курская область
Липецкая область
Московская область
Орловская область
Рязанская область
Смоленская область
Тамбовская область
Тверская область
Тульская область
Ярославская область
г.Москва
Республика Карелия
Республика Коми
Архангельская область
Вологодская область
Калининградская область
Ленинградская область
Мурманская область
Новгородская область
Псковская область
г.Санкт-Петербург
Республика Адыгея
Республика Калмыкия
Краснодарский край
Астраханская область
Волгоградская область
Ростовская область
…
2000
46,8
38,0
37,0
36,9
49,6
52,5
39,8
36,8
46,7
39,4
32,9
37,3
52,2
59,3
34,2
50,6
32,7
54,8
72,7
48,7
41,3
50,4
34,7
35,9
30,5
48,0
37,1
34,8
74,5
35,7
46,1
43,0
62,7
46,3
36,2
…
2001
46,9
38,0
37,0
35,8
50,4
52,3
39,4
36,3
47,6
39,3
32,9
37,6
52,7
60,1
34,4
50,7
33,1
54,8
72,0
49,2
42,1
50,5
34,6
35,3
30,4
47,8
37,2
34,4
74,7
36,2
49,9
42,5
62,6
45,9
35,9
…
2002
47,4
38,8
36,8
36,4
51,1
52,4
40,1
36,2
48,2
40,1
32,9
38,1
52,7
59,6
34,3
51,1
33,8
56,0
72,8
49,3
43,6
51,0
34,8
35,4
30,3
48,4
38,1
34,3
76,2
36,6
51,0
43,2
64,1
48,4
36,8
…
2003
48,0
38,9
36,9
34,8
51,6
52,2
39,9
36,0
49,3
39,8
34,3
37,6
53,5
62,7
34,5
51,9
33,8
56,8
74,0
49,5
43,4
52,7
33,9
35,6
30,0
48,6
38,7
34,0
77,9
36,7
49,0
43,3
65,8
47,1
36,9
…
31
2004
48,4
39,2
37,1
34,6
53,0
51,8
39,5
36,3
48,2
40,4
36,0
37,5
53,7
62,9
34,4
51,7
33,9
56,7
75,5
49,4
43,9
52,4
34,2
36,0
31,0
49,0
38,8
34,3
80,3
37,2
51,0
42,4
66,6
48,1
37,0
…
2005
48,8
39,6
36,3
34,0
54,2
51,1
39,1
36,2
49,8
40,3
35,5
37,1
53,6
60,9
34,0
51,9
34,2
57,5
76,1
48,9
44,0
52,8
35,3
35,5
31,4
48,7
39,2
34,5
82,3
37,4
49,5
42,6
66,2
48,2
37,8
…
2006
49,4
40,7
36,7
34,4
54,3
52,0
39,4
36,8
50,4
41,9
37,4
39,0
54,6
60,8
35,0
53,0
35,0
58,8
78,6
49,3
46,1
53,2
35,5
36,9
31,2
48,3
40,4
34,4
83,5
38,4
50,1
43,1
67,1
49,4
38,7
…
2007
49,8
41,1
36,6
34,4
55,0
51,5
38,9
37,4
52,6
42,7
39,1
39,4
55,4
60,7
34,6
52,5
34,9
59,0
79,6
48,7
45,4
55,7
35,5
36,5
36,3
49,2
40,2
34,7
82,5
38,8
50,3
42,6
66,5
50,7
39,0
…
2008
49,6
40,6
36,2
34,1
52,6
51,0
39,4
35,8
54,2
42,5
37,7
38,9
58,0
58,9
34,7
50,6
34,6
58,9
80,7
48,9
45,7
54,2
36,1
35,4
35,5
48,0
41,9
32,6
84,7
37,3
50,4
42,9
67,0
50,9
38,1
…
2009
50,1
40,7
36,7
33,9
54,1
51,1
40,6
35,3
54,0
42,3
37,5
39,3
55,5
60,2
34,9
51,6
34,4
60,3
81,8
49,1
46,5
54,4
35,5
34,8
36,4
54,6
41,2
33,2
87,4
37,8
50,3
43,3
68,1
51,0
38,6
…
2010
50,1
40,4
36,2
33,1
52,6
51,9
39,5
34,6
58,0
40,4
35,8
39,9
56,8
59,7
34,0
53,1
33,1
62,9
77,6
50,3
47,5
56,5
34,6
34,5
34,5
57,3
41,3
34,6
85,3
37,9
46,7
41,9
68,2
50,5
38,6
…
Приложение 1
32
Приложение 2
33
УЧЕБНО-МЕТОДИЧЕСКОЕ И ИНФОРМАЦИОННОЕ ОБЕСПЕЧЕНИЕ
ДИСЦИПЛИНЫ
Для выполнения самостоятельной работы рекомендуется использовать
интернет-ресурсы, перечисленные в таблице 11.
Таблица 11 – Перечень современных профессиональных баз данных
и информационных справочных систем, рекомендуемых для освоения дисциплины
Названия современных профессиональных баз данных и
информационных справочных систем
Электронно-библиотечная система «Znanium.com»
Электронная библиотека УГНТУ
Портал Федеральной службы государственной статистики
Ссылки
на официальные сайты
http://znanium.com/
http://bibl.rusoil.net/
https://rosstat.gov.ru/
Рекомендуемая литература:
1) Микони С.В. Теория принятия управленческих решений: учеб. пособие для
вузов / С.В. Микони. – М: Лань, 2022. – 384 с.
2) Методы и системы принятия решений: Учебное пособие / Доррер Г.А. –
Краснояр.: СФУ, 2016. – 210 с.
3) Управленческие решения: Учебник / Балдин К.В., Воробьев С.Н., Уткин
В.Б. – М.: Дашков и К, 2018. – 496 с.
4) Методы оптимизации управления и принятия решений: примеры, задачи,
кейсы: Учебное пособие. – М.:ИД Дело РАНХиГС, 2017. – 640 с.
5) Теория принятия решений: Конспект лекций / Тихомирова А.Н., Матросова
Е.В. – М.: КУРС, НИЦ ИНФРА-М, 2017. – 68 с.
6) Методы и модели принятия управленческих решений: учеб. пособие / Е.В.
Бережная, В.И. Бережной. – М.: ИНФРА-М, 2023. – 384 с.
7) Экономико-математические методы в примерах и задачах : учебное пособие
/ И.В. Орлова, Н.В. Концевая, Е.Н. Горбатенко, В.А. Большаков; под ред. А.Н.
Гармаша. – Москва : Вузовский учебник : ИНФРА-М, 2021. – 416 с.
34
Скачать