Задание 7

реклама
Лабораторная работа № 7
Тема: Исследование эффективности линейных классификаторов на примере задачи
распознавания двухкомпонентной смеси нормальных законов распределения.
Задание: Каждый студент должен написать программу, позволяющую пользователю
выполнять следующие действия.
1. Чтение из файла данных либо непосредственное моделирование в программе обучающей
выборки объема N o и контрольной выборки объема N k из смеси двух нормальных
законов распределения
c


p x    P i  p x  i 
i 1
P i  - априорные вероятности классов,


p x  i  ~ N  i ,  i  - нормальные условные плотности распределения векторов признаков
где параметры с=2 – число классов;
задаются пользователем в программе либо в файле данных
2. Отображение точек обучающей либо контрольной выборок (по требованию
пользователя) на произвольных двумерных проекциях (своим цветом для каждого
класса).
3. Выбор уровня обобщения линейного классификатора
а) уровень 1 - простая схема пополнения :
размерность пространства признаков dˆ  d  1 ;


t
t
y  1, x1 , x 2  , x d  ; a  w0 , w1 , w2 , , wd 
б) уровень 2 - линеаризация квадратичной разделяющей функции :
размерность пространства признаков dˆ  d  1  d  d  1 2 ;
t

y  1, x1 , x2 , xd , x12 , x1 x2 , x1 x3 ,, x1 xd , x22 , x2 x3 ,, x2 xd ,, xd2  ;

t
a  w0 , w1 , w2 , , wd , w11 , w12 , , w1d , w22 , w23 , , w2 d , , wdd 
4. Обучение линейного классификатора c заданным уровнем обобщения по обучающей
выборке одним из следующих алгоритмов, основанных на процедуре минимизации
функции критерия методом градиентного спуска :
а) персептронная функция критерия, базовый алгоритм минимизации;
б) персептронная функция критерия, алгоритм с коррекцией на каждом шаге ;
в) критерий релаксаций, базовый алгоритм минимизации;
г) критерий релаксаций, алгоритм с коррекцией на каждом шаге .
5. Классификация всех точек контрольной выборки линейным классификатором,
графическое отображение классифицированных точек на произвольно выбираемых
пользователем двумерных проекциях (все ошибочно классифицированные точки –
особым цветом)
6. Расчет и отображение следующих показателей вычислительной эффективности
алгоритма обучения и качества классификатора :
– времени, затраченного на обучение классификатора
– оценки вероятности ошибки классификации па контрольной выборке
1
Pˆ ош  
число ошибок
число классифицируемых точек
– матрицы трансформаций вида
Стало
Было
Класс 1
Класс 2
Класс 1
Т11
Т12
Класс 2
Т21
Т22
где Tij - число точек j-го класса, отнесенных классификатором к i-му классу
Примечание. В итоговом отчете должны быть проиллюстрированы все возможности
написанной программы. Кроме того, необходимо провести и отразить в отчете исследование
зависимости времени обучения и средней ошибки классификации на контрольной выборке
достаточно большого размера ( N k =5-10 тыс. точек) от размера обучающей выборки,
например, при N o ~ 10,100,1000 ,10000 .
Варианты: Без вариантов
2
Скачать