Сравнительная характеристика алгоритмов сжатия речи

реклама
ГОУВПО «Московский Энергетический Институт
(Технический Университет)»
Кафедра Радиотехнических систем
Тема магистерской диссертации:
«РАЗРАБОТКА И РЕАЛИЗАЦИЯ АЛГОРИТМА СЖАТИЯ РЕЧЕВОГО СИГНАЛА
ДЛЯ ПЕРЕДАЧИ В ЦИФРОВОЙ СИСТЕМЕ СВЯЗИ»
Выполнил:
студент учебной группы ЭР-20-05 Жуков А.М.
Научный руководитель:
доцент кафедры РТС к.т.н. Сизякова А.Ю.
Москва, 2011г.
Кодирование источника
RB [бит/с]
01011010110101
Канал связи
С
[бит/с]
RB [бит/с]
01011010110101
При RВ ≤ С возможна передача без ошибок
При RВ > С передача без ошибок не возможна
Основная задача кодера источника – сокращение избыточности,
содержащейся в сигнале. Формирование сжатого сигнала.
2
Цели и задачи работы
Провести
обзор алгоритмов сжатия речи;
Провести сравнительный анализ способов сжатия
речи;
Изучить работу речевого кодека с линейным
предсказанием (Linear Predictive Coding) ;
Разработать аппаратно-программную модель LPCкодека;
Выбрать параметры модели в соответствии с
критерием минимизации скорости цифрового потока на
выходе кодера при условии сохранения естественного
звучания речи.
3
Обзор алгоритмов сжатия речи
Алгоритмы
Кодирования
Речи
Кодирование
Формы
Сигнала
Вокальное
Кодирование
Гибридное
Кодирование
4
Алгоритм вокального кодирования
РТ - речевой
тракт
Речь
Анализ
параметров
РТ
Передаваемые
параметры РТ
Канал
связи
Речь
Построение
модели РТ.
Синтез речи
Передаваемые
параметры РТ
Вокодер – от англ. «voice coder», кодировщик голоса, устройство
синтеза речи на основе произвольного сигнала с богатым спектром.
5
Сравнительная характеристика алгоритмов
сжатия речи
Отличное
PCM G.711
ADPCM G.726
Качество речи
Хорошее
ADPCM G.721
MPLPC (GSM)
MPLPC (Skyphone)
Удовлетв.
LPC-10
Плохое
Неудовлетв.
2
4
8
16
32
64
Скорость передачи, кбит/с
6
Вокодер с линейным предсказанием
Период ОТ
Тот [с]
Усиление G
ГЕНЕРАТОР
ИМП.
ГЕНЕРАТОР
ШУМА
Параметры РТ {Ai}
Цифровой
фильтр с
переменными
параметрами
Синтезированная
речь
Кадр анализа – интервал квазистационарности речевого сигнала.
Длительность интервала анализа 10…30 мс.
7
LPC-вокодер. Определение коэффициентов
цифрового фильтра
А1
А2
А3
А4
А5
…...
Аp
S(n) S(n-1) S(n-2)
…………..
S(n-p)
r[s(n),s(n-1)]= 0,75 … 0,95
Ai - коэффициенты предсказания
r – нормированный коэффициент корреляции
R(j) – оценка функции автокорреляции
p – порядок предсказателя
8
LPC-вокодер. Определение функции
возбуждения
9
Компьютерная модель LPC-кодека
Состав компьютерной модели цифровой системы передачи речи:
1. Аппаратная часть модели
2. Программная часть модели
LPC_CODER.m
DS_KANAL.m
LPC_DECODER.m
10
Программный модуль кодера
1.
Нормировка и центрирование сигнала
→
Чтение звукового
файла
<GOLOS>.au
2.
Разделение звуковой
дорожки на конечное
число интервалов
анализа
Длительность интервала анализа: 10…30 мс →
3.
НЕТ
ДА
Конец трека ?
5.
4.
Формирование
числовых массивов
выходных данных
АНАЛИЗ сегмента
речевого сигнала
Вычисление АКФ сегмента
Вычисление коэффициентов ЦФ
Вычисление усиления
Выделение признака «шум-тон» и
анализ периода ОТ
6.
Формирование
двоичных битовых
последовательностей
7.
Запись файлов в
рабочую
директорию Matlab
11
Программный модуль кодера
12
Программный модуль канала
13
Программный модуль декодера
1.
Ввод параметров
системы
речеобразования
2.
Вычисление
размерности массивов
3.
НЕТ
ДА
Конец массива ?
5.
4.
ФОРМИРОВАНИЕ
функции
возбуждения
Фильтрация функции
возбуждения
6.
Воспроизведение
синтезированной
речи
14
Оценка скорости цифрового потока на выходе
кодера
Частота ОТ – 7 бит
Усиление сигнала – 5 бит
Коэффициенты фильтра - 4·K_pr бит
15
Результаты моделирования
16
Выводы по работе
Проведен
обзор существующих алгоритмов сжатия речи;
Приведена сравнительная характеристика основных
способов речевого кодирования;
Разработаны математические модели речевого кодека с
линейным предсказанием;
Создана аппаратно-программная модель LPC-вокодера;
Проведена оптимизация разработанной компьютерной
модели в соответствии с критерием минимизации скорости
цифрового потока на выходе кодера при условии
сохранения естественного звучания восстановленной
речи.
17
Сравнительная характеристика алгоритмов
сжатия речи
РАЗРАБОТАННАЯ
МОДЕЛЬ LPC-КОДЕКА
18
Скачать