Список дополнительной литературы для самостоятельного

реклама
Приложение 2
Список дополнительной литературы
для самостоятельного изучения
Приведенный в конце данного учебного пособия список литературы является основным, на который
рекомендуется ориентироваться при начальном ознакомлении с проблематикой построения речевых
интерфейсов интеллектуальных систем. Данное приложение содержит расширенный список литературы,
который может быть полезен для тех, кто желает более глубоко изучить проблемы, рассматриваемые в
рамках учебной дисциплины «Речевой интерфейс» (У ч Д и с ц 2 0 - Р И ) и смежных с ней дисциплин, но не
рассмотрены в должной степени в рамках данной работы. Отметим, однако, что для удобства в данной работе
приведены ссылки на большинство из указанных литературных источников путем указания их
идентификаторов, которые присутствуют и в предлагаемом списке.
1.
Азарченкова Е.И..1984ст-Возмо_П_И
Азарченкова, Е. И., Ложкевич, Л. А. Возможности получения информации о личности по
фонограммам устной речи // Диагностика при производстве криминалистических экспертиз. –
М. : ВНИИ МВД СССР, 1984. № 72. С. 17 – 24.
2.
Аксютина И.В..1986ст-Алгор_В_Ф
Аксютина, И. В., Лобанов, Б. М. Алгоритм вычисления фонемных портретов для синтеза речи //
Автоматическое распознавание слуховых образов (АРСО – 14). – Каунас, 1986. С. 51 – 52.
3.
Бовбель Е.И..1999ст-Распо_И_С
Бовбель, Е. И., Ткачева, П. П, Хейдоров, И. Э. Распознавание изолированных слов на основе
авторегрессионной скрытой марковской модели // Интеллектуальные системы. – Сб. научн.
трудов. 1999. Вып. 2. – Мн. : ИТК НАН Беларуси,. С. 50 – 59.
4.
Бовбель Е.И..1995ст-Распо_С_Р
Бовбель, Е. И., Семенчик, В. Г., Хейдоров, И. Э. Распознавание слитной речи : скрытые
марковские модели и нейронные сети // Современные методы обработки сигналов в системах
измерения, контроля, диагностики и управления : Тр. науч.-техн. конф. – Мн., 1995. С. 92 – 95.
5.
Борискевич А.А..2004сост-Адапт_Ф
Адаптивная фильтрация маскирования речевых сигналов : метод. указ. к лаб. работе по дисц.
«Цифровая обработка речи и изображений» и «Защита речевых сообщений и объектов связи
от несанкционированного перехвата» для студ. спец. «Сети телекоммуникаций» дневной и
заочной форм обуч. / сост. А. А. Борискевич, Е. Д. Кривошеев, В. И. Фалалеев – Мн. : БГУИР,
2004. – 23 с.
6.
Борискевич А.А.2004мет-Сжати_Р_С
Борискевич, А. А., Холев, О. В., Цветков, В. Ю. Сжатие речевых сигналов на основе
вейвлетного и фрактального преобразований : метод. пособие к лаб. работе по дисц.
«Цифровая обработка речи и изображений» для студ. спец. «Сети телекоммуникаций» дневн.
формы обуч. – Мн. : БГУИР, 2004. – 35 с.
7.
Борискевич А.А..2003мет-Анали_Ч_и_В
Борискевич, А. А., Конопелько, В. К. Анализ частотных и временных свойств слухового
аппарата : метод. указания к лабораторной работе по дисциплинам «Цифровая обработка
речи и изображений» и «Защита речевых сообщений и объектов связи от
несанкционированного перехвата» для студ. спец. «Сети телекоммуникаций» дневной,
вечерней и заочной форм обучения. – Мн. : БГУИР, 2003. – 19 с.
8.
Веймут А.А.1976ст-О_Завис_К_П
Веймут, А. А. О зависимости количественных показателей единиц языка от пола говорящего
лица // Вопросы языкознания. 1976. №1. С. 13 – 18.
9.
Винцюк Т.К.1971ст-Распо_Н_Р
Винцюк, Т. К. Распознавание непрерывной речи, составленной из слов заданного словаря //
Кибернетика. 1971. № 2. С. 133 – 143.
147
10. В и н ц ю к Т . К . 1 9 6 8 с т - Р а с п о _ С _ У _ Р
Винцюк, Т. К. Распознавание слов устной речи методами динамического программирования //
Кибернетика. 1968. № 1. С. 81–88.
11. Г а л я ш и н а Е . Н . . 1 9 9 3 у ч - Д и а г н _ Л
Галяшина, Е. Н., Безрукова, М. И., Фомичев, А. Н., Хуртилов, В. О. Диагностика личности по
фонограммам устной речи : учеб. пособие. – М. : ЭКЦ МВД РФ, 1993. – 72 с.
12. Г в о з д е в А . Н . 1 9 7 3 к н - С о в р е м _ Р _ Л _ Я
Гвоздев, А. Н. Современный русский литературный язык. Ч. 1. Фонетика и морфология. – М :
Просвещение, 1973. – 432 с.
13. Д е г т я р е в Н . П . 2 0 0 0 с т - М о д е л _ Ф _ П
Дегтярев, Н. П. Модели фонетических преобразований речевого сигнала // Автоматическое
распознавание и синтез речи. – Мн. : Ин-т техн. кибернетики НАН Беларуси, 2000. С. 25 – 42.
14. Д е г т я р е в Н . П . 1 9 8 9 с т - А н а л и _ Ф
Дегтярев Н. П. Анализ факторов, определяющих надежность распознавания слов слитной
речи // Автоматическое распознавание и синтез речевых сигналов. – Киев, 1989. С. 77– 81.
15. Д е г т я р е в Н . П . . 1 9 8 7 с т - П о в ы ш _ Н _ Р
Дегтярев, Н. П., Левков, Е. Я. Повышение надежности распознавания слов слитной речи.
Proceedings XI-th International Congress of Phonetic Sciences. Vol. 3, Tallinn, 1987. P. 290 – 293.
16. Д е г т я р е в Н . П . 1 9 8 6 с т - Д в у х ф _ А _ С
Дегтярев, Н. П. Двухформантная аппроксимация спектров речи. // Автоматическое
распознавание слуховых образов (АРСО – 14). Ч. 1. – Каунас, 1986. С. 12 – 13.
17. Д е р к а ч М . Ф . . 1 9 7 1 к н - В о с п р _ Р
Деркач, М. Ф., Гумецкий, Р. Я., Мишин, Л., Оверченко, М., Чабан, М. Восприятие речи в
распознающих моделях. – Львов : Изд-во Львовского госуниверситета, 1971. – 186 с.
18. Д о д и н г т о н Д ж . 1 9 8 5 с т - Р а с п о _ Д
Додингтон, Дж. Распознавание дикторов : идентификация людей по голосу // ТИИЭР. 1985.
Т. 73. №11. С. 129–146.
19. Е г о р о в К . С . . 1 9 9 7 с т - Б и о м е _ Р _ С
Егоров, К. С., Рылов, А. С., Чижденко, В. А. Биометрическая речевая система «Вектор»
комплексной защиты информационных и материальных ресурсов // Комплексная защита
информации. Вып. 1. – Мн. : Ин-т техн. кибернетики НАН Беларуси, 1997. С. 144 – 155.
20. Ж е н и л о В . Р . 1 9 9 5 к н - К о м п ь _ Ф
Женило, В. Р. Компьютерная фоноскопия. – М. : Академия МВД России, 1995. – 208 с.
21. З е м с к а я Е . А . р е д 1 9 7 3 к н - Р у с с к _ Р _ Р
Русская разговорная речь / под ред. Е. А.Земской. – М. : Наука, 1973. – 486 с.
22. З и н д е р Л . Р . 1 9 7 9 к н - О бщ а я _ Ф
Зиндер, Л. Р. Общая фонетика. – М. : Высш. шк., 1979. – 312 с.
23. З л а т о у с т о в а Л . В . 1 9 8 1 к н - Ф о н е т _ Е
Златоустова, Л. В. Фонетические единицы русской речи. – М. : МГУ, 1981. – 108 с.
24. З у В . В . . 1 9 8 3 с т - А к у с т _ О
Зу, В. В., Шварц, P. M. Акустическая обработка и фонетический анализ // Методы
автоматического распознавания речи / пер. с англ. – М. : Мир, 1983. Вып. 1. С. 142–170.
25. К а р н е в с к а я Е . Б . . 1 9 8 2 с т - М о д е л _ С _ М _ К
Карневская, Е. Б., Лобанов, Б. М. Модели синтеза мелодического контура русских и английских
фраз // Автоматическое распознавание слуховых образов (АРСО – 12). – Киев, 1982. С. 399 –
401.
148
26. К а р н е в с к а я Е . Б . . 1 9 8 0 с т - Л и н г в _ О
Карневская, Е. Б., Лобанов, Б. М. Лингвоакустические основы двуязычного синтеза речи //
Автоматическое распознавание слуховых образов (АРСО – 11). – Ереван, 1980. С. 119 – 122.
27. К у х а р ч и к П . Д . . 1 9 9 5 с т - Р а с п о _ И _ Ц
Кухарчик, П. Д., Бовбель, Е. И., Хейдоров, И. Э. Распознавание изолированных цифр при
помощи акустико-фонетической скрытой марковской модели // Компьютерный анализ данных и
моделирование : Труды междунар. конф. – Мн., 1995. С. 58 – 62.
28. К у ч е р о в В . Я . . 1 9 8 3 к н - С и н т е _ Р
Кучеров, В. Я., Лобанов, Б. М. Синтезированная речь в системах массового обслуживания. –
М. : Радио и связь, 1983.
29. Л е в и н с о н C . Е . 1 9 8 5 с т - С т р у к _ М _ А _ Р
Левинсон, C. Е. Структурные методы автоматического распознавания речи // ТИИЭР. 1985.
T. 73. №11. C. 78 – 91.
30. Л о б а н о в Б . М . 1 9 9 1 с т - М и к р о _ С _ Р
Лобанов, Б. М. Микроволновой синтез речи // Автоматическое
образов (АРСО – 16). – М., 1991. С. 27–31.
распознавание
слуховых
31. М а т у с е в и ч М . И . 1 9 7 6 к н - С о в р е _ Р _ Я
Матусевич, М. И. Современный русский язык. Фонетика. – М. : Просвещение, 1976. – 288 с.
32. М и х а й л о в В . Г . . 1 9 8 7 к н - И з м е р _ П _ Р
Михайлов, В. Г., Златоустова, Л. В. Измерение параметров речи. – М. : Связь, 1987.
33. М о л ч а н о в А . П . . 1 9 7 0 с т - М е х а н _ А _ С
Молчанов, А. П., Лабутин, В. К. Механизмы анализа сигналов в органе слуха и проблемы их
моделирования. // Распознавание слуховых образов / под ред. Н. Г. Загоруйко и
Г. Я. Волошина – Новосибирск : Наука СО, 1970. С. 142–204.
34. М о р г а н с т е й н С . . 1 9 9 9 с т - И д е н т _ и _ В
Морганстейн, С., Сердюков, В., Зак, С. С. Идентификация и верификация говорящих для
центров обработки телефонных звонков // Современные речевые технологии : Сб. научн. тр. IX
сессии российского акустич. общества. – М., 1999. С. 133–136.
35. М о р о з о в В . П . 1 9 9 4 с т - Э м о ц и _ С
Морозов, В. П. Эмоциональный слух как критерий профессионального отбора и подготовки
специалистов-аудиторов правоохранительных органов // Тез. докл. Междунар. конф. – М.,
1994. С. 32–33.
36. Н у ш и к я н Э . А . . 1 9 8 9 с т - О п р е д _ Э _ С
Нушикян, Э. А., Трунин-Донской, В. Н., Ребгун, Э. К. Определение эмоционального состояния
говорящего по акустическим параметрам речевого сигнала // Возможности судебной
видеофонографической экспертизы. – М. : ВНИИСЭ, 1989. С. 38–49.
37. П е т р о в с к и й А . А . . 2 0 0 4 м е т - Р е ч е в _ И _ Э В С
Петровский, А. А., Петровский, Ал. А., Лихачев, Д. С. Речевые интерфейсы ЭВС : метод.
пособие для студ. спец. 40 02 02 «Электронные вычислительные средства» дневной формы
обуч. – Мн. : БГУИР, 2004. – 66 с.
38. П е ч е н е в а Т . А . 2 0 0 4 с о с т - В и д ы _ Я _ Р
Виды языкового разбора : краткий комплексный
Т. А. Печенева. – Мн. : Изд. центр БГУ, 2004. – 99 с.
словарь-справочник
/
Авт.-сост.
39. П о п о в Э . В . 1 9 8 2 к н - О бщ е н _ с _ Э В М
Попов, Э. В. Общение с ЭВМ на естественном языке. – М. : Наука, 1982. – 360 с.
40. Р а б и н е р Л . Р . 1 9 8 9 с т - С к р ы т _ М _ М
Рабинер, Л. Р. Скрытые марковские модели и их применение в избранных приложениях при
распознавании речи : Обзор // ТИИЭР. 1989. T. 77. №2. C. 86 – 120.
149
41. Р а б и н е р Л . Р . . 1 9 7 5 с т - Ц и ф р о _ П _ Р _ С
Рабинер, Л. Р., Шафер, Р. В. Цифровое представление речевых сигналов. : пер. с англ. //
ТИИЭР, 1975. № 4. С. 141 – 159.
42. Р ы л о в А . С . . 1 9 9 6 с т - И д е н т _ Л
Рылов, А. С., Чижденко, В. А. Идентификация личности по речевым фонограммам,
изготовленным
с
помощью
разных
средств звукозаписи //
Информатизация
правоохранительных систем : Тез. докл. Междунар. конф. – М., 1996. С.187 – 189.
43. С а п о ж к о в М . А . 1 9 6 3 к н - Р е ч е в _ С
Сапожков, М. А. Речевой сигнал в кибернетике и связи. – М. : Связь, 1963. – 452 с.
44. С б о р н _ Т _ П _ И И - 2 0 0 4 с б
Сборник типовых учебных программ для высших учебных заведений по специальности
I – 40 03 01 Искусственный интеллект. Специальные дисциплины. – Мн. : БГУИР, 2004. – 128 с.
45. Т у р б о в и ч И . Т . . 1 9 7 1 с т - О п о з н _ О
Турбович, И. Т., Гитис, В. Г., Маслов, В. К. Опознание образов. – М. : Наука, 1971. С. 121–152.
46. Х и т и н а М . В . 1 9 9 5 с т - В о п р о _ К _ Д
Хитина, М. В. Вопросы криминалистической диагностики эмоционального состояния человека по
фонограммам его речи. Экспертная практика : Метод. разработки. Вып. 125. – М., 1995. С. 14 – 18.
47. Ч и с т о в и ч Л . Н . . 1 9 6 5 к н - Р е ч ь _ А _ и _ В
Чистович, Л. Н., Кожевников, В. А. и др. Речь. Артикуляция и восприятие. – М.-Л. : Наука, 1965. – 64 с.
48. Ч и ч а г о в А . В . 1 9 9 1 с т - М о д е л и _ и _ П _ О
Чичагов, А. В. Модели и первичное описание речевых сигналов / Научно-технический отчет по
НИР «Казуар». – М. : ВЦ АН СССР, 1991. С. 6 – 13.
49. A t a l B . S . . 1 9 8 7 a r t - S p e e c _ A
Atal, B. S., Hanauer, S. L Speech analysis and synthesis by linear prediction of the speech wave,
J. Ac. Soc. America, Vol.50, №.1, March, 1987.
50. B o u r l a n d Н . . 1 9 9 0 a r t - L i n k s _ B _ M _ M
Bourland, Н. and Wellenkens, C. J. Links between Markov models and multilayer perceptrons // IEEE
Trans. Patt. Anal. and Mach. Intell. Vol. 12, No.6, 1990. P. 1167 – 1178.
51. B o v b e l E . I . . 1 9 9 9 a r t - A u t o r _ H _ M _ M
Bovbel, E. I., Kheidorov, I. E, Tkachova, P. P. Autoregressive hidden Markov models for applied
tasks of vocal fold pathology detection // Models and analysis of vocal emissions for biomedical
applications : Workshop proc., Firenze, 1999. P. 108 – 111.
52. B o v b e l E . I . . 1 9 9 9 a r t - T h e _ U s a g e
Bovbel, E. I., Kheidorov, I. E, Tkachova, P. P. The usage of hidden Markov models based on
autoregressive principles for isolated words recognition // Symposium AeroSence SPIE–99 : Proc.–
Florida, 1999. Vol. 3720. P. 434 – 443.
53. B o v b e l E . I . . 1 9 9 7 a r t - S t a t i _ I _ R
Bovbel, E. I., Kheidorov, I. E. Statistical Image Recognition Methods for Isolated Word Recognition //
International Conference CDAM–97 : Proc.–Minsk, 1997. P. 234 – 238.
54. B o v e s L . . 1 9 9 4 a r t - D e s i g _ a _ R
Boves, L., Boogaart, T., Bos, L. Design and Recording of Lage Data bases for Use in Speaker
Verification and Identification. Automatic Speaker Recognition, Identification and Verification :
Proceeding of the ESCA Work shop. – Martigny, 1994. P. 43 – 46.
55. B r a e d e r s A . P . A . 1 9 9 5 a r t - T h e _ R o l e _ o f _ A
Braeders, A. P. A. The Role of Automatic Speaker Recognition Techniques in forensic Investigations.
ICPHS 95. – Stockholm, 1995. V. 3. P. 154 – 161.
56. B u z o A . . 1 9 8 0 a r t - S p e e c _ C
Buzo, A., Gray, A., Gray, R. and Markel, J. Speech Coding Based Upon Vector Quantization // IEEE
Trans. on Acoustics, Speech and Signal Processing. 1980. ASSP–28. № 5.
57. C a r b o n e l l N . . 1 9 8 4 a r t - A n _ e x p e r t _ S
Carbonell, N., Fohr, D., Haton, J. P. et al. An expert system for the automatic reading of french
spectrograms. – Proc. ICASSP–84, N.-Y., 1984, vol. 3. P. 4 – 12.
58. D e g t j a r e v N . P . 1 9 9 1 a r t - T w o - F o r m a _ M
Degtjarev, N. P. Two-Formant Model of the Acoustic Description of Speech Articulation. Processing of the XII-th
International Congress of Phonetic science. Aix-en-Provence, France, August 12–24,1991. Vol 2. P. 410 – 413.
59. D o d d i n g t o n G . R . . 1 9 8 8 a r t - T h e _ L P C _ T
Doddington, G. R., Picone, J., Godfrey, J. J. The LPC trace as an HMM development tool, J. Ac.
Soc. America. Vol. 84, Fall 1988.
150
60. H o l m e s W . J . . 1 9 9 7 a r t - U s i n g _ F _ F
Holmes, W. J. and Garner, P. N. Using Formant Frequencies in Speech Recognition. Proc.
EuroSpeech’97, Rhodes – Greece, 1997.
61. H o l m e s J . N . 1 9 9 3 a r t - S p e e c _ S
Holmes, J. N. Speech Synthesis and Recognition. – London, 1993. P. 102 – 128.
62. H u a n g X . 1 9 9 2 a r t - P h o n e _ C _ U
Huang, X. Phoneme Classification Using Semicontinuous Hidden Markov Models // IEEE Trans on
Signal Processing. 1992. Vol. 40. № 5.
63. L e e K . F . 1 9 8 9 a r t - A u t o m _ S _ R
Lee, K. F. Automatic Speech recognition, Kluwer, Boston, MA. 1989.
64. L i p p m a n R . P . 1 9 8 9 a r t - R e v i e _ o f _ N _ N
Lippman, R. P. Review of neural networks for speech recognition // Neural Computation. Vol.1. 1989. №1. P.1 – 38.
65. L o b a n o v B . M . . 1 9 9 7 a r t - A n _ A l g o r _ f _ S - I
Lobanov, B. M., Levkovskaja, T. V. An algorithm for speaker-independent word-pattern creation for
speech recognition. In Digital image processing. Proceedings of the Institute Engineering
Cybernetics, Academy of Science of Belarus, Minsk, 1997. P. 147 – 153.
66. L o b a n o v B . . 1 9 9 7 a r t - R e c o g _ o f _ W
Lobanov, B., Levkovskaia, T. Recognition of words and words-sequences in running speech // Proc. Digital image
processing. –Minsk : Institute Eng. Cybernetics, Academy of Science of Belarus, Minsk, 1997. P. 154 – 161.
67. L o b a n o v B . 1 9 8 2 a r t - O n _ t h e _ A c o u s
Lobanov, B. On the Acoustic Theory of Coarticulation and Reduction. Proc. ICASP–82, Paris, 1982. P. 915 – 918.
68. L o b a n o v B . 1 9 8 1 a r t - A r t i c - F _ S _ S
Lobanov, B. Articulatory-Formant Speech Synthesis from Printed Text. Proc. of Franco-Sovietique
Symposium on Speech. Paris, 1981. P. 73 – 75.
69. M o r g a n N . . 1 9 9 5 a r t - N e u r a _ N
Morgan, N., Bourlard, A. Neural networks for statistical recognition of continuous speech //
Proceedings of the IEEE. 1995. Vol. 83. P. 742 – 769.
70. P o t a m i a n o s A . . 1 9 9 5 a r t - S p e e c _ F _ F
Potamianos, A., Maragos, P.. Speech formant frequency and bandwidth tracking using multiband
energy demodulation // IEEE. 1995. P. 784 – 787.
71. T o k h u r a Y . 1 9 8 7 a r t - A _ W e i g h _ C _ D
Tokhura, Y. A weighted cepstral distance measure for speech recognition, IEEE Trans. on Acoustic,
Speech, Signal Processing, ASSP–35, Oct 1987. N 10.
72. R e n a l s S . . 1 9 9 4 a r t - C o n n e _ P
Renals, S., Morgan, N. et al. Connectionist Probability Estimators in HMM Speech Recognition //
IEEE Trans on Speech and Audio Processing. 1994. Vol. 2. № 1.
73. R o u a t G . . 1 9 9 5 a r t - P i t c h _ D
Rouat, G., Liu, Y. C., Morissette, D. A Pitch Determination and Voiced/unvoiced Decision Algorithm
for Noisy Speech // Proc. Eurospeech–95. –Madrid, Spain, 1995. Vol. 1. P. 397 – 400.
74. R y l o v A . S . 1 9 9 9 a r t - P r a c t _ A
Rylov, A. S. Practical Aspects and Basic Components of the Up-to-Date Speech Images Recognition Sistems.
Speech Technology today : Proc. of the IX session of the Russian Acoustical Society. – Moscow. 1999. P. 116 – 121.
75. S c h m i d P . . 1 9 9 5 a r t - N - B e s t _ F _ T
Schmid, P., Barnard, E. Robust, N-Best Formant Tracking // Proc. Eurospeech–95. –Madrid, Spain,
1995. Vol. 1. P. 737 – 740.
76. S i l v a C . . 1 9 9 9 a r t - O n _ I m p r o _ t h e _ D
Silva, C., Chennoukh, S., Trancoso, I. On Improving the Decision Algorithm for Articulatory
Codebook
Search. Proceedings 6-th European Conference on Speech Communication and
Technology – EUROSPEECH'99. Budapest, September 5–9, 1999. Vol. 1. P. 153 – 156.
77. S u n D . X . 1 9 9 5 a r t - R o b u s _ E
Sun, D. X. Robust Estimation of Spectral Center-of-Gravity Trajectories Using Mixture Spline Models
// Proc. Eurospeech–95. –Madrid, Spain, 1995. Vol. 1. P. 749 – 752.
78. V i n t s i u k T . K . 1 9 9 8 a r t - S i g n i _ S _ U
Vintsiuk, T. K. Significant Speech Understanding Algorithm for a Dictation/Translation Machine. Proc. International
Workshop Speech and Computer – SPECOM'98. St.-Petersburg, October 26–29, 1998. P. 197 – 202.
79. Z u e V . W . . 1 9 8 6 a r t - A n _ e x p e r t _ S
Zue, V. W., Lamel, L. F. An expert spectrogram reader : a knowledge-based approach to speech
recognition. – Proc. ICASSP–86,Tokyo. 1986. P. 1197 – 1200.
151
Скачать