Приложение 2 Список дополнительной литературы для самостоятельного изучения Приведенный в конце данного учебного пособия список литературы является основным, на который рекомендуется ориентироваться при начальном ознакомлении с проблематикой построения речевых интерфейсов интеллектуальных систем. Данное приложение содержит расширенный список литературы, который может быть полезен для тех, кто желает более глубоко изучить проблемы, рассматриваемые в рамках учебной дисциплины «Речевой интерфейс» (У ч Д и с ц 2 0 - Р И ) и смежных с ней дисциплин, но не рассмотрены в должной степени в рамках данной работы. Отметим, однако, что для удобства в данной работе приведены ссылки на большинство из указанных литературных источников путем указания их идентификаторов, которые присутствуют и в предлагаемом списке. 1. Азарченкова Е.И..1984ст-Возмо_П_И Азарченкова, Е. И., Ложкевич, Л. А. Возможности получения информации о личности по фонограммам устной речи // Диагностика при производстве криминалистических экспертиз. – М. : ВНИИ МВД СССР, 1984. № 72. С. 17 – 24. 2. Аксютина И.В..1986ст-Алгор_В_Ф Аксютина, И. В., Лобанов, Б. М. Алгоритм вычисления фонемных портретов для синтеза речи // Автоматическое распознавание слуховых образов (АРСО – 14). – Каунас, 1986. С. 51 – 52. 3. Бовбель Е.И..1999ст-Распо_И_С Бовбель, Е. И., Ткачева, П. П, Хейдоров, И. Э. Распознавание изолированных слов на основе авторегрессионной скрытой марковской модели // Интеллектуальные системы. – Сб. научн. трудов. 1999. Вып. 2. – Мн. : ИТК НАН Беларуси,. С. 50 – 59. 4. Бовбель Е.И..1995ст-Распо_С_Р Бовбель, Е. И., Семенчик, В. Г., Хейдоров, И. Э. Распознавание слитной речи : скрытые марковские модели и нейронные сети // Современные методы обработки сигналов в системах измерения, контроля, диагностики и управления : Тр. науч.-техн. конф. – Мн., 1995. С. 92 – 95. 5. Борискевич А.А..2004сост-Адапт_Ф Адаптивная фильтрация маскирования речевых сигналов : метод. указ. к лаб. работе по дисц. «Цифровая обработка речи и изображений» и «Защита речевых сообщений и объектов связи от несанкционированного перехвата» для студ. спец. «Сети телекоммуникаций» дневной и заочной форм обуч. / сост. А. А. Борискевич, Е. Д. Кривошеев, В. И. Фалалеев – Мн. : БГУИР, 2004. – 23 с. 6. Борискевич А.А.2004мет-Сжати_Р_С Борискевич, А. А., Холев, О. В., Цветков, В. Ю. Сжатие речевых сигналов на основе вейвлетного и фрактального преобразований : метод. пособие к лаб. работе по дисц. «Цифровая обработка речи и изображений» для студ. спец. «Сети телекоммуникаций» дневн. формы обуч. – Мн. : БГУИР, 2004. – 35 с. 7. Борискевич А.А..2003мет-Анали_Ч_и_В Борискевич, А. А., Конопелько, В. К. Анализ частотных и временных свойств слухового аппарата : метод. указания к лабораторной работе по дисциплинам «Цифровая обработка речи и изображений» и «Защита речевых сообщений и объектов связи от несанкционированного перехвата» для студ. спец. «Сети телекоммуникаций» дневной, вечерней и заочной форм обучения. – Мн. : БГУИР, 2003. – 19 с. 8. Веймут А.А.1976ст-О_Завис_К_П Веймут, А. А. О зависимости количественных показателей единиц языка от пола говорящего лица // Вопросы языкознания. 1976. №1. С. 13 – 18. 9. Винцюк Т.К.1971ст-Распо_Н_Р Винцюк, Т. К. Распознавание непрерывной речи, составленной из слов заданного словаря // Кибернетика. 1971. № 2. С. 133 – 143. 147 10. В и н ц ю к Т . К . 1 9 6 8 с т - Р а с п о _ С _ У _ Р Винцюк, Т. К. Распознавание слов устной речи методами динамического программирования // Кибернетика. 1968. № 1. С. 81–88. 11. Г а л я ш и н а Е . Н . . 1 9 9 3 у ч - Д и а г н _ Л Галяшина, Е. Н., Безрукова, М. И., Фомичев, А. Н., Хуртилов, В. О. Диагностика личности по фонограммам устной речи : учеб. пособие. – М. : ЭКЦ МВД РФ, 1993. – 72 с. 12. Г в о з д е в А . Н . 1 9 7 3 к н - С о в р е м _ Р _ Л _ Я Гвоздев, А. Н. Современный русский литературный язык. Ч. 1. Фонетика и морфология. – М : Просвещение, 1973. – 432 с. 13. Д е г т я р е в Н . П . 2 0 0 0 с т - М о д е л _ Ф _ П Дегтярев, Н. П. Модели фонетических преобразований речевого сигнала // Автоматическое распознавание и синтез речи. – Мн. : Ин-т техн. кибернетики НАН Беларуси, 2000. С. 25 – 42. 14. Д е г т я р е в Н . П . 1 9 8 9 с т - А н а л и _ Ф Дегтярев Н. П. Анализ факторов, определяющих надежность распознавания слов слитной речи // Автоматическое распознавание и синтез речевых сигналов. – Киев, 1989. С. 77– 81. 15. Д е г т я р е в Н . П . . 1 9 8 7 с т - П о в ы ш _ Н _ Р Дегтярев, Н. П., Левков, Е. Я. Повышение надежности распознавания слов слитной речи. Proceedings XI-th International Congress of Phonetic Sciences. Vol. 3, Tallinn, 1987. P. 290 – 293. 16. Д е г т я р е в Н . П . 1 9 8 6 с т - Д в у х ф _ А _ С Дегтярев, Н. П. Двухформантная аппроксимация спектров речи. // Автоматическое распознавание слуховых образов (АРСО – 14). Ч. 1. – Каунас, 1986. С. 12 – 13. 17. Д е р к а ч М . Ф . . 1 9 7 1 к н - В о с п р _ Р Деркач, М. Ф., Гумецкий, Р. Я., Мишин, Л., Оверченко, М., Чабан, М. Восприятие речи в распознающих моделях. – Львов : Изд-во Львовского госуниверситета, 1971. – 186 с. 18. Д о д и н г т о н Д ж . 1 9 8 5 с т - Р а с п о _ Д Додингтон, Дж. Распознавание дикторов : идентификация людей по голосу // ТИИЭР. 1985. Т. 73. №11. С. 129–146. 19. Е г о р о в К . С . . 1 9 9 7 с т - Б и о м е _ Р _ С Егоров, К. С., Рылов, А. С., Чижденко, В. А. Биометрическая речевая система «Вектор» комплексной защиты информационных и материальных ресурсов // Комплексная защита информации. Вып. 1. – Мн. : Ин-т техн. кибернетики НАН Беларуси, 1997. С. 144 – 155. 20. Ж е н и л о В . Р . 1 9 9 5 к н - К о м п ь _ Ф Женило, В. Р. Компьютерная фоноскопия. – М. : Академия МВД России, 1995. – 208 с. 21. З е м с к а я Е . А . р е д 1 9 7 3 к н - Р у с с к _ Р _ Р Русская разговорная речь / под ред. Е. А.Земской. – М. : Наука, 1973. – 486 с. 22. З и н д е р Л . Р . 1 9 7 9 к н - О бщ а я _ Ф Зиндер, Л. Р. Общая фонетика. – М. : Высш. шк., 1979. – 312 с. 23. З л а т о у с т о в а Л . В . 1 9 8 1 к н - Ф о н е т _ Е Златоустова, Л. В. Фонетические единицы русской речи. – М. : МГУ, 1981. – 108 с. 24. З у В . В . . 1 9 8 3 с т - А к у с т _ О Зу, В. В., Шварц, P. M. Акустическая обработка и фонетический анализ // Методы автоматического распознавания речи / пер. с англ. – М. : Мир, 1983. Вып. 1. С. 142–170. 25. К а р н е в с к а я Е . Б . . 1 9 8 2 с т - М о д е л _ С _ М _ К Карневская, Е. Б., Лобанов, Б. М. Модели синтеза мелодического контура русских и английских фраз // Автоматическое распознавание слуховых образов (АРСО – 12). – Киев, 1982. С. 399 – 401. 148 26. К а р н е в с к а я Е . Б . . 1 9 8 0 с т - Л и н г в _ О Карневская, Е. Б., Лобанов, Б. М. Лингвоакустические основы двуязычного синтеза речи // Автоматическое распознавание слуховых образов (АРСО – 11). – Ереван, 1980. С. 119 – 122. 27. К у х а р ч и к П . Д . . 1 9 9 5 с т - Р а с п о _ И _ Ц Кухарчик, П. Д., Бовбель, Е. И., Хейдоров, И. Э. Распознавание изолированных цифр при помощи акустико-фонетической скрытой марковской модели // Компьютерный анализ данных и моделирование : Труды междунар. конф. – Мн., 1995. С. 58 – 62. 28. К у ч е р о в В . Я . . 1 9 8 3 к н - С и н т е _ Р Кучеров, В. Я., Лобанов, Б. М. Синтезированная речь в системах массового обслуживания. – М. : Радио и связь, 1983. 29. Л е в и н с о н C . Е . 1 9 8 5 с т - С т р у к _ М _ А _ Р Левинсон, C. Е. Структурные методы автоматического распознавания речи // ТИИЭР. 1985. T. 73. №11. C. 78 – 91. 30. Л о б а н о в Б . М . 1 9 9 1 с т - М и к р о _ С _ Р Лобанов, Б. М. Микроволновой синтез речи // Автоматическое образов (АРСО – 16). – М., 1991. С. 27–31. распознавание слуховых 31. М а т у с е в и ч М . И . 1 9 7 6 к н - С о в р е _ Р _ Я Матусевич, М. И. Современный русский язык. Фонетика. – М. : Просвещение, 1976. – 288 с. 32. М и х а й л о в В . Г . . 1 9 8 7 к н - И з м е р _ П _ Р Михайлов, В. Г., Златоустова, Л. В. Измерение параметров речи. – М. : Связь, 1987. 33. М о л ч а н о в А . П . . 1 9 7 0 с т - М е х а н _ А _ С Молчанов, А. П., Лабутин, В. К. Механизмы анализа сигналов в органе слуха и проблемы их моделирования. // Распознавание слуховых образов / под ред. Н. Г. Загоруйко и Г. Я. Волошина – Новосибирск : Наука СО, 1970. С. 142–204. 34. М о р г а н с т е й н С . . 1 9 9 9 с т - И д е н т _ и _ В Морганстейн, С., Сердюков, В., Зак, С. С. Идентификация и верификация говорящих для центров обработки телефонных звонков // Современные речевые технологии : Сб. научн. тр. IX сессии российского акустич. общества. – М., 1999. С. 133–136. 35. М о р о з о в В . П . 1 9 9 4 с т - Э м о ц и _ С Морозов, В. П. Эмоциональный слух как критерий профессионального отбора и подготовки специалистов-аудиторов правоохранительных органов // Тез. докл. Междунар. конф. – М., 1994. С. 32–33. 36. Н у ш и к я н Э . А . . 1 9 8 9 с т - О п р е д _ Э _ С Нушикян, Э. А., Трунин-Донской, В. Н., Ребгун, Э. К. Определение эмоционального состояния говорящего по акустическим параметрам речевого сигнала // Возможности судебной видеофонографической экспертизы. – М. : ВНИИСЭ, 1989. С. 38–49. 37. П е т р о в с к и й А . А . . 2 0 0 4 м е т - Р е ч е в _ И _ Э В С Петровский, А. А., Петровский, Ал. А., Лихачев, Д. С. Речевые интерфейсы ЭВС : метод. пособие для студ. спец. 40 02 02 «Электронные вычислительные средства» дневной формы обуч. – Мн. : БГУИР, 2004. – 66 с. 38. П е ч е н е в а Т . А . 2 0 0 4 с о с т - В и д ы _ Я _ Р Виды языкового разбора : краткий комплексный Т. А. Печенева. – Мн. : Изд. центр БГУ, 2004. – 99 с. словарь-справочник / Авт.-сост. 39. П о п о в Э . В . 1 9 8 2 к н - О бщ е н _ с _ Э В М Попов, Э. В. Общение с ЭВМ на естественном языке. – М. : Наука, 1982. – 360 с. 40. Р а б и н е р Л . Р . 1 9 8 9 с т - С к р ы т _ М _ М Рабинер, Л. Р. Скрытые марковские модели и их применение в избранных приложениях при распознавании речи : Обзор // ТИИЭР. 1989. T. 77. №2. C. 86 – 120. 149 41. Р а б и н е р Л . Р . . 1 9 7 5 с т - Ц и ф р о _ П _ Р _ С Рабинер, Л. Р., Шафер, Р. В. Цифровое представление речевых сигналов. : пер. с англ. // ТИИЭР, 1975. № 4. С. 141 – 159. 42. Р ы л о в А . С . . 1 9 9 6 с т - И д е н т _ Л Рылов, А. С., Чижденко, В. А. Идентификация личности по речевым фонограммам, изготовленным с помощью разных средств звукозаписи // Информатизация правоохранительных систем : Тез. докл. Междунар. конф. – М., 1996. С.187 – 189. 43. С а п о ж к о в М . А . 1 9 6 3 к н - Р е ч е в _ С Сапожков, М. А. Речевой сигнал в кибернетике и связи. – М. : Связь, 1963. – 452 с. 44. С б о р н _ Т _ П _ И И - 2 0 0 4 с б Сборник типовых учебных программ для высших учебных заведений по специальности I – 40 03 01 Искусственный интеллект. Специальные дисциплины. – Мн. : БГУИР, 2004. – 128 с. 45. Т у р б о в и ч И . Т . . 1 9 7 1 с т - О п о з н _ О Турбович, И. Т., Гитис, В. Г., Маслов, В. К. Опознание образов. – М. : Наука, 1971. С. 121–152. 46. Х и т и н а М . В . 1 9 9 5 с т - В о п р о _ К _ Д Хитина, М. В. Вопросы криминалистической диагностики эмоционального состояния человека по фонограммам его речи. Экспертная практика : Метод. разработки. Вып. 125. – М., 1995. С. 14 – 18. 47. Ч и с т о в и ч Л . Н . . 1 9 6 5 к н - Р е ч ь _ А _ и _ В Чистович, Л. Н., Кожевников, В. А. и др. Речь. Артикуляция и восприятие. – М.-Л. : Наука, 1965. – 64 с. 48. Ч и ч а г о в А . В . 1 9 9 1 с т - М о д е л и _ и _ П _ О Чичагов, А. В. Модели и первичное описание речевых сигналов / Научно-технический отчет по НИР «Казуар». – М. : ВЦ АН СССР, 1991. С. 6 – 13. 49. A t a l B . S . . 1 9 8 7 a r t - S p e e c _ A Atal, B. S., Hanauer, S. L Speech analysis and synthesis by linear prediction of the speech wave, J. Ac. Soc. America, Vol.50, №.1, March, 1987. 50. B o u r l a n d Н . . 1 9 9 0 a r t - L i n k s _ B _ M _ M Bourland, Н. and Wellenkens, C. J. Links between Markov models and multilayer perceptrons // IEEE Trans. Patt. Anal. and Mach. Intell. Vol. 12, No.6, 1990. P. 1167 – 1178. 51. B o v b e l E . I . . 1 9 9 9 a r t - A u t o r _ H _ M _ M Bovbel, E. I., Kheidorov, I. E, Tkachova, P. P. Autoregressive hidden Markov models for applied tasks of vocal fold pathology detection // Models and analysis of vocal emissions for biomedical applications : Workshop proc., Firenze, 1999. P. 108 – 111. 52. B o v b e l E . I . . 1 9 9 9 a r t - T h e _ U s a g e Bovbel, E. I., Kheidorov, I. E, Tkachova, P. P. The usage of hidden Markov models based on autoregressive principles for isolated words recognition // Symposium AeroSence SPIE–99 : Proc.– Florida, 1999. Vol. 3720. P. 434 – 443. 53. B o v b e l E . I . . 1 9 9 7 a r t - S t a t i _ I _ R Bovbel, E. I., Kheidorov, I. E. Statistical Image Recognition Methods for Isolated Word Recognition // International Conference CDAM–97 : Proc.–Minsk, 1997. P. 234 – 238. 54. B o v e s L . . 1 9 9 4 a r t - D e s i g _ a _ R Boves, L., Boogaart, T., Bos, L. Design and Recording of Lage Data bases for Use in Speaker Verification and Identification. Automatic Speaker Recognition, Identification and Verification : Proceeding of the ESCA Work shop. – Martigny, 1994. P. 43 – 46. 55. B r a e d e r s A . P . A . 1 9 9 5 a r t - T h e _ R o l e _ o f _ A Braeders, A. P. A. The Role of Automatic Speaker Recognition Techniques in forensic Investigations. ICPHS 95. – Stockholm, 1995. V. 3. P. 154 – 161. 56. B u z o A . . 1 9 8 0 a r t - S p e e c _ C Buzo, A., Gray, A., Gray, R. and Markel, J. Speech Coding Based Upon Vector Quantization // IEEE Trans. on Acoustics, Speech and Signal Processing. 1980. ASSP–28. № 5. 57. C a r b o n e l l N . . 1 9 8 4 a r t - A n _ e x p e r t _ S Carbonell, N., Fohr, D., Haton, J. P. et al. An expert system for the automatic reading of french spectrograms. – Proc. ICASSP–84, N.-Y., 1984, vol. 3. P. 4 – 12. 58. D e g t j a r e v N . P . 1 9 9 1 a r t - T w o - F o r m a _ M Degtjarev, N. P. Two-Formant Model of the Acoustic Description of Speech Articulation. Processing of the XII-th International Congress of Phonetic science. Aix-en-Provence, France, August 12–24,1991. Vol 2. P. 410 – 413. 59. D o d d i n g t o n G . R . . 1 9 8 8 a r t - T h e _ L P C _ T Doddington, G. R., Picone, J., Godfrey, J. J. The LPC trace as an HMM development tool, J. Ac. Soc. America. Vol. 84, Fall 1988. 150 60. H o l m e s W . J . . 1 9 9 7 a r t - U s i n g _ F _ F Holmes, W. J. and Garner, P. N. Using Formant Frequencies in Speech Recognition. Proc. EuroSpeech’97, Rhodes – Greece, 1997. 61. H o l m e s J . N . 1 9 9 3 a r t - S p e e c _ S Holmes, J. N. Speech Synthesis and Recognition. – London, 1993. P. 102 – 128. 62. H u a n g X . 1 9 9 2 a r t - P h o n e _ C _ U Huang, X. Phoneme Classification Using Semicontinuous Hidden Markov Models // IEEE Trans on Signal Processing. 1992. Vol. 40. № 5. 63. L e e K . F . 1 9 8 9 a r t - A u t o m _ S _ R Lee, K. F. Automatic Speech recognition, Kluwer, Boston, MA. 1989. 64. L i p p m a n R . P . 1 9 8 9 a r t - R e v i e _ o f _ N _ N Lippman, R. P. Review of neural networks for speech recognition // Neural Computation. Vol.1. 1989. №1. P.1 – 38. 65. L o b a n o v B . M . . 1 9 9 7 a r t - A n _ A l g o r _ f _ S - I Lobanov, B. M., Levkovskaja, T. V. An algorithm for speaker-independent word-pattern creation for speech recognition. In Digital image processing. Proceedings of the Institute Engineering Cybernetics, Academy of Science of Belarus, Minsk, 1997. P. 147 – 153. 66. L o b a n o v B . . 1 9 9 7 a r t - R e c o g _ o f _ W Lobanov, B., Levkovskaia, T. Recognition of words and words-sequences in running speech // Proc. Digital image processing. –Minsk : Institute Eng. Cybernetics, Academy of Science of Belarus, Minsk, 1997. P. 154 – 161. 67. L o b a n o v B . 1 9 8 2 a r t - O n _ t h e _ A c o u s Lobanov, B. On the Acoustic Theory of Coarticulation and Reduction. Proc. ICASP–82, Paris, 1982. P. 915 – 918. 68. L o b a n o v B . 1 9 8 1 a r t - A r t i c - F _ S _ S Lobanov, B. Articulatory-Formant Speech Synthesis from Printed Text. Proc. of Franco-Sovietique Symposium on Speech. Paris, 1981. P. 73 – 75. 69. M o r g a n N . . 1 9 9 5 a r t - N e u r a _ N Morgan, N., Bourlard, A. Neural networks for statistical recognition of continuous speech // Proceedings of the IEEE. 1995. Vol. 83. P. 742 – 769. 70. P o t a m i a n o s A . . 1 9 9 5 a r t - S p e e c _ F _ F Potamianos, A., Maragos, P.. Speech formant frequency and bandwidth tracking using multiband energy demodulation // IEEE. 1995. P. 784 – 787. 71. T o k h u r a Y . 1 9 8 7 a r t - A _ W e i g h _ C _ D Tokhura, Y. A weighted cepstral distance measure for speech recognition, IEEE Trans. on Acoustic, Speech, Signal Processing, ASSP–35, Oct 1987. N 10. 72. R e n a l s S . . 1 9 9 4 a r t - C o n n e _ P Renals, S., Morgan, N. et al. Connectionist Probability Estimators in HMM Speech Recognition // IEEE Trans on Speech and Audio Processing. 1994. Vol. 2. № 1. 73. R o u a t G . . 1 9 9 5 a r t - P i t c h _ D Rouat, G., Liu, Y. C., Morissette, D. A Pitch Determination and Voiced/unvoiced Decision Algorithm for Noisy Speech // Proc. Eurospeech–95. –Madrid, Spain, 1995. Vol. 1. P. 397 – 400. 74. R y l o v A . S . 1 9 9 9 a r t - P r a c t _ A Rylov, A. S. Practical Aspects and Basic Components of the Up-to-Date Speech Images Recognition Sistems. Speech Technology today : Proc. of the IX session of the Russian Acoustical Society. – Moscow. 1999. P. 116 – 121. 75. S c h m i d P . . 1 9 9 5 a r t - N - B e s t _ F _ T Schmid, P., Barnard, E. Robust, N-Best Formant Tracking // Proc. Eurospeech–95. –Madrid, Spain, 1995. Vol. 1. P. 737 – 740. 76. S i l v a C . . 1 9 9 9 a r t - O n _ I m p r o _ t h e _ D Silva, C., Chennoukh, S., Trancoso, I. On Improving the Decision Algorithm for Articulatory Codebook Search. Proceedings 6-th European Conference on Speech Communication and Technology – EUROSPEECH'99. Budapest, September 5–9, 1999. Vol. 1. P. 153 – 156. 77. S u n D . X . 1 9 9 5 a r t - R o b u s _ E Sun, D. X. Robust Estimation of Spectral Center-of-Gravity Trajectories Using Mixture Spline Models // Proc. Eurospeech–95. –Madrid, Spain, 1995. Vol. 1. P. 749 – 752. 78. V i n t s i u k T . K . 1 9 9 8 a r t - S i g n i _ S _ U Vintsiuk, T. K. Significant Speech Understanding Algorithm for a Dictation/Translation Machine. Proc. International Workshop Speech and Computer – SPECOM'98. St.-Petersburg, October 26–29, 1998. P. 197 – 202. 79. Z u e V . W . . 1 9 8 6 a r t - A n _ e x p e r t _ S Zue, V. W., Lamel, L. F. An expert spectrogram reader : a knowledge-based approach to speech recognition. – Proc. ICASSP–86,Tokyo. 1986. P. 1197 – 1200. 151