Научная тема: «МЕТОДЫ И МОДЕЛИ РАСПОЗНАВАНИЯ РУССКОЙ РЕЧИ В ИНФОРМАЦИОННЫХ СИСТЕМАХ»
Специальность: 05.13.01
Год: 2014
Отрасль науки: Технические науки
Основные научные положения, сформулированные автором на основании проведенных исследований:
  • Модель длительности звуков речи; классификация и модели звуков русской речи, учитывающие структуру звуковой волны, их применение для распознавания речи.
  • Концепция статистической модели речи и метод транскрипционного моделирования вариативности произнесения слов русской речи; их применение для построения универсальных речевых баз.
  • Психоакустическая модель восприятия звуковых сигналов человеком и ее применение в распознавании речи и оценке качества передачи речи.
  • Модель усредненной речи и средства минимизации фонетической сети для поиска ключевых слов и распознавания речи.
  • Методы и программные средства оценки качества передачи речи.
Список опубликованных работ
1.Гусев, М. Н. Оценка качества восстановленной и синтетической речи / М. Н. Гусев, В. М. Дегтярев // Труды учебных заведений связи, СПбГУТ. – 2005. – № 172. – С. 64–72 (на момент публикации входил в перечень ВАК).

2.Гусев, М. Н. Компьютерная статистическая модель русского языка / М. Н. Гусев, В. А. Смирнов, В. М. Дегтярев // Труды учебных заведений связи, СПбГУТ. – 2006. – № 174. – С. 129–135 (на момент публикации входил в перечень ВАК).

3.Гусев, М. Н. Моделирование длительности звуков в системе распознавания речи / М. Н. Гусев, В. М. Дегтярев // Вопросы радиоэлектроники. Серия Общетехническая. – 2010. – Вып. 2. – С. 106–115 (из перечня ВАК).

4.Гусев, М. Н. Увеличение производительности системы распознавания речи / М. Н. Гусев, В. М. Дегтярев // Вопросы радиоэлектроники. Серия Общетехническая. – 2010. – Вып. 2. – С. 115–126 (из перечня ВАК).

5.Гусев, М. Н. Функция лингвистического процессора в системе автоматического анализа неструктурированной речевой информации / В. А. Смирнов, М. Н. Гусев, М. П. Фархадов // Автоматизация и современные технологии. – 2013. – № 8. – С. 22–28 (из перечня ВАК).

6.Гусев, М. Н. Функция модуля акустического моделирования в системе автоматического анализа неструктурированной речевой информации / В. А. Смирнов, М. Н. Гусев, М. П. Фархадов // Управление большими системами. – 2013. – Вып. 45. – С. 181–205 (из перечня ВАК).

7.Гусев, М. Н. Психоакустическая модель в системе распознавания речи / М. Н. Гусев // Системы управления и информационные технологии. – 2014. – № 1.1 (55). – С. 125–131 (из перечня ВАК).

8.Гусев, М. Н. Построение модели усредненной речи / М.Н. Гусев, В. А. Смирнов // Системы управления и информационные технологии. – 2014. – № 2.1 (56). – С. 133–137 (из перечня ВАК).

9.Пат. 2296377 Российская Федерация, МПК G 10 L 19 / 14 (2006.01). Способ анализа и синтеза речи, Гусев М. Н., Дегтярёв В. М., Ситников В. В.; заявитель и патентообладатель Гусев М. Н. – № 2005118283/09; заявл. 14.06.2005; опубл. 27.03.2007, Бюл. № 9 – 2 с. : ил.

10.Пат. 2312405 Российская Федерация, МПК G 10 L 19 / 02 (2006.01), G10L15/00 (2006.01). Способ осуществления машинной оценки качества звуковых сигналов, Гусев М. Н., Дегтярёв В. М., Жарков И. В.; заявитель и патентообладатель М. Н. Гусев. – № 2005128572/09; заявл. 13.09.2005; опубл. 10.12.2007, Бюл. – № 34 (ч. 2) – 2 с. : ил.

11.Пат. 2386178 Российская Федерация, МПК G 10 L 13 / 08 (2006.01), G 06 F 17 / 21 (2006.01). Способ предварительной обработки текста, Гусев М. Н., Егорова О. Б., Смирнов В. А.; заявитель и патентообладатель Общество с Ограниченной Ответственностью «ВОКАТИВ». – № 2007143417/09; заявл. 22.11.2007; опубл. 10.04.2010, Бюл. № 10 – 2 с. : ил.

12.Пат. 2435232 Российская Федерация, МПК G 10 L 15 / 14 (2006.01). Способ машинной оценки качества передачи речи, Гусев М. Н.; заявитель и патентообладатель Гусев М. Н. – № 2010133428/08; заявл. 09.08.2010; опубл. 27.11.2011, Бюл. № 33. – 2 с. : ил.

13.Пат. 61924 Российская Федерация, МПК G 10 L 21 / 00 (2006.01). Статистическая модель речи, Гусев М. Н., Жарков И. В., Ситников В. В.; заявитель и патентообладатель Гусев М. Н. – № 2006108050/22; заявл. 14.03.2006; опубл. 10.03.2007, Бюл. № 7 (ч. 2) – 2с : ил.

14.Пат. 60767 Российская Федерация, МПК G 09 B 19 / 22 (2006.01). Устройство развивающей аудиоигры (варианты), Жарков И. В., Гусев М. Н., Ситников В. В.; заявитель и патентообладатель Жарков И. В., Гусев М. Н., Ситников В. В. – № 2006129334/22; заявл. 11.08.2006; опубл. 27.01.2007, Бюл. № 3 (ч. 2) – 2с : ил.

15.Гусев, М. Н. PsyFilter / Свидетельство о государственной регистрации программы для ЭВМ № 2014610248 от 09.01.2014.

16.Гусев, М. Н. AQuA-SE / Свидетельство о государственной регистрации программы для ЭВМ № 2014610633 от 15.01.2014.

17.Гусев, М. Н. NIQA-SE / Свидетельство о государственной регистрации программы для ЭВМ № 2014611132 от 24.01.2014.

18.Гусев, М. Н. Расчет и измерение качества речевых сигналов [монография] / М. Н. Гусев, В. М. Дегтярев. – СПб. : Геликон Плюс, 2008. – 275 с.

19.Гусев, М. Н. Система распознавания речи: основные модели и алгоритмы [монография] / М. Н. Гусев, В. М. Дегтярев. – СПб. : Знак, 2013. – 128 с.

20.Gusev, M. N. Physical properties modification of speech signals fragments / Mikhail N. Gusev // New Approaches to High-Tech: Nondestructive Testing and Computer Simulations in Science and Engineering" Preprints and Program. – St.Peterburg, Russia, 2003. – РР. 5–7.

21.Gusev, M. N. Physical properties modification of speech signals fragments / Mikhail N. Gusev // New Approaches to High-Tech: Seven International Workshop on Nondestructive Testing and Computer Simulations in Science and Engineering. – St.Peterburg, Russia, 2003. – РР. 300–305.

22.Gusev, M. N. About a method of preprocessing of sound base / Mikhail N. Gusev, Vladimir M. Degtyarev, Valery V. Sitnikov // Proceedings of SPAS Vol.9 Ninth International Workshop on New Approaches to High-Tech: Nondestructive Testing and Computer Simulation in Science and Engineering, edited by Alexander I. Melker. – PP. 120–125.

23.Gusev, M. N. Preparation of sound base for a text-to-speech synthesis system / Vladimir M. Degtyarev, Mikhail N. Gusev // In Eighth International Workshop on Nondestructive Testing and Computer Simulations in Science and Engineering, edited by Alexander I. Melker, Proceedings of SPIE Vol. 5831 (SPIE, Bellingham, WA, 2005). – РР. 207–213.

24.Гусев, М. Н. Голос Времени / И. Жарков, П. Скрелин, М. Гусев // Компьютер пресс. – 2005. – № 8. – С. 86–92.

25.Gusev, M. N. Objective method of speech signal quality estimation / Valentin Smirnov, Mikhail Gusev // Proceedings of the 11-th International Conference "Speech and Computer" SPECOM´2006. – St.Petersburg, Anatolya Publishers, 2006. – PP. 242–244.

26.Гусев, М. Н. Практическое применение статистической модели русского языка / М. Н. Гусев, В. М. Дегтярев, В. А. Смирнов, И. В. Жарков // 58 научно-техническая конференция профессорско-преподавательского состава, научных сотрудников и аспирантов ГУТ. – СПб. : СПбГУТ, 2006. – С. 137–138.

27.Gusev, M. N. Speech Recognition System for the Russian Speech / Olga Bolotova, Michael Gusev, Valentin Smirnov // Proceedings of the 12-th International Conference "Speech and Computer" SPECOM´2007. – V.II. – Moscow, 2007. – PP. 475–480.

28.Гусев, М. Н. Оптимизация системы распознавания речи с учетом особенностей артикуляции / М. Н. Гусев, В. М. Дегтярев, Н. Н. Семенов // Труды учебных заведений связи, СПбГУТ. – 2007. – № 177. – С. 20–24.

29.Гусев, М. Н. Автоматизация аннотирования звуковых баз слитной речи / М. Н. Гусев, В. М. Дегтярев, Н. Н. Семенов // Труды учебных заведений связи, СПбГУТ. – 2008. – № 178. – С. 13–20.

30.Гусев, М. Н. Детализация моделей звуков русской речи, учитывающих особенности артикуляции / М. Н. Гусев, В. М. Дегтярев, Н. Н. Семенов // Труды учебных заведений связи, СПбГУТ. – 2008. – № 179. – С. 24–31.

31.Гусев, М. Н. Определение произнесения слов, не входящих в словарь системы распознавания / М. Н. Гусев // 61 научно-техническая конференция профессорско-преподавательского состава, научных сотрудников и аспирантов ГУТ. – СПб. : СПбГУТ,

2009. – С. 214.

32. Гусев, М. Н. Моделирование длительности звуков в системе распознавания речи / М. Н. Гусев // 62 научно-техническая конференция профессорско- преподавательского состава, научных сотрудников и аспирантов ГУТ. – СПб. : СПбГУТ, 2010. – С. 325–326.

33.Гусев, М. Н. Метод оценки качества речевых сигналов NIQA / В. М. Дегтярев, М. Н. Гусев // Инфокоммуникационные технологии в науке, здравоохранении и образовании: сб. научн. трудов IV международного конгресса «Нейробиотелеком– 2010». – СПб. : СПбГУТ, 2010. – С. 13–18.

34.Гусев, М. Н. Выделение ключевых слов / М. Н. Гусев, В. М. Дегтярев // Речевые технологии. – 2012. – № 1. – С. 15–21.

35.Гусев, М. Н. Программный комплекс оценки качества систем распознавания речи / М. Н. Гусев, В. М. Дегтярев // Актуальные проблемы инфотелекоммуникаций в образовании и науке, II-я Международная научно-техническая и научно-методическая конференция: сб. научн. статей под. ред. С. М. Доценко. – СПб. : СПбГУТ, 2013. – С. 559– 563.

36.Гусев, М. Н. Расширенная модель длительности звуков для системы распознавания речи / М. Н. Гусев // Современное машиностроение. Наука и образование: Материалы 3-й Междунар. науч.-практ. конференции / Под ред. М. М. Радкевича и А. Н. Евграфова. – СПб. : Изд-во Политехн. ун-та, 2013. – С. 1112–1121.

37.Gusev, M. N. Evaluation of the speech transmission quality by phonemic recognition / Vladimir M. Degtyarev, Mikhail N. Gusev, Helen V. Plotnikova, Endre Domiczi // Nauka i Studia. – 2013. – NR 30 (98). – PP. 78–85.

38.Гусев, М. Н. Определение языка звучащей речи / М. Н. Гусев, В. М. Дегтярев, Е. В. Плотникова // Материали за 9-а международна научна практична конференция, «Бъдещето въпроси от света на науката» – 2013. – Т. 34. Съвременни технологии на информации. – София, «Бял ГРАД-БГ», ООД, 2013. – PP. 41–50.

39.Гусев, М. Н. Определение неречевых сигналов / М. Н. Гусев, В. М. Дегтярев, Е. В. Плотникова // Materiály X mezinárodní vědecko - praktická konference «Věda a vznik– 2013/2014». – Díl Moderní informační technologie.: Praha, Publishing House «Education and Science» s.r.o, 2013/2014. – PP. 40–45.

40.Gusev, M. N. Psychoacoustic model in evaluation of speech transmission quality / Vladimir M. Degtyarev, Mikhail N. Gusev, Helen V. Plotnikova, Endre Domiczi // Nauka i Studia. – 2013. – NR 42 (110). – Prezemysl, Nauka i Studia, 2013. – PP. 79–91.

41.Gusev, M. N. Language identification of sounding speech / Vladimir M. Degtyarev, Mikhail N. Gusev, Helen V. Plotnikova, Endre Domiczi // Nauka i Studia. – 2014. – NR 6 (116). – Prezemysl, Nauka i Studia, 2014. – PP. 16–26.