Microsoft SilentVoice
Система распознавания беззвучной речи

Продукт
Разработчики: Microsoft
Дата премьеры системы: декабрь 2018 г
Технологии: Речевые технологии

2018: Анонс

В декабре 2018 года Microsoft представила систему распознавания беззвучной речи, которая, как утверждают в компании, работает очень точно.

В системе под названием SilentVoice применяются специальный микрофон с поп-фильтром и программное обеспечение. Чтобы активировать распознавание, не нужно произносить какие-то команды — достаточно артикулировать слова, не используя голосовые связки: технология определяет разницу в воздушных потоках, создаваемых различными видами речи.

По словам разработчиков, новый интерфейс голосового ввода позволяет распознавать речь, даже если говорящий не произносит ни звука, с 98,8-процентной точностью. Система способна распознавать звуки громкостью менее 39 дБ. Она фиксирует колебания воздуха возле губ пользователя. Система расшифровывает их и переводит в слышимый голос или текст. Посторонние шумы технология отсекает и записывает голос очень чисто. Запись звука осуществляется при вдохе, а не на выдохе.

В Microsoft говорят, что новая разработка способна решить проблему затрудненного использования голосовых ассистентов, разговоров по телефону и записи голосовых сообщений в местах скопления людей, таких как общественный транспорт и открытое офисное пространство.

Компания также рассчитывает, что SilentVoice особенно пригодится носимой электронике: «умный» микрофон может быть встроен в компьютеризированные наручные часы, кольцо или кулон.

Microsoft представила систему распознавания беззвучной речи с 99-процентной точностью

Возможности SilentVoice были продемонстрированы на конференции по проблемам человеческого фактора в вычислительных системах ACM CHI 2018.

Microsoft давно работает над системами распознавания голоса, впрочем, равно как и конкуренты. Так, в октябре 2018 года Google презентовала технологию VoiceFilter, которая посредством искусственного интеллекта вычленяет голос конкретного человека среди шума.[1]

Примечания



Подрядчики-лидеры по количеству проектов

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Группа компаний ЦРТ (Центр речевых технологий) (43)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (27)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (24)
  Naumen (Наумен консалтинг) (14)
  Voice Systems Robotics (VSR, VS Robotics) (9)
  Другие (146)

  Группа компаний ЦРТ (Центр речевых технологий) (5)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (4)
  3iTech (ранее 3i Technologies) (2)
  Naumen (Наумен консалтинг) (2)
  Neuro.net (Нейро) (2)
  Другие (15)

  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (12)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (7)
  Naumen (Наумен консалтинг) (3)
  Voice Systems Robotics (VSR, VS Robotics) (3)
  Мегапьютер Интелидженс (Megaputer Intelligence) (2)
  Другие (11)

  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (9)
  Группа компаний ЦРТ (Центр речевых технологий) (8)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (6)
  Naumen (Наумен консалтинг) (4)
  Unlimited Production (Анлимитед Продакшен) (4)
  Другие (18)

  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (2)
  SberDevices (СалютДевайсы, ранее СберДевайсы) (2)
  AllSee (АЛЛ СИИ) (1)
  Naumen (Наумен консалтинг) (1)
  Voice Systems Robotics (VSR, VS Robotics) (1)
  Другие (5)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Группа компаний ЦРТ (Центр речевых технологий) (16, 46)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (3, 28)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (11, 25)
  Яндекс (Yandex) (9, 14)
  Avaya (4, 13)
  Другие (298, 142)

  Группа компаний ЦРТ (Центр речевых технологий) (2, 5)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (1, 5)
  SberDevices (СалютДевайсы, ранее СберДевайсы) (2, 2)
  3iTech (ранее 3i Technologies) (1, 2)
  Naumen (Наумен консалтинг) (1, 2)
  Другие (7, 9)

  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (2, 12)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (2, 7)
  Naumen (Наумен консалтинг) (1, 3)
  Voice Systems Robotics (VSR, VS Robotics) (1, 3)
  Voximplant (Фастком) (2, 2)
  Другие (9, 11)

  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (1, 9)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (2, 8)
  Группа компаний ЦРТ (Центр речевых технологий) (4, 7)
  Unlimited Production (Анлимитед Продакшен) (1, 6)
  Naumen (Наумен консалтинг) (2, 4)
  Другие (11, 12)

  SberDevices (СалютДевайсы, ранее СберДевайсы) (2, 2)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (2, 2)
  Группа компаний ЦРТ (Центр речевых технологий) (1, 1)
  Наносемантика (Nanosemantics Lab) (1, 1)
  Сбер Бизнес Софт (1, 1)
  Другие (5, 5)

Распределение систем по количеству проектов, не включая партнерские решения

За всю историю
2021 год
2022 год
2023 год
Текущий год

  МТТ VoiceBox - 24
  BSS Digital2Speech - 19
  Voice2Med Система распознавания речи в медицине - 14
  SmartLogger II - 12
  Naumen Erudite - 12
  Другие 157

  BSS Digital2Speech - 5
  Voice2Med Система распознавания речи в медицине - 4
  Neuro.net Голосовой робот - 2
  3i TouchPoint Analytics - 2
  Naumen Erudite - 2
  Другие 9

  МТТ VoiceBox - 11
  BSS Digital2Speech - 6
  Naumen Erudite - 3
  VS Robotics: VS Робот-оператор - 3
  PolyAnalyst Платформа визуальной разработки сценариев анализа данных и текстов - 2
  Другие 12

  МТТ VoiceBox - 9
  BSS Digital2Speech - 7
  EXpress Защищенный корпоративный мессенджер - 6
  SmartLogger II - 4
  Naumen Erudite - 3
  Другие 16

  NLab Speech TTS - 1
  BSS и Ростелеком: Виртуальный голосовой ассистент - 1
  СберБизнесБот - 1
  Сбер SaluteSpeech (SmartSpeech) - 1
  VS Robotics Речевая аналитика - 1
  Другие 6