Название базовой системы (платформы): | Сбер: GigaChat |
Разработчики: | Сбербанк |
Дата премьеры системы: | 2023/11/16 |
Технологии: | Речевые технологии |
Основные статьи:
- Распознавание речи (технологии, рынок)
- Речевые технологии: на пути от распознавания к пониманию
- Синтез речи
2023: Запуск приложения SaluteSpeech App
16 ноября 2023 года Сбер сообщил о запуске отдельного приложения для работы с речевыми технологиями — SaluteSpeech App. Это инструмент для распознавания аудио и озвучивания текста. Приложение доступно для популярных операционных систем, отличается простотой использования и включает в себя возможности GigaChat API, программного интерфейса доступа к сервису GigaChat.
В SaluteSpeech App два раздела, каждый из которых соответствует своей технологии. Раздел «Распознавание» предназначен для текстовой расшифровки встреч, звонков, интервью и любых других голосовых файлов. Раздел «Синтез», наоборот, позволяет озвучить текст, настраивая паузы и ударения, и даёт возможность скачать готовый аудиофайл на своё устройство. Синтезировать текст можно разными голосами из семи общедоступных вариантов на русском и английском языках.TAdviser выпустил новую Карту «Цифровизация промышленности»: свыше 250 разработчиков и поставщиков услуг
Использование GigaChat API дополнительно упрощает процесс подготовки аудиоконтента. Пользователь может загрузить короткие тезисы и попросить нейросетевую модель на их базе подготовить необходимый текст для последующего синтеза. Например, написать сказку по заданной теме, затем озвучить ее, чтобы полученный аудиофайл включать ребенку в машине или перед сном. Также с помощью GigaChat API в приложении SaluteSpeech App можно сделать короткую выжимку протокола встречи, аналитического отчёта или любого другого текста, а затем озвучить полученный материал. Есть множество и других кейсов, всё зависит от задач и фантазии пользователя.
Приложение будет доступно всем без оплаты и подойдёт для решения самых разных задач. Например, журналисты могут быстро расшифровать интервью, авторы книг — озвучить свои произведения, разработчики приложений с голосовыми командами — создавать для них голосовые дорожки, студенты —расшифровывать лекции и многое другое.
Для начала работы с SaluteSpeech App необходимо скачать приложение. Внутри приложения перейти по ссылке для создания проекта SaluteSpeech и GigaChat, далее перенести свои авторизационные данные из соответствующего проекта в приложение SaluteSpeech App. После чего можно приступить к решению задач с использованием технологий Сбера.
Подрядчики-лидеры по количеству проектов
Группа компаний ЦРТ (Центр речевых технологий) (44)
МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (29)
Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (27)
SteadyControl (18)
Naumen (Наумен консалтинг) (15)
Другие (195)
Группа компаний ЦРТ (Центр речевых технологий) (5)
Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (4)
SteadyControl (4)
3iTech (ранее 3i Technologies) (2)
Naumen (Наумен консалтинг) (2)
Другие (17)
МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (12)
Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (7)
Naumen (Наумен консалтинг) (3)
Voice Systems Robotics (VSR, VS Robotics) (3)
SteadyControl (2)
Другие (14)
Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров
Группа компаний ЦРТ (Центр речевых технологий) (17, 46)
МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (4, 30)
Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (12, 29)
SteadyControl (1, 23)
SteadyControl HoReCa (1, 23)
Другие (369, 216)
Группа компаний ЦРТ (Центр речевых технологий) (2, 5)
Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (1, 5)
SteadyControl HoReCa (1, 4)
SteadyControl (1, 4)
SberDevices (СалютДевайсы, ранее СберДевайсы) (2, 2)
Другие (9, 13)
МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (2, 12)
Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (2, 7)
SteadyControl HoReCa (1, 3)
Voice Systems Robotics (VSR, VS Robotics) (1, 3)
Naumen (Наумен консалтинг) (1, 3)
Другие (12, 16)
МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (1, 9)
Группа компаний ЦРТ (Центр речевых технологий) (4, 7)
Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (2, 7)
SteadyControl HoReCa (1, 7)
SteadyControl (1, 7)
Другие (18, 30)
Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (2, 7)
Сбербанк (3, 5)
SteadyControl HoReCa (1, 5)
SteadyControl (1, 5)
Ростелеком (2, 4)
Другие (23, 37)
Распределение систем по количеству проектов, не включая партнерские решения
МТТ VoiceBox - 24
SteadyControl Система контроля и управления персоналом - 23
BSS Digital2Speech - 21
Voice2Med Система распознавания речи в медицине - 14
Naumen Erudite - 13
Другие 203
BSS Digital2Speech - 5
Voice2Med Система распознавания речи в медицине - 4
SteadyControl Система контроля и управления персоналом - 4
3i TouchPoint Analytics - 2
МТТ VoiceBox - 2
Другие 11
МТТ VoiceBox - 11
BSS Digital2Speech - 6
VS Robotics: VS Робот-оператор - 3
SteadyControl Система контроля и управления персоналом - 3
Naumen Erudite - 3
Другие 14