LASER (Language-Agnostic Sentence Representations)

Продукт
Разработчики: Meta Platforms
Дата последнего релиза: январь 2019 г
Технологии: Речевые технологии

2019: Раскрытие исходных кодов

В январе 2019 года Facebook раскрыла исходные коды инструмента LASER (Language-Agnostic Sentence Representations), предназначенного для понимания любой естественной речи. Этим шагом крупнейшая в мире социальная сеть внесла очередной ключевой вклад в то, чтобы ускорить перевод приложений, занимающихся обработкой естественно-языковых текстов и голосовых сообщений, на большее количество языков.

По сообщению издания SiliconANGLE, система LASER, базирующаяся на библиотеке глубокого обучения PyTorch, применяется Facebook для создания некой математической модели, которая может инкапсулировать и понимать все естественные языки, какими бы уникальными они ни были.

Facebook раскрыла исходники инструмента для понимания любой естественной речи

Исходники этого инструменты были выложены в открытый доступ спустя месяц после выхода исследования Facebook, в котором специалисты рассказали об обучении единой модели нейронной сети, которая может моделировать структуру из 93 языков в 34 отдельных алфавитах.

В конечном итоге Facebook получила, как сама компания называет это, «единое представление» или математическое преобразование предложений в форме векторов, которая включает в себя структурное сходство всех 93 языков. Игорь Лейпи, ГК Softline: Объем поставок российских операционных систем в ближайшие годы увеличится как минимум вдвое

Это единственное представление затем использовалось для обучения алгоритмов по нескольким задачам, предполагавшим сопоставление предложений между парами языков, которые программа никогда раньше не видела. Например, был реализован перевод со шведского языка на суахили и метод, позволяющий изучать языки «с нуля».

Исследователь Facebook Хольгер Швенк (Holger Schwenk) говорит, благодаря LASER языки с «ограниченными ресурсами», как ожидается, можно будет изучать совместно с более популярными языками, чтобы можно было построить модели обработки естественного языка для их понимания.[1]

Примечания



СМ. ТАКЖЕ (1)


Подрядчики-лидеры по количеству проектов

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Группа компаний ЦРТ (Центр речевых технологий) (43)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (27)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (23)
  Naumen (Наумен консалтинг) (14)
  Voice Systems Robotics (VSR, VS Robotics) (9)
  Другие (143)

  Группа компаний ЦРТ (Центр речевых технологий) (5)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (4)
  Naumen (Наумен консалтинг) (2)
  Neuro.net (Нейро) (2)
  Voice Systems Robotics (VSR, VS Robotics) (2)
  Другие (15)

  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (12)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (7)
  Naumen (Наумен консалтинг) (3)
  Voice Systems Robotics (VSR, VS Robotics) (3)
  Мегапьютер Интелидженс (Megaputer Intelligence) (2)
  Другие (11)

  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (9)
  Группа компаний ЦРТ (Центр речевых технологий) (8)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (6)
  Naumen (Наумен консалтинг) (4)
  Unlimited Production (Анлимитед Продакшен) (4)
  Другие (17)

  SberDevices (СалютДевайсы, ранее СберДевайсы) (2)
  Naumen (Наумен консалтинг) (1)
  Voice Systems Robotics (VSR, VS Robotics) (1)
  Группа компаний ЦРТ (Центр речевых технологий) (1)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (1)
  Другие (3)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Группа компаний ЦРТ (Центр речевых технологий) (16, 46)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (3, 28)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (10, 24)
  Яндекс (Yandex) (9, 14)
  Avaya (4, 13)
  Другие (296, 140)

  Группа компаний ЦРТ (Центр речевых технологий) (2, 5)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (1, 5)
  SberDevices (СалютДевайсы, ранее СберДевайсы) (2, 2)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (1, 2)
  Neuro.net (Нейро) (1, 2)
  Другие (7, 9)

  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (2, 12)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (2, 7)
  Voice Systems Robotics (VSR, VS Robotics) (1, 3)
  Naumen (Наумен консалтинг) (1, 3)
  Voximplant (Фастком) (2, 2)
  Другие (9, 11)

  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (1, 9)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (2, 8)
  Группа компаний ЦРТ (Центр речевых технологий) (4, 7)
  Unlimited Production (Анлимитед Продакшен) (1, 6)
  Naumen (Наумен консалтинг) (2, 4)
  Другие (11, 12)

  SberDevices (СалютДевайсы, ранее СберДевайсы) (2, 2)
  Naumen (Наумен консалтинг) (1, 1)
  Voice Systems Robotics (VSR, VS Robotics) (1, 1)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (1, 1)
  Яндекс (Yandex) (1, 1)
  Другие (3, 3)

Распределение систем по количеству проектов, не включая партнерские решения

За всю историю
2021 год
2022 год
2023 год
Текущий год

  МТТ VoiceBox - 24
  BSS Digital2Speech - 19
  Voice2Med Система распознавания речи в медицине - 14
  SmartLogger II - 12
  Naumen Erudite - 12
  Другие 155

  BSS Digital2Speech - 5
  Voice2Med Система распознавания речи в медицине - 4
  3i TouchPoint Analytics - 2
  Naumen Erudite - 2
  МТТ VoiceBox - 2
  Другие 9

  МТТ VoiceBox - 11
  BSS Digital2Speech - 6
  VS Robotics: VS Робот-оператор - 3
  Naumen Erudite - 3
  VoxImplant - 2
  Другие 12

  МТТ VoiceBox - 9
  BSS Digital2Speech - 7
  EXpress Защищенный корпоративный мессенджер - 6
  SmartLogger II - 4
  Naumen Erudite - 3
  Другие 16

  NLab Speech TTS - 1
  BSS Digital2Speech - 1
  Сбер SaluteSpeech (SmartSpeech) - 1
  VS Robotics Речевая аналитика - 1
  МТТ Голосовой бот - 1
  Другие 4