Microsoft Cognitive Services

Продукт
Название базовой системы (платформы): Искусственный интеллект (ИИ, Artificial intelligence, AI)
Разработчики: Microsoft
Дата последнего релиза: 2017/01/02
Технологии: PaaS - Platform As A Service - Бизнес-платформа как сервис,  Речевые технологии,  Системы видеоаналитики,  Средства разработки приложений

На 17 апреля 2017 года Cognitive Services (ранее Project Oxford) - набор API-интерфейсов, посредством которых разработчики могут создавать интеллектуальные приложения с поддержкой изображений и речи, различных языков, технологий обработки знаний и поиска.

В составе набора:

  • API-интерфейс для распознавания лиц - определение, анализ, группировка лиц на фотографиях и присвоение им тегов
  • Content Moderator - автоматическая модерация изображений, текста и видео
  • API распознавания эмоций - персонализация взаимодействия с пользователем посредством распознавания эмоций
  • API компьютерного зрения - извлечение важной информации из изображений.


API-интерфейс для распознавания лиц

Распознает на изображениях лица по лицевым прямоугольникам и лицевым атрибутам, включая внешние признаки, позу и прогнозирование лицевых атрибутов на основе машинного обучения.

Обнаружение лиц, (2017)
  • Соотнесение лиц
    • Проверяет, принадлежат ли два портрета одному человеку, с оценкой степени достоверности.

  • Поиск похожих лиц

    • Запрос позволяет по изображению лица найти похожие лица из коллекции лиц.

  • Группирование лиц

    • Объединяет лица в группы на основе визуального сходства.

  • Распознавание лиц

    • Определяет, какому пользователю принадлежит лицо из запроса, на основании предоставленных пользователем данных о людях и их лицах.

API модерации изображений

Автоматически оценивает наличие оскорбительного и нежелательного содержимого на изображениях различных типов, в том числе на измененных изображениях. В Content Moderator предусмотрены распознавание текста (OCR) и обнаружение лиц, увеличивающие вероятность выявления нежелательного и спекулятивного содержимого. Технология позволяет выявлять нечеткие соответствия настраиваемым спискам запрещенных и разрешенных данных.Российский рынок ERP-систем сократился, но приготовился к росту. Обзор и рейтинг TAdviser 250 т

API модерации текста

Автоматически обнаруживает ненормативную лексику на более 100 языках и сопоставляет текст с настраиваемыми списками. Content Moderator также проверяет наличие вредоносных программ, фишинговых URL-адресов, а также использование личных сведений.


API модерации видео

Обеспечивает упреждающее обнаружение содержимого для взрослых на видео благодаря облачной модерации в службах мультимедиа Azure.


Средство пользовательской проверки

Специальные средства позволяют рабочим группам проверять результаты автоматизированной обработки, утверждать и изменять теги для их переопределения.


API распознавания эмоций

Этот API помогает создать приложения, реагирующие на настроение, распознающие эмоции и адаптирующиеся под человека. По выражению лица этот облачный API может распознавать удовлетворение, отсутствие эмоций, печаль, презрение, гнев, отвращение, страх и удивление. Алгоритмы искусственного интеллекта определяют эти эмоции на основе мимических шаблонов, применимых даже к разным культурам.

Распознавание эмоций, (2017)


API компьютерного зрения

  • Анализ изображения - Помогает получать информацию о визуальном содержимом изображений. Добавляет теги, описания и модели, предназначенные для определенных сфер для безошибочного определения и обозначения содержимого. Используется с параметрами для определения непристойных материалов и содержимого для взрослых, включая автоматическое ограничение такого содержимого. Определяет типы изображений и цветовые схемы на фотографиях.
  • Создание эскизов - создаёт удобные в хранении эскизы из любых входных изображений. Функция создания эскизов изменяет изображения в соответствии с требованиями к размеру, форме и стилю. Применяет интеллектуальную обрезку для создания эскизов, отличающихся от исходных изображений пропорциями, но содержащих интересующую область.
  • Считывание текста на изображениях - функция оптического распознавания символов позволяет выявлять текст на изображениях и извлекать распознанные слова в поток символов, пригодный для машинного чтения.
  • Распознавание знаменитостей - модель "Знаменитости" — один из примеров моделей, предназначенных для определенных сфер. Функция распознавания знаменитостей может распознать 200 тыс. известных деятелей бизнеса, политики, спорта и индустрии развлечений всего мира.

Text Analytics API

Данный API позволяет анализировать эмоциональную окраску повествования по шкале от 0% (очень негативная) до 100% (очень позитивная). Сервис поддерживает русский и английский, а также еще 13 языков: французский, немецкий, итальянский, испанский, датский, голландский, финский, греческий, норвежский, польский, португальский, шведский и турецкий.

По информации Microsoft, сфера применения технологии может быть очень широкой. Решение будет полезно, к примеру, представителям бизнеса для выявления соотношения положительных и отрицательных отзывов о компании, или же специалистам по коммуникациям для отслеживания тональности публикаций.

Модель использования: Text Analytics API можно интегрировать, например, с Twitter, а затем визуализировать результаты эмоционального анализа твитов с помощью Microsoft Power BI в сервисе автоматизации Microsoft Flow.

Попробовать Text Analytics API в действии можно в демо.

Робототехника





СМ. ТАКЖЕ (4)


Подрядчики-лидеры по количеству проектов

За всю историю
2021 год
2022 год
2023 год
Текущий год

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2021 год
2022 год
2023 год
Текущий год

Распределение систем по количеству проектов, не включая партнерские решения

За всю историю
2021 год
2022 год
2023 год
Текущий год

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Вокорд (Vocord) (9, 45)
  VizorLabs (Визорлабс) (9, 40)
  ВидеоМатрикс (Videomatrix) (17, 32)
  VisionLabs (ВижнЛабс) (13, 32)
  PTV Group (2, 25)
  Другие (325, 178)

Распределение систем по количеству проектов, не включая партнерские решения

За всю историю
2021 год
2022 год
2023 год
Текущий год