Яндекс: CatBoost

Продукт
Разработчики: Яндекс (Yandex)
Дата премьеры системы: 2017/07/18
Технологии: Средства разработки приложений

CatBoost - метод машинного обучения.

18 июля 2017 года компания Яндекс сообщила о создании метода машинного обучения CatBoost. Он предназначен для обучения моделей на разнородных данных.

В основу берутся сведения о местонахождении пользователя, история операций и тип устройства. Библиотека машинного обучения CatBoost опубликована в открытом доступе, её могут использовать все желающие.

CatBoost заявлена, как наследник метода машинного обучения Матрикcнет - он применяется почти во всех сервисах Яндекса. Как и Матрикснет, CatBoost использует механизм градиентного бустинга (англ. boosting - улучшение): он подходит для работы с разнородными данными.

CatBoost учитывает модели числовых и нечисловых данных - виды облаков или типы зданий. Прежде эти данные переводились на язык цифр, и это могло поменять их суть, повлиять на точность работы модели. Теперь их можно использовать в первоначальном виде. Это помогает CatBoost демонстрировать повышенное качество обучения. Его можно применять в разных сферах - от банковской до производственной.

«
Яндекс много лет занимается машинным обучением, и CatBoost создавали лучшие специалисты в этой области. Выкладывая библиотеку CatBoost в открытый доступ, мы хотим внести свой вклад в развитие машинного обучения. Надо сказать, что CatBoost — российский метод машинного обучения, который стал доступен в open sourсe. Надеемся, что сообщество специалистов оценит его по достоинству и поможет сделать ещё лучше.

Михаил Биленко, руководитель управления машинного интеллекта и исследований Яндекса
»

Метод протестирован на сервисах Яндекса. В рамках эксперимента он применялся для улучшения результатов поиска, ранжирования ленты рекомендаций Яндекс.Дзен и для расчёта прогноза погоды в технологии Метеум. В дальнейшем CatBoost будет работать и на других сервисах. Его использует команда Yandex Data Factory — в своих решениях для промышленности, в частности для оптимизации расхода сырья и предсказания дефектов. Европейский центр ядерных исследований (ЦЕРН) внедрил CatBoost: центр использует продукт для объединения данных, полученных с разных частей детектора LHCb.Российский рынок CRM-систем: оценки, тренды, крупнейшие поставщики и перспективы. Обзор TAdviser 149 т

Для работы с CatBoost достаточно установить его на компьютер. Библиотека поддерживает операционные системы Linux, Windows и macOS и доступна на языках программирования Python и R.

Загрузка CatBoost доступна на GitHub.

Робототехника





СМ. ТАКЖЕ (6)


Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Microsoft (41, 47)
  Солар (ранее Ростелеком-Солар) (2, 46)
  Oracle (49, 26)
  Hyperledger (Open Ledger Project) (1, 23)
  IBM (33, 18)
  Другие (553, 270)