Эксперт Lumen5: как ИИ меняет видеопроизводство и делает его доступным для каждого
17.01.25, Пт, 16:59, Мск,
В современном мире видеоконтент играет ключевую роль в бизнесе. Технологии искусственного интеллекта открывают новые возможности для создания и обработки видео, позволяя компаниям оптимизировать расходы и повышать эффективность. Степан Михайлюк, Principal Software Engineer в Lumen5 и один из ведущих экспертов в области видеотехнологий, поделился своим опытом работы над инновационными проектами, ключевыми достижениями и взглядом на будущее индустрии. Степан также известен как главный разработчик в проекте Альфа-Онлайн, признанном лучшим онлайн-банкингом по версии MarksWebb. Он активно делится своим опытом на российских и международных конференциях, таких как HolyJS и Видеотех.
— Степан, расскажите, как вы пришли в сферу разработки ПО и видеотехнологий? Что вас привлекает в этой области?
Мой путь в IT начался еще в школьные годы, в физмат школе СУНЦ НГУ. Помимо обычных школьных предметов, я углубленно изучал физику и математику, что заложило прочный фундамент для моего будущего увлечения программированием.
Участие в олимпиадах по программированию сыграло ключевую роль в развитии моего аналитического мышления и способности находить нестандартные, элегантные решения сложных задач. Это увлечение переросло в серьезный интерес, и я решил получить высшее образование в этой сфере. Выбор пал на Университет ИТМО, известный своей сильной программистской школой. Я выбрал направление «Информатика и вычислительная техника», где получил прочные теоретические знания и ценный практический опыт. Практический опыт был для меня ключевым, поэтому уже с первых курсов, как бакалавриата, так и магистратуры, я совмещал учебу с работой в IT-компаниях. Это позволило мне не только применять полученные знания на практике, но и развить важные soft skills: работу в команде, эффективную коммуникацию, управление временем и адаптацию к динамичной среде разработки. Официально моя карьера разработчика началась в 2013 году.
Меня всегда привлекали сложные технические задачи, требующие креативного подхода и глубокого анализа. А сфера видеотехнологий – это динамично развивающаяся область на стыке творчества и технологий. Возможность постоянно учиться новому, решать нестандартные задачи и видеть измеримые результаты своей работы – вот что меня замотивировало. На данный момент меня интересуют, в частности, задачи, связанные с оптимизацией производительности, масштабируемостью систем, а также интеграцией различных технологий, таких как компьютерное зрение и машинное обучение.
— Вы работаете в Lumen5 над системой рендеринга видео с элементами ИИ. Расскажите подробнее об этом проекте. В чем его инновационность?
Lumen5 – это интеллектуальная платформа, миссия которой — сделать процесс создания профессионально выглядящих видеороликов максимально простым и доступным для каждого, независимо от уровня технических навыков. Например, на основе загруженного текста статьи или блога платформа анализирует контент с помощью алгоритмов обработки естественного языка (NLP) и автоматически подбирает релевантные медиафайлы из нашей библиотеки, генерирует закадровый голос, используя технологии text-to-speech, создает динамичные переходы и добавляет анимированные титры с применением алгоритмов компьютерного зрения. Пользователь может дальше редактировать полученный видеоролик, настраивая его под свои потребности. Такой подход позволяет значительно сократить время и затраты на производство видео, открывая новые возможности для бизнеса, маркетинга, образования и других областей.Определены ключевые работодатели для специалистов по ИИ в России. Рейтинг TAdviser
Ключевое преимущество Lumen5 – возможность редактировать видео прямо в браузере, без необходимости скачивать и устанавливать какое-либо специальное ПО. Это делает нашу платформу доступной для широкой аудитории. Однако работа в браузере накладывает определенные технические ограничения, и нам приходится решать задачи, связанные с производительностью и оптимизацией. Эти задачи нетипичные, поэтому готовых решений для многих из них просто не существует. К тому же, мы работаем в ограниченном технологическом стеке, что создает дополнительные вызовы, но также и открывает возможности для инноваций.
— Вы добились значительного снижения расходов Lumen5 на инфраструктуру рендеринга видео. Расскажите об этом достижении подробнее. Какие технологии вы использовали для достижения этого результата?
Оптимизация расходов на рендеринг видео — одна из ключевых задач в Lumen5. Изначально мы использовали различные подходы, включая традиционные локальные серверы и нескольких облачных провайдеров. Однако эти решения оказались неэффективными с точки зрения стоимости, масштабируемости и производительности.
После тщательного анализа и экспериментов, включая профилирование и A/B-тестирование, мы приняли решение перейти на более оптимальный технологический стек, основанный на микросервисной архитектуре. Этот переход был осуществлён в сочетании с оптимизацией алгоритмов обработки видео, направленной на снижение нагрузки на процессор и ускорение процесса рендеринга. Мы также внедрили использование NW.js, который позволил нам совместить быстрые API, предоставляемые браузером, такие как 2D Canvas и WebGL, вместе с быстрым декодером видео, написанным на C++. Кроме того, мы использовали более эффективные кодеки, такие как H.265/HEVC, которые обеспечивают лучшее сжатие без потери качества. Переход на более производительное оборудование с GPU-ускорением позволил нам снизить расходы на рендеринг в три раза.
В дальнейшем мы продолжили работу в этом направлении, активно используя облачные технологии, такие как автомасштабирование и спот-инстансы для оптимизации процессов. Этот опыт я обобщил в своих публикациях и докладах на российских технических конференциях, например, HolyJS.
— Вы также возглавляли разработку frontend-части проекта Альфа-Онлайн. Как вы поделились, этот проект был признан лучшим онлайн-банкингом по версии MarksWebb. В чем заключался ваш вклад в этот проект, и какие сложности вам пришлось преодолеть?
В Альфа-Банке мне посчастливилось возглавить команду разработчиков, которая занималась созданием новой платформы онлайн-банкинга — Альфа-Онлайн. Меня пригласили благодаря успешному запуску предыдущего проекта, когда я работал в Альфа-Банке в 2016–2017 годах, а также благодаря моему опыту разработки дизайн-системы в компании Wrike. Цель была амбициозной — создать современную платформу и вывести Альфа-Онлайн в лидеры рынка. Этот проект требовал от нас применения передовых технологий и современных методологий разработки. Мы использовали agile-подходы, что позволило нам быстро адаптироваться к изменяющимся требованиям и выпускать новые функции в короткие сроки.
Одной из основных сложностей была интеграция новой платформы с уже существующими системами банка — многими legacy-системами. Это потребовало решения ряда нетривиальных технических задач, связанных с обеспечением безопасности, надежности и масштабируемости системы. Мы уделили особое внимание пользовательскому опыту, применяя современные технологии frontend-разработки для создания интуитивно понятного и отзывчивого интерфейса.
В итоге нам удалось создать удобный, функциональный и быстрый онлайн-банк, который получил высокие оценки экспертов и завоевал доверие пользователей, что подтверждается лидирующими позициями в рейтинге MarksWebb — в течение последних нескольких лет Альфа-Онлайн занимает первые места в этом рейтинге.
— В 2022 году вы были частью core-команды по запуску мобильной версии Альфа-Онлайн, которая, по вашим словам, также получила высокие оценки экспертов. Как вам удалось адаптировать платформу к новым условиям рынка?
2022 год стал настоящим испытанием для многих компаний, включая банки. После удаления мобильных приложений из магазинов приложений резко возросла нагрузка на веб-версию «Альфа-Онлайн». Перед нами стояла задача оперативно адаптировать платформу для мобильных устройств, чтобы обеспечить непрерывный доступ к банковским услугам для наших клиентов. Благодаря слаженной работе команды и гибкости нашей платформы, нам удалось не только справиться с этой задачей, но и привлечь новых пользователей, предложив им удобный и безопасный способ управления своими финансами.
— Что, по вашему мнению, будут за основные технологические тренды в будущем, как в области онлайн-банкинга, так и в видеотехнологиях?
В онлайн-банкинге и видеотехнологиях мы видим огромный потенциал для развития технологий искусственного интеллекта. В банковской сфере ИИ может быть использован для персонализации услуг, оценки рисков, предупреждения мошенничества и автоматизации многих процессов. Это позволит банкам повысить эффективность своей работы и предложить клиентам более удобные и индивидуальные сервисы.
В видеотехнологиях ИИ открывает широкие возможности для создания более качественного и доступного видеоконтента. Автоматизация процессов видеомонтажа, генерация реалистичных спецэффектов, аналитика видео – всё это перспективные направления, которые будут активно развиваться в ближайшие годы. Кроме того, стоит отметить потенциал технологий виртуальной и дополненной реальности. В веб-разработке в целом, хотя и наблюдается тенденция к стандартизации, в специализированных областях, таких как рендеринг видео в браузере, остается много места для инноваций.
— Очень интересно! И, наконец, какие у вас планы на будущее? Чего вы хотите достичь в ближайшие годы?
В ближайшем будущем я планирую сосредоточиться на развитии своих навыков в области искусственного интеллекта и машинного обучения в рамках работы в Lumen5. Меня привлекают сложные технические задачи, и я хочу вносить свой вклад в развитие инновационных видеотехнологий. Я верю, что ИИ способен произвести революцию в видеопроизводстве, и я рад быть частью этого процесса. В частности, я заинтересован в исследовании и разработке новых алгоритмов для автоматического видеомонтажа, генерации видеоконтента и анализа видео с помощью ИИ. Моя цель – сделать создание профессионального видео доступным для всех, независимо от их технических навыков и бюджета.
Кроме того, я продолжаю преподавать дисциплину «Программирование веб-приложений» в Университете ИТМО, что позволяет мне делиться своим опытом и, надеюсь, зажигать в студентах ту же искру страсти к технологиям, которая когда-то привела меня к этому.
Автор: Кирилл Добронравов