О технологических трендах на рынке голосовых и чат-ботов
Статья входит в Обзор российского рынка голосовых и чат-ботов.
Содержание |
Технологические тренды
Опрошенные эксперты отметили безусловную исключительность влияния на отрасль генеративных нейросетей и флагманов этой индустрии, в особенности ChatGPT, в 2023 году.
По словам Светланы Захаровой, директора по развитию бизнеса Just AI, влияние генеративного ИИ на рынок сложно сравнивать с влиянием других технологий. Появление LLM-моделей "перевернуло", по ее словам, подход к разработке продуктов и решений, к клиентскому сервису, и в будущем это влияние будет только усиливаться.
При этом нужно не забывать, что LLM – это не только про работу с текстом, но и изображениями, аудио и видео, – подчеркнула эксперт. – Так что технологии генИИ начинают двигаться по принципу раскручивающейся спирали. |
Владислав Беляев, исполнительный директор и сооснователь ИИ-платформы AutoFAQ уверен, что популярность генеративных нейросетей, которая связана с появлением СhatGPT, самого быстрорастущего в истории ИТ-продукта, стала ключевым событием для отрасли.
Изначально технология была ориентирована на интернет-пользователей (B2C), сегодня мы видим интерес и в корпоративном сегменте (B2B), – рассказал эксперт. – Новая реальность действительно наступила, но ее суть не в том, что нейросети заменят человека, а в том, что человек получил мощный инструмент, способный менять подход в решении бизнес-задач. |
Так, ChatGPT отлично справляется с написанием текста, но без участия человека невозможно оценить его качество, достоверность и уникальность. То же самое и на рынке поддержки: нейросети отлично справляются с решением простых вопросов пользователей, но без участия человека невозможно обработать обращения, которые требуют выполнения определенного сценария, работы в соответствии с регламентами и персональными данными.Эволюция в развитии российских средств защиты от сетевых угроз: как Kaspersky NGFW меняет расстановку сил на рынке
Владислав Вирясов, директор «Авантелеком» отметил особый всплеск в области нейросетевых технологий и обработки естественного языка. В этом году на рынке и в России, и в мире появилось много новых ИИ-продуктов, а уже существующие выпустили новые релизы и развили функциональные возможности. По словам эксперта, этот тип ИИ-продуктов продолжает оказывать существенное влияние на многие сферы бизнеса, значительно трансформируя некоторые из них. ИИ стал неотъемлемой частью всей экосистемы корпоративных коммуникаций, и его влияние будет возрастать в ближайшие годы, резюмировал эксперт.
OpenAI, как лидер рынка, оперативно выпускает новые модели и задает тренды, а остальные игроки не менее быстро их догоняют, поделился директор по искусственному интеллекту Сбер Бизнес Софт Максим Иванов. В 2023 году OpenAI выпустила GPT-4 и GPT-4V, GPT-Store и GPTs – принципиально новые продукты для создания персонализированных ассистентов, отметил он. Также компания представила модель 4o – появилась поддержка мультимодальности, модель "понимает" изображения, голос и не только. В о1 модель научилась рассуждать, проверять свои действия, исправлять ошибки, используя обучение с подкреплением.
Кроме того, вышла LLaMA 2 – Open Source модель, которая быстро завоевала доверие комьюнити. Google выпустил Gemini и RT-2 (модель для робототехники), те же Microsoft/Apple/Google начали внедрять модели в свои операционные системы. Появляются AI-агенты и конструкторы по их созданию. В то же время Сбер представил конкурентную LLM GigaChat и набор инструментов для работы с ней. Все эти события очень сильно повлияли на рынок, подчеркнул эксперт.
Александр Крушинский, директор департамента голосовых цифровых технологий компании BSS также считает, что GPT-like боты (LLM или генеративный разговорный AI) – это основной тренд и основная технологическая возможность, которая "ищет" свое место в Enterprise-решениях. И пока этот процесс поиска, по словам эксперта, находится в самом начале. С одной стороны, LLM открывают массу возможностей: можно делать виртуальных ассистентов, которые будут консультировать по всему массиву внутренней документации компании без необходимости дополнительного обучения, можно анализировать обращения клиентов для выявления инсайтов и автоматически выдавать рекомендации по улучшению качества обслуживания, или же можно заменять программистов AI-агентами, которые будут писать ТЗ, разрабатывать по ним системы и тестировать их.
И вроде как даже есть реальные примеры эксплуатации LLM для этих задач. Но все это пока в виде, скорее, ранних прототипов. При ближайшем рассмотрении оказывается, что применение LLM сильно ограничено: размером "контекстного окна", производительностью, интеллектуальностью, "галлюцинированием" нейросети и т.д., – рассказал он. |
Для обхода этих ограничений требуются существенные вложения в технологическую обвязку (такую как RAG, Human in Loop и т.д.). Впрочем, оговорился эксперт, это вовсе не значит, что LLM уже уперся в какой-то теоретический потолок применимости, через который бизнес не сможет пробиться. Сейчас одновременно происходят два процесса. Во-первых, сами базовые модели становятся лучше (практически каждый месяц). Во-вторых, бизнес учится обходить или устранять существующие ограничения. Строятся GPU-кластеры, нащупываются границы реального применения LLM в рутинных задачах.
В будущем голосовые и чат-боты станут неразрывно связаны с различными LLM-моделями, считает Татьяна Гапоненко, директор по маркетингу ГК «Наносемантика».
В 2024 году мы увидели увеличение количества LLM-моделей в мире и в России, в перспективе трех лет произойдет их кратный рост, но при этом будут явно выделяться лидеры, в которых будут вложены миллиарды долларов, – рассказала специалист. – Что касается других моделей, то будет происходить их заточка под определенный функционал и сферу. |
Также она прогнозирует активное развитие LLM-моделей, которые можно будет ставить в контур к заказчикам и дополнительно обучать под конкретные запросы и предметную область. А те компании, которые буду использовать коммуникативный ИИ, получат преимущество перед конкурентами.
Роман Милованов, руководитель направления разработки чат-ботов и голосовых роботов компании «Сател» отметил в качестве основных событий 2023 года релизы ChatGPT и Gemini: обновленный ChatGPT показал успехи в обработке естественного языка, а Gemini от Google выделился многозадачностью и интеграцией ИИ в приложения. Эти продукты оказали значительное влияние на рынок голосовых роботов и чат-ботов, ускорив автоматизацию и повысив персонализацию услуг, улучшили процесс взаимодействия с клиентом, снижая операционные затраты и увеличивая эффективность. Появление этих технологий установило новые стандарты для рынка и направило развитие ИИ на ближайшие годы.
Антон Корнильев, эксперт по решениям для контактных центров и унифицированным коммуникациям К2 Тех считает, что появление и массовое распространение решений в области генИИ сильно изменило подход многих людей к решению рабочих задач: то, что раньше требовало исключительно творческого и "человеческого" ума, стало возможно поручить машине, причем с приемлемым результатом, требующим минимальной доработки профессионалом. Например, в области унифицированных коммуникаций, благодаря генИИ, теперь возможна суммаризация диалогов операторов с клиентами в рамках контактного центра или обсуждений коллег в ходе ВКС-встреч.
Используя комбинацию GPT и RAG, мы можем в десятки раз сократить time-to-market для разработки и актуализации сценариев взаимодействия ботов с клиентом в части персонализированных ответов на частые информационные вопросы, – констатировал эксперт. |
Антон Корнильев уверен, что быстрое развитие генИИ имеет шанс дать начало новой эре как в ИТ, так и в повседневной жизни людей.
Один из продолжающихся трендов — применение ИИ в разных отраслях, в том числе на рынке B2C. По данным исследования АО «Деловая среда» и Rambler&Co, примерно каждый пятый россиянин (19%) активно использует ИИ в своей работе. Технологии ИИ в каком-то смысле меняют культуру деловой коммуникации, помогают компаниям и пользователям отдать часть рутинных действий искусственному интеллекту и сосредоточиться на важных стратегических задачах. Например, в нашей платформе VK WorkSpace есть «AI Ассистент». Он умеет создавать суммаризацию видеоконференций, писем, переписок в чатах, выделяя главное. Такой сервис может быть востребован в любом бизнесе и помогает сотрудникам быстрее решать рабочие вопросы и не тратить время на перечитывание длинных диалогов в рабочих чатах и в почте, — прокомментировал Дмитрий Плешаков, директор по продукту в VK Teams. |
Новые тенденции
По словам Светланы Захаровой, по итогам 2024 году ожидается большое количество кейсов по работе с голосом, поскольку голосовая коммуникация является самой привычной. В наибольшей степени развитие генеративного ИИ коснется голосовых технологий, таких как TTS, речевые технологии и т.п., а также коснется разработки сценариев для диалоговых решений – компании уже подключают ИИ-модели к разработке скриптов для повышения лидогенерации.
В каком-то смысле генеративный ИИ "дает вторую жизнь" решениям, которые существуют на рынке уже 3-5 лет, – заметила эксперт. |
Владислав Вирясов считает, что одним из лидирующих по итогам года станет тренд развития NLP. По его словам, чат-боты становятся более "умными" благодаря достижениям в области обработки естественного языка: они лучше понимают контекст, иронию и сложные запросы, что делает взаимодействие более естественным.
Также эксперт ожидает глубинной и гибкой интеграции голосовых и текстовых роботов с корпоративными CRM, BI-системами и базами данных. Компаниям уже недостаточно базовых вариантов интеграции, в особенности когда речь идет о достижении действительно значительных результатов в области автоматизации, и поэтому здесь будут работать кастомизированные варианты интеграции, прорабатываемые совместно клиентом и вендором с учетом конкретных бизнес-процессов и особенностей заказчика.
Также Владислав Вирясов отметил тренд на использование данных о пользователях для создания персонализированного опыта, что может включать рекомендации продуктов, индивидуальные предложения и адаптацию стиля общения под конкретного клиента.
Главным трендом развития ИИ технический директор ELMA Bot Наиль Ахмеджанов считает мультимодальные модели, которые могут понимать не только текст, но и изображения, видео, любые типы медиа и отвечать в этих же форматах. Особенно перспективно это направление, по его профессиональному мнению, в сфере развлечений.
Александр Павлов, управляющий директор Robovoice компании SL Soft отметил несколько тенденций: глубокую интеграцию генИИ с базами знаний компаний, бизнес-системами, такими как CRM или ERP, а также развитие омниканальности. По словам эксперта, акцент смещается на комплексную стратегию взаимодействия с клиентами на всей продолжительности CJM: от первого касания до повторных покупок. Это приводит к изменению точек контакта: например, вместо опросов клиентов о причинах отказа от подписки, компании прогнозируют потенциальный уход и для его предотвращения обеспечивают проактивное обслуживание. Кроме того, игроки рынка стремятся создавать единые решения для всех каналов взаимодействия: мессенджеров, соцсетей и телефонных звонков. Таким образом достигается бесшовное и качественное обслуживание на всех уровнях.
Как рассказала Анна Власова, руководитель отдела компьютерной лингвистики в ГК «Наносемантика», глобально в сфере разговорного ИИ в 2024 году доминируют такие тенденции: использование генИИ и LLM для коммуникации с человеком, расширение функционала интеллектуальных чат-ботов, Low/No-Code обучение чат-ботов сотрудниками компаний, не являющимися программистами или техническими специалистами. Кроме того специалист отметила тенденцию использования генеративного разговорного ИИ там, где традиционно применялись свои специализированные технологии: поиск документов, классификация документов или обращений.
Типы коммуникации с ИИ постоянно расширяются: от техподдержки до продаж. Боты теперь не просто общаются с человеком в голосовом или текстовом каналах. От них ожидается возможность работы с документами, изображениями, а также интеграция со всеми другими системами компаний (CRM, трекеры задач, календари и т.п.). Эти направления развития просматривались и в прошлые годы, но в 2024 технологии позволили сделать скачок и вывести их на первое место. Такие выводы основаны на исследованиях консалтинговых и аналитических компаний, таких как Gartner, а также на обзорных отраслевых публикациях, рассказала специалист.
В 2024 году по запросам нашего рынка мы видим, что развитие отрасли интеллектуальных чат-ботов в России в целом следует мировым тенденциям, – сказала Анна Власова. |
Так, по сравнению с 2023 годом в 6-7 раз возросло количество запросов на возможность разработки чат-бота на генИИ и LLM. Произошло расширение функционала ботов, хотя здесь был не такой резкий рост запросов, как с генИИ.
Что касается Low/No-Code, то, по словам специалиста, этот подход востребован в РФ, но специфика местного бизнеса выражается в том, что многие компании одновременно хотели бы иметь возможность при необходимости использовать программный код в ответах чат-бота или хотя бы "подкручивать" разнообразные настройки обучения нейросетевых модулей.
Тренд на использование ИИ для классификации обращений наблюдается уже несколько лет, однако рост интереса к поиску по документам или корпоративным базам знаний с помощью генИИ был заметен именно в 2024 году.
Специалист отметила тренд на создание платформ, позволяющих разрабатывать чат-ботов, настраивать обращение к LLM (которые могут быть также партнерскими или свободными), интегрироваться с различными системами для получения информации и дообучения чат-ботов.
Тренд на усиление безопасности данных создает на российском рынке интересную ситуацию, подчеркнула Анна Власова. В целях безопасности компании стремятся устанавливать любые IT-решения в свой контур. Многие заказчики в 2024 году в принципе не рассматривали облачные модели работы даже на стадии пилотных проектов.
Казалось бы, это прямо противоречит популяризации и росту применения известных LLM, наиболее популярная из которых на текущий момент ‒ это генеративная модель ChatGPT компании OpenAI, – рассказала специалист. – ChatGPT, как и другие LLM-модели от крупных вендоров, не ставится в чужой контур. |
Но в итоге 2024 год показал, что такая ситуация только стимулирует исследования и разработки в области обучения локальных генеративных языковых моделей "под заказчика" и на его данных. Также остаются заказчики, которые готовы использовать облачные решения с LLM, но от отечественных вендоров: Sber Gigachat или Yandex GPT.
В 2024 году генеративные ИИ-модели позволяют голосовым роботам справляться с обработкой звонков и автоматизацией продаж, рассказал Роман Милованов. По словам специалиста, мультимодальные нейросети, работающие с текстом и голосом, открывают новые горизонты, интегрируя различные форматы взаимодействия и улучшая пользовательский опыт. Открытые LLM упрощают разработку и адаптацию решений, позволяя компаниям быстрее и дешевле создавать качественные системы. Голосовые технологии становятся более интегрированными в бизнес-процессы, улучшая сбор аналитики, обработку заказов и управление операциями.
Голосовые и чат-боты становятся значимой частью бизнеса, считает Александр Сидоров, ведущий инженер отдела контакт-центров «АМТ-Груп». Они предоставляют новые возможности для улучшения сервисов, продаж и взаимодействия с клиентами. По словам специалиста, основными технологическими трендами в компании считают улучшение распознавания и синтеза речи, интеграцию с различными бизнес-процессами.
Современные боты могут генерировать естественную речь, которую сложно отличить от живого человека. Они позволяют не только автоматизировать многие типовые задачи, но и улучшить взаимодействие с клиентом, предоставляя ему индивидуальные предложения, умеют работать сразу в голосовых и текстовых каналах, что позволяет максимально обширно взаимодействовать с клиентом.
Возможности персонализации с ИИ
Светлана Захарова отметила, что с развитием генИИ нас ожидают значительные изменения в области биометрии, хранения и использования датасетов. Вопрос коснется и продуктов, которые закрывают вопросы безопасности работы с различными LLM. Ведь чем глубже люди погружаются в didgital-технологии и различные приложения, тем больше персональных данных собирают системы. Уровень персонализации растет, но вместе с этим остро встает вопрос безопасности собираемых данных, поэтому вслед за технологиями придут законы об ужесточении сбора и использования этих данных. Подобную ситуацию специалисты наблюдали с автообзвонами. Как только генеративный ИИ займет свое место на рынке, и появятся первые прецеденты, связанные с безопасностью, а также понимание объема возможности новых технологий, то появятся и новые пункты в законодательстве на этот счет.
По общим оценкам сегодня в России 88% пользователей имели в своей жизни как минимум один контакт с помощником на базе ИИ, а 82% предпочтут поговорить с ИИ-ассистентом здесь и сейчас, не дожидаясь ответа оператора, рассказал Владислав Вирясов. Поэтому интеграция конструкторов No-Code с другими продуктами востребована и помогает в развитии "эмпатии" и "человечности", что важно для маркетинга и клиентского сервиса.
По словам эксперта, это видно на примере чат-ботов, которые общаются с клиентом в режиме реального времени и предоставляют персонализированные рекомендации и предложения. Использование же биологических параметров селебрити в маркетинге является довольно спорным вопросом, поскольку затрагивает не только сферу информационной безопасности, но и этики. Так, например, существуют юридические прецеденты, которые запрещают использование изображения или голоса знаменитостей без их разрешения. К тому же, такая практика может привести к потере доверия клиентов.
Анна Власова подтвердила, что на рынке сегодня уже оформился запрос, который должен стать трендом: нужны сервисы, которые распознают дипфейки.
Мы наблюдаем, что за последний год участились запросы на "цифровых двойников" медийных персон, которые должны не только копировать внешний вид, но и общаться в соответствующей манере, – рассказала Татьяна Гапоненко. ‒ Причем интерес есть как у самих персон, так и у корпораций, сотрудничающих с ними и заказывающих аватаров-амбассадоров бренда. |
Например, в этом году «Наносемантика» сделала синтез голоса для известного блогера Руслана Усачева, который он использует для создания контента и ускорения его производства, и продолжает работу над голосовой моделью советского диктора Юрия Левитана по заказу его правнука.
Основные риски конструкторов No-Code, по мнению Романа Милованова, заключаются в возможных проблемах с авторскими правами, потенциальных нарушениях личной безопасности при экспериментах с селебрити (дипфейки). Все это может привести к росту рисков киберугроз, судебных разбирательств и случаев недобросовестного использования контента. Однако в области персонализации с применением голосовых и чат-ботов открываются новые возможности. Например, технологии могут создавать индивидуальные рекламные предложения, адаптированные под эмоциональное состояние и поведение пользователя, что позволяет значительно улучшить клиентский опыт и повысить эффективность маркетинговых кампаний.
Александр Крушинский считает, что основное препятствие для персонализации сейчас – это не недостаток "эмпатии чат-ботов", а отсутствие, как и прежде, взаимной координации процессов обслуживания клиента в разных каналах и на разных участках клиентского пути с последующей централизацией знаний. В разных бизнес-юнитах организации могут использоваться разные системы, не интегрированные между собой, работающие по разной логике и со своим объемом информации.
Термин "омниканальность" появился 14 лет назад и успел за это время стать трендом и надоесть, но по-прежнему очень часто клиенту при обращении приходится повторять одно и то же вначале чат-боту, затем оператору, который подключился в чат, и еще раз – когда устаешь ждать ответа в чате и решаешь позвонить в контакт-центр, – отметил эксперт. |
Само по себе внедрение ИИ не решает эту проблему, а скорее еще более ярко проявляет, потому что основной "пищей" для ИИ является BigData организации – данные, которые ИИ может анализировать, на которых он может обучаться, и которые будут влиять на результат его работы. Однако мир ИИ молод и динамичен, что влечет лоскутное внедрение ИИ, когда внутри одной организации десяток ИИ-платформ и ИИ-решений сосуществуют независимо, закрывая разные участки работ. И на каждом таком участке накапливаются свои наборы данных, состоящие как из исходных фактов, так и результатов их обработки, которые не используются за пределами этого участка.
При приеме звонка оператор должен не только видеть ФИО клиента и дату его рождения, но также и его текущий параллельный диалог с ботом поддержки, его последние действия на сайте, краткое содержание его предыдущих обращений. А так как это довольно большой объем информации – то ИИ как раз может помогать оператору, выдавая рекомендации для обслуживания на основе всего массива информации о клиенте, тем самым делая это обслуживание по-настоящему персонализированным.
А эмпатией можно будет заняться, когда оператор перестанет переспрашивать то, что я только что рассказал боту в чате, а будет предлагать решение еще до того, как я его озвучил, – улыбнулся Александр Крушинский. |
Качественный скачок диалоговых технологий
Владислав Беляев не ожидает качественного скачка развития ИИ в ближайшие 2-3 года. По его словам, несмотря на мощный прогресс за последние полтора года основные принципы современных технологий ИИ не изменились, больший фокус был на масштабировании (больше видеокарт и данных) и инженерных решениях.
За прошедшие 1,5 года на примере технологий OpenAI вышло 2 больших обновления: c GPT-4 до GPT4o ответы стали точнее и лучше раскрывать тему, – рассказал он. – И c GPT-4o до o1-preview система научилась решать многоуровневые задачи. Каждое из этих обновлений показало скачок по качеству работы ИИ. |
Далекие же перспективы направления связаны с развитием технологий ИИ, которые смогут потреблять меньше вычислительных ресурсов и иметь возможность работы с причинными структурами, а не только статистикой. А пока альтернативные LLM пути развития ИИ находятся на уровне фундаментальных исследований и не могут показать сопоставимые по качеству результаты. Эксперт прогнозирует, что в ближайшие 2-3 года будет появляться все больше прикладных ИИ-решений для конкретных "узких" задач.
Генеративный ИИ – это и есть тот альтернативный путь, по которому должен был пойти ИИ, поэтому в ближайшее время мы будем наблюдать как генИИ проникает во все сферы жизни, – считает Светлана Захарова. |
Пока же, по ее данным, большинство компаний все еще пытаются понять, как жить в новой "GPT-реальности": в каких кейсах использовать и как измерять эффективность. И здесь кроется одно из отличий от "классического ИИ", с которым давно работает большинство, ведь на этом рынке есть и специалисты, и кейсы, и большой выбор реализованных решений.
Светлана Захарова напомнила, что в России установлены очень жесткие ограничения по использованию зарубежных LLM, а выбор отечественных решений невелик. Их стоимость превышает иностранные аналоги, и лишь небольшому количеству компаний по карману использование отечественных моделей. В этом контексте эксперт отмечает следующие варианты для игроков: находить средства на использование отечественных LLM, находить пути обхода ограничений и использовать иностранные модели, собирать свою команду и заниматься дообучением Open Source модели под нужды своего бизнеса.
Малый и средний бизнес находится в малой зоне риска по части использования зарубежных LLM, – отметила Светлана Захарова. – Поэтому чем быстрее компании из этого сегмента поймут, как можно задействовать генИИ, тем выше будет их конкурентное преимущество. |
Эксперты прогнозируют нам переход к AGI к 2027 году, пока в это верится с трудом, – поделился Максим Иванов. – Думаю, к этому моменту мы сможем упростить и автоматизировать достаточно много рутинных задач, которые сейчас решаем без LLM, а стоимость технологии значительно снизится за счет ее популяризации. |
Много ожиданий у специалистов от мультимодальных моделей, которые могут вывести коммуникации на новый уровень, рассказал Наиль Ахмеджанов. Кроме того, по его информации, иностранные компании работают над LLM для медицины, уже запущены пилотные проекты в медицинских учреждениях.
К сожалению, эти проекты пока не в России, но в перспективе они сделают медицинскую помощь более доступной и качественной на глобальном уровне, – надеется эксперт. |
Специалисты Robovoice ожидают дальнейшего развития генИИ и более широкого практического применения. По словам Александра Павлова, очень перспективны решения, предугадывающие потребности пользователей на основе анализа больших данных.
Что касается альтернативных путей развития, то мы уже наблюдаем интерес к области интерпретируемого ИИ, – рассказал эксперт. – Это направление позволяет не только повысить эффективность технологий, но и решить важные вопросы ответственности и прозрачности принятия решений, которые возникают с увеличением влияния ИИ на бизнес и общество. |
Мне кажется, мы живем прямо внутри качественного скачка, – отметил Александр Крушинский. – Нам сейчас приходится буквально на ежедневной основе изучать новые AI-модели, новые подходы к их использованию и новые успешные кейсы применения, чтобы оставаться на переднем крае прогресса. |
Развитие LLM требует больших средств, но компании в них заинтересованы и готовы вкладываться, рассказала Татьяна Гапоненко.
Так что в скором времени мы увидим появление новых LLM, заточенных под конкретного заказчика и предметную область, – уверена она. |
По словам специалиста, это вызовет рост количества каналов коммуникаций (например, VR сделает возможным общение с цифровым представителем заказчика – "аватаром" в цифровом пространстве), появятся новые устройства для общения, виртуальные комнаты, даже мобильные телефоны с проекторами, возможности использования голограмм. И везде будут адаптированные и саморазвивающиеся LLM, предполагает Татьяна Гапоненко.
По словам Романа Милованова, благодаря модернизации систем обработки естественного языка и машинного обучения ожидается значительное улучшение точности и естественности общения при помощи чат-ботов, расширение спектра применения технологии в диапазоне от клиентских сервисов до личных ассистентов.
Выставка достижений
Как рассказал Дмитрий Плешаков, в облачной версии коммуникационной платформы VK WorkSpace в 2024 году стал доступен новый сервис — «AI Ассистент». Он умеет создавать суммаризацию видеоконференций, писем, переписок в чатах, выделяя главное. «AI Ассистент» умеет создавать саммари переписки в корпоративной почте и мессенджере платформы VK WorkSpace. Для этого нужно отправить боту в пользовательском приложении VK Teams письма или сообщения из рабочего чата. Сервис предоставит сотруднику краткий пересказ разговора — в нем будут указаны действующие лица, цифры и другие показатели, которые упоминались в обсуждении. Виртуальный помощник также может создать авторезюме онлайн-встречи в сервисе видеоконференций VK WorkSpace. Чтобы воспользоваться функцией, нужно включить запись во время созвона, а потом отправить файл в бот с «AI Ассистентом».
Новый сервис упрощает коммуникации в команде и помогает сотрудникам работать продуктивнее, — считает специалист. — Меньше времени уходит на рутинные действия, такие как анализ переписок в почте и разговор в чате, и больше времени можно посвятить интеллектуальным задачам. |
AutoFAQ выпустила на рынок цифрового помощника на базе управляемых генеративных нейросетей AutoFAQ Xplain, благодаря которому можно создавать чат-ботов для мгновенных ответов на вопросы, опираясь на существующие документы в компании. Такой продукт был первым в России в своем классе, рассказал Владислав Беляев.
Продукт позволяет руководителям клиентского сервиса, IT-поддержки и любых подразделений, для работы которых требуется взаимодействие с большим объемом регулярно обновляемой информации, оперативно внедрять инструменты роботизации с целью оптимизации временных затрат на поиск в корпоративных документах. При этом система не просто ищет информацию и копирует часть готового текста, а переписывает его в диалоговой форме и дает уточнения по запросу, предоставляя ссылки на источники для более глубокого погружения при необходимости.
В отличие от ChatGPT, чат-бота которого уже протестировали службы поддержки многих компаний, AutoFAQ Xplain не только адаптирует текст под запрос пользователя, но и полностью контролирует содержание ответов, так как искусственный интеллект обращается только к тем источникам информации, которые предоставляет компания, поэтому бизнесу не нужно беспокоиться, что чат-бот предоставит ложную информацию или введет пользователя в заблуждение.
AutoFAQ Xplain полезен компаниям, в которых хранятся сотни или тысячи страниц документов, в том числе в корпоративных базах знаний: Wiki, Confluence, SimpleOne, Minerva или на сайте. Цифровой помощник позволяет экономить ресурсы на сопоставление вопросов и ответов: достаточно загрузить документ в систему, и можно начинать работать. Периода подготовки к подключению нет, необходимо предоставить документы в формате docx, pdf, excel, или дать доступ к существующим базам знаний, сайтам. Создание чат-бота занимает 1 день. Более того, решение можно развернуть как в облаке, так и на серверах заказчика.
Благодаря мгновенному предоставлению ответа на вопрос цифровой ассистент AutoFAQ Xplain избавляет сотрудников от продолжительного поиска, что позволяет экономить от 3 до 5 часов в неделю, повышая их продуктивность на 25%.
На базе AutoFAQ Xplain также можно запустить узко направленных ИИ-ассистентов.
Xplain AI Copilot – это персональный ИИ-помощник для операторов контактного центра, который позволяет оператору точно ответить на любой вопрос клиента не по скрипту. Экономит время команды на поиске информации и позволяет сосредоточиться на построении более крепких отношений с клиентами.
Xplain Sales – цифровой продавец-консультант для повышения продаж в чате на сайте, соцсетях, мессенджерах, что позволяет увеличить конверсию в продажи до 23%.
В 2024 году на базе этой технологии компания запустила проекты в "продуктив" и в стадии пилота в таких компаниях, как «Новосибирскэнергосбыт», «Технологии доверия» и ряде других компаний строительного и энергетического сектора.
Светлана Захарова рассказала, что в 2023 году в Just AI появился отдельный департамент со своим продуктовым стеком на базе генИИ: начиная с решений для автоматизации рутинных задач (Jay Copilot), построения вопросно-ответных систем на основе RAG (Knowledge Hub), заканчивая решениями для защиты данных при работе с LLM (Jay Guard). Just AI, по ее словам, одна из немногих компаний на рынке, готовых поставлять свои решения в On-Premise, а также предлагать гибридную поставку.
Наши решения пилотируются во многих компаниях: от ритейла до банкинга, – резюмировала эксперт. – Основной фокус сегодня сделан на улучшении клиентского сервиса, ускорении работы бэк-офиса и повышении эффективности технических специалистов за счет инструментов для ускорения программирования. |
Александр Павлов рассказал, что сегодня боты становятся полноценным инструментом MedTech.
Например, один из наших клиентов – сервис телемедицины – использует чат-бота для своевременного сбора ключевых показателей здоровья пациентов для контроля лечения хронических заболеваний, что существенно повышает результативность лечения, – отметил эксперт. |
Как сообщил Владислав Вирясов, в 2023-2024 годах специалисты компании «Авантелеком» сконцентрировали усилия на развитии собственной платформы конфигурации голосовых ассистентов «Каспиум». Платформа позволяет собирать кастомизированных голосовых ассистентов, работающих на технологии понимания естественного языка.
Мы улучшили алгоритмы обработки диалога и обучения диалоговых моделей, – отметил эксперт. – Это позволило значительно повысить точность ответов ассистента. Также мы оснастили платформу собственной Datalens-системой, позволяющей строить любые отчеты по сущностям и визуализировать их в виде отдельных графиков или дашбордов. |
В 2024 году «Авантелеком» запустил специализированный программный продукт для медицинских колл-центров. Решение включает восемь голосовых модулей, которые позволяют в автоматическом режиме закрывать все типовые задачи по обработке обращений. Например, такие: запись к врачу, вызов на дом, постановка в лист ожидания, автоинформирование пациентов. Специалисты настроили интеграцию голосового ассистента с медицинскими информационными системами для бесшовной передачи информации в регистратуру учреждения. В настоящий момент решение пилотируется в нескольких регионах РФ в рамках автоматизации «Единой службы 122», а также в частных медицинских клиниках.
Также в начале 2024 года «Авантелеком» ввел в коммерческую эксплуатацию новый продукт – систему речевой аналитики SferaGPT, который помогает отслеживать и улучшать эффективность работы контактных центров. Технология работает на базе генИИ.
Максим Иванов рассказал про ИИ-ассистента от «Сбер Бизнес Софт» – Low-Code конструктор для создания виртуальных ассистентов с использованием LLM Gigachat.
Вы можете загрузить свои документы и ИИ-ассистент быстро научится самостоятельно отвечать на любые вопросы с учетом общих знаний LLM и информации в документах, – объяснил он. |
Уже сегодня клиенты компании используют таких ассистентов для замены первой линии технической поддержки, второго мнения для юристов, обучения сотрудников/студентов, консультации клиентов, продаж и т.д. Также специалисты начали активно использовать Gigachat в продуктах по речевой аналитике для оффлайн-анализа коммуникаций в контакт-центре.
Мы сейчас очень активно работаем как раз над встраиванием возможностей LLM в наши продукты. И тут мы за последний год выпустили сразу ряд новинок, – поделился хорошими новостями Александр Крушинский. |
Так, компания BSS выпустила RAG – "адаптер" к LLM, который позволяет ей отвечать на вопросы, опираясь не на общие знания, на которых она была обучена, а на закрытую базу знаний корпорации. Эта функциональность сейчас уже встроена в бот-платформу компании и в октябре будет добавлена к базе знаний. Свет увидели и другие продукты BSS: собственная LLM для заказчиков, которые не готовы использовать облачные LLM типа ChatGPT или YaGPT, а также AI-супервайзер, который может анализировать звонки в речевой аналитике (РА) с помощью LLM, например, для анализа тональности звонка или выявления неформализованных ошибок при обслуживании. Авто-кластеризация – еще одна разработка, которая позволяет выявлять неожиданные тренды в причинах обращений. Например, таким образом можно увидеть, что резко выросла доля обращений по вопросам, которые вообще не предполагались. Например, сложности при использовании мобильного приложения.
Татьяна Гапоненко рассказала про разработку цифровых аватаров ‒ уникальных анимированных персонажей с полной синхронизацией речи, эмоций, мимики и жестов и с возможностью взаимодействия с помощью голоса. По ее словам, это направление стало одним из ведущих для «Наносемантики» за последний год.
Первые проекты мы разрабатывали еще в рамках демо для внутренних целей в 2021 году, потом был интересный проект с МФТИ ‒ «Снежинка», 3D-аватар для мультимедийного стенда Международной арктической станции, – вспомнила она. |
Полноценную популярность цифровые аватары обрели, по ее словам, после показа цифрового двойника Владимира Жириновского, которого специалисты «Наносемантики» сделали для ЛДПР, на ПМЭФ-2023. Цифровая копия имитировала манеру изречений прототипа, и ее презентация на форуме получила большой общественный резонанс.
После запуска «Жириновского» мы стали получать все больше запросов на создание подобных аватаров от самых разных компаний и известных людей в РФ, – отметила Татьяна Гапоненко. |
Помимо этого, «Наносемантика» продолжает совершенствовать свой флагманский продукт ‒ платформу DialogOS, которая позволяет создавать и обучать диалоговых роботов, применяемых для обработки запросов пользователей в режиме связанного диалога. Платформа работает на 40 языках и включает в себя базу знаний, которая насчитывает 3611 диалоговых сценариев, 5230 специализированных словарей и более 3 миллионов адаптивных вопросов. Правильность и грамотность речи, а также логику диалога, в компании курирует отдел из 30 компьютерных лингвистов.
В «Наносемантике» ведется работа над реализацией новых нейросетевых модулей – оценка сентимента, опечаточник, кластеризация тем – они дают возможность оценить, насколько запрос клиента является негативным или позитивным, идентифицировать слова с ошибками, а также собирать и классифицировать информацию по разговорам с учетом тем.
В ближайших планах компании – развитие аналитики, позволяющей клиентам глубже анализировать взаимодействие с пользователями и точнее отслеживать эффективность работы, обновление системного NER (Named Entity Recognition), чтобы добавить больше именованных сущностей, таких как даты, email, адреса, денежные суммы и др. для улучшения качества обработки данных и точности работы ассистентов. Также идет работа над улучшением каталога общих элементов для сбора библиотеки стандартных сценариев и элементов, что позволит быстро разрабатывать и запускать новых виртуальных ассистентов, а также над интеграцией с телефонией для создания голосовых ботов первой линии, которые смогут совершать обзвоны и обрабатывать звонки без участия операторов. Это откроет новые возможности для автоматизации в таких сферах, как клиентская поддержка и маркетинг, уверена Татьяна Гапоненко.
Роман Милованов поделился подробностями развития функционала диалоговой платформы для создания голосовых роботов и чат-ботов Ziax. В частности, в платформу был интегрирован голосовой модуль Ziax TTS, который преобразует текстовую информацию в голос с помощью нейросетей с возможностью брендирования голоса. Решение подразумевает два формата работы: потоковую обработку (в режиме реального времени) и генерацию аудиофайлов в режиме офлайн. Модуль Ziax TTS позволяет существенно оптимизировать различные бизнес-задачи: массовый обзвон неограниченного количества абонентов, обслуживание клиентов на первой линии поддержки, запись рекламных роликов, озвучка заранее заготовленного текста и многое другое. По словам специалиста, решения Ziax уже успешно интегрированы в крупнейшие страховые компании, банковские организации и промышленные предприятия.
Наши клиенты смогли снизить стоимость целевых звонков в 2,5 раза, автоматизировать до 80% обращений и повысить скорость работы отделов в 5 раз, – с гордостью отметил он. – При этом затраты на сотрудников контактного центра снизились до 50%. |