ВТБ показал образцовый пример масштабного внедрения ИИ в клиентском сервисе. Их "Помощник ВТБ" — это не просто чат-бот с ИИ, а комплексная система автоматизации первой линии поддержки.
Техническая архитектура- Ядро: Гибридная NLP-система (классификация интентов + генерация вариативных ответов)
- Покрытие: 800 из 1800 тематик переведены на машинное обучение
- Особенность: Обработка составных запросов (2+ вопроса в одном сообщении)
Измеримые результаты- 85% автоматизации обращений (+5,5% за год)
- 76,1% запросов решается без уточнений (FCR - First Contact Resolution)
- 78,2% удовлетворенность клиентов (CSAT)
- 1,5x ускорение запуска новых сценариев
- 3,5 млрд ₽ годовая экономия! 😮
Ключевые инсайты для внедренияЧто сработало: ВТБ не гнался за совершенным ИИ.
Фокус на конкретных метриках: сокращение времени разработки сценариев и снижение нагрузки на операторов. Автоматизация бизнес-процесса на 85% — это не 100%, но при масштабе ВТБ дает миллиардную экономию.
Подробный кейс здесь <-Потенциал усиления через GenAI: Сейчас ВТБ использует классический NLP с заготовленными шаблонами ответов.
Интеграция LLM могла бы дать:- Обработку нестандартных запросов (те самые 15%, которые идут на оператора)
- Генерацию персонализированных финансовых рекомендаций
- Создание пошаговых инструкций для сложных операций
Но как мы пустим недетерменированную модель к пользователям? 🤔Риск того, что модель «нагаллюцинирует», действительно существует, и он вполне очевиден. В качестве одного из решений я бы предложил рассмотреть архитектуру по принципу Human-in-the-Loop («человек в цикле»), когда оператор не общается с клиентом напрямую, а выполняет роль верификатора ответов LLM. Это позволит контролировать качество генерации и при этом кратно увеличить количество обрабатываемых запросов.
Судя по нашему опыту в «Аспирити», интеграция генеративного слоя поверх классического NLP-стека позволяет повысить уровень автоматизации на 10–15% при росте затрат на 20–30%. Для компании масштаба ВТБ такая оптимизация может легко принести дополнительную экономию в 500+ млн рублей.
Но здесь нужно считать и грамотно проектировать систему, на таких объёмах можно не только сэкономить много денег, но и потерять не меньше на дорогом инференсе.