ML-скоринг долгового портфеля: как machine learning повышает Recovery Rate на 35%

АГ

Алексей Громов, архитектор CRM и аналитических модулей КоллектСофт

Разбираем ML-скоринг как рабочий инструмент управления долговым портфелем: какие данные нужны, какие модели применяются, как измерять рост Recovery Rate и как встроить рекомендации в ежедневную работу операторов, digital-каналов и legal collection.

Что показывают сильные решения рынка

После анализа конкурентных материалов видно, что сильные статьи и продуктовые страницы не ограничиваются общими словами про искусственный интеллект. Они объясняют, какую именно модель строит агентство, какие признаки входят в расчёт, как меняется маршрут взыскания и как бизнес доказывает эффект через метрики.

Прединвестиционный скорингОценивает портфель до покупки: ожидаемый сбор, дисконт, риск убыточных сегментов и приоритеты первичной обработки.

Collection scoreПрогнозирует вероятность платежа в горизонте 30-90 дней и помогает формировать очереди операторов.

Legal scoreОпределяет, какие договоры экономически целесообразно переводить в судебное взыскание.

Pre-collection scoreРаботает на ранней просрочке: отделяет клиентов, которые оплатят после мягкого напоминания, от тех, кому нужен звонок.

Поэтому полноценная статья о ML-скоринге должна отвечать не только на вопрос «что такое модель», но и на управленческий вопрос: какое действие система рекомендует по каждому договору и как это влияет на деньги.

Что такое ML-скоринг долгового портфеля

ML-скоринг долгового портфеля - это модель, которая рассчитывает вероятность возврата долга, ожидаемую сумму взыскания и оптимальный следующий шаг по каждому договору. В отличие от ручной сегментации по DPD и сумме долга, machine learning учитывает сотни признаков: историю платежей, контактность, обещания оплатить, судебный статус, данные БКИ, канал коммуникации и реакцию должника на предыдущие действия.

Главная задача скоринга - не просто поставить должнику балл. Система должна помочь агентству распределить ресурсы: кому звонить в первую очередь, кого вести через digital-напоминания, где запускать legal collection, а какие договоры дешевле продать, списать или оставить до обновления данных.

«Recovery Rate растёт не из-за самой модели, а из-за правильного действия после скоринга: приоритетов операторов, точного выбора канала, своевременного legal-сценария и контроля стоимости взыскания.»
— Команда КоллектСофт

Какие модели нужны агентству

Один универсальный скоринг редко закрывает весь цикл взыскания. В зрелой системе используется набор моделей: каждая отвечает за свой этап и свой бизнес-вопрос. Такой подход лучше работает на портфелях, где есть разные продукты, стадии просрочки, каналы коммуникации и legal-маршруты.

Модель	Что прогнозирует	Горизонт	Где применяется
Payment Propensity	вероятность платежа	30-60 дней	очереди операторов, digital-кампании
Expected Recovery	ожидаемую сумму возврата	60-180 дней	приоритизация крупных и средних долгов
Self-cure Score	вероятность оплаты без звонка	7-21 день	ранняя просрочка, мягкие напоминания
Legal Score	перспективность судебного взыскания	90-360 дней	отбор договоров в legal collection
Debt Sale Score	целесообразность продажи или списания	портфельный горизонт	управление низкопотенциальными сегментами

Best Practice

Начинать стоит не с выбора алгоритма, а с бизнес-гипотезы: какой показатель улучшаем - Recovery Rate, collected amount per FTE, стоимость контакта, долю self-cure или окупаемость legal collection.

Какие данные нужны для модели

Качество ML-скоринга зависит не от названия алгоритма, а от полноты и чистоты исторических данных. Для первой версии модели обычно достаточно 12-24 месяцев истории по закрытым и активным договорам, где видно, какие действия предпринимались и чем они закончились.

Группа данных	Примеры признаков	Зачем используется
Долг и просрочка	сумма, DPD, дата уступки, тип продукта, дисконт покупки	оценка экономического потенциала договора
Платёжная история	частичные платежи, дата последнего платежа, регулярность, обещания оплатить	прогноз вероятности и суммы возврата
Коммуникации	дозвоны, SMS, email, мессенджеры, отказы, реакция на офферы	выбор канала и частоты контакта
Внешние источники	БКИ, ФССП, банкротство, судебные данные, адресная актуальность	фильтрация рисков и legal-перспективы
Операционные действия	кто работал, когда звонил, какой скрипт применялся, результат контакта	поиск эффективных стратегий взыскания

Отдельно важно хранить не только факт платежа, но и контекст решения: какой канал использовался, какой оператор работал, какая скидка предлагалась, был ли запрет контакта, сколько стоило действие и какие ограничения 230-ФЗ применялись в момент коммуникации.

Как строится скоринговая модель

В production-системе модель обычно решает несколько задач одновременно. Один скоринг оценивает вероятность платежа в ближайшие 30-60 дней, второй - ожидаемую сумму взыскания, третий - перспективность судебного взыскания. Итоговый приоритет договора считается уже на уровне бизнес-правил: прогноз умножается на сумму долга и сравнивается со стоимостью действия.

Формируем обучающую выборку. Берём исторические договоры, фиксируем состояние на дату скоринга и результат через выбранный горизонт прогноза.
Собираем признаки. Нормализуем данные CRM, телефонии, платежей, БКИ, ФССП и истории коммуникаций.
Обучаем модель. Для табличных данных чаще всего используются gradient boosting модели: CatBoost, LightGBM или XGBoost.
Проверяем качество. Смотрим AUC, Lift/Gain, Precision/Recall, калибровку вероятностей и бизнес-метрики на отложенной выборке.
Встраиваем в CRM. Скорбалл появляется в карточке должника, очередях операторов, digital-кампаниях, legal-модуле и BI-дашбордах.

Важно учесть

Нельзя обучать модель на данных, которые появились после принятия решения. Например, результат судебного этапа не должен попадать в признаки для прогноза до запуска суда. Такая утечка данных даст красивую метрику на тесте и провал в реальной работе.

Как скорбалл превращается в стратегию взыскания

Самая частая ошибка - построить модель и оставить её отдельным отчётом для аналитика. Скоринг должен автоматически менять рабочий процесс: очередь задач, канал контакта, размер скидки, дату следующего касания, передачу в legal collection и контроль ограничений ФЗ-230.

Сегмент	Признаки	Рекомендуемое действие	Цель
Высокий recovery	контактный должник, свежий платёж, высокая сумма	приоритет оператора, персональный сценарий, рассрочка	быстро закрыть максимальную сумму
Self-cure	ранняя просрочка, положительная история, высокая вероятность самостоятельного платежа	SMS, push, email, мягкое напоминание	не тратить дорогие звонки
Legal-positive	сумма покрывает издержки, есть данные для суда, нет критичных стоп-факторов	подготовка документов, проверка ФССП, судебный маршрут	повысить возврат через правовой контур
Низкий потенциал	старый долг, нет контактов, низкая сумма, негативные внешние признаки	дешёвый digital, обновление данных, продажа или списание	снизить стоимость взыскания

За счёт чего Recovery Rate может вырасти на 35%

Рост Recovery Rate обычно складывается из нескольких эффектов. Модель раньше находит договоры с высокой вероятностью оплаты, убирает лишние касания по слабым сегментам, помогает не запускать убыточный legal collection и даёт руководителю прозрачную аналитику по каждому каналу.

Корректный замер выглядит так: одинаковые по составу сегменты портфеля делятся на контроль и тест, тестовая группа работает по ML-приоритетам, контрольная - по прежним правилам. Через 60-90 дней сравниваются Recovery Rate, collected amount, cost per recovered ruble и нагрузка операторов.

Показатель	До ML-скоринга	После внедрения	Что изменилось
Recovery Rate	базовый уровень портфеля	+15-35%	приоритеты строятся по вероятности и сумме возврата
Стоимость контакта	единая интенсивность по сегментам	ниже на 10-25%	дорогие действия уходят только в перспективные группы
Legal-конверсия	часть исков убыточна	выше за счёт отбора	модель учитывает сумму, статус и исполнимость
Производительность операторов	ручная очередь задач	больше сбор на FTE	операторы начинают с договоров с максимальным expected recovery

Формула ROI для пилота: дополнительный сбор по тестовой группе минус стоимость внедрения, интеграции, поддержки модели и дополнительных коммуникаций. Если модель повышает сбор, но одновременно резко увеличивает стоимость контактов, эффект нужно считать по чистой марже, а не по валовому Recovery Rate.

Интеграция в CRM и контроль качества

ML-скоринг должен быть частью операционной системы взыскания, а не отдельным ноутбуком аналитика. В КоллектСофт модель подключается через API или внутренний scoring service: CRM отправляет признаки, получает скорбалл, сегмент и рекомендованное действие, а затем сохраняет результат в историю договора.

скорбалл пересчитывается по расписанию или после значимых событий: платежа, контакта, обновления данных БКИ или ФССП;
руководитель видит распределение портфеля по сегментам, ожидаемый сбор и фактический результат;
оператор получает готовую очередь задач без ручной сортировки Excel;
аудит-лог фиксирует, какая версия модели дала рекомендацию и кто изменил решение вручную;
ограничения 230-ФЗ и 152-ФЗ применяются до отправки задачи в канал коммуникации.

Метрики, без которых модель нельзя выпускать в production

Хороший AUC не гарантирует роста денег. Перед запуском важно проверить не только качество классификации, но и бизнес-эффект: как модель ранжирует договоры по ожидаемому сбору, насколько стабильны прогнозы по продуктам и не ухудшается ли результат на новых портфелях.

Lift/Gain - показывает, насколько верхние сегменты модели лучше случайной выборки.
Calibration - проверяет, совпадает ли прогнозная вероятность с фактической частотой платежей.
Expected Recovery - сумма вероятности платежа и прогнозного размера возврата.
Cost per Recovered Ruble - сколько стоит каждый взысканный рубль по сегментам.
Stability Index - показывает, не деградировала ли модель на новых портфелях.

Compliance, объяснимость и аудит

Для взыскания важна не только точность прогноза, но и управляемость решения. Модель не должна нарушать ограничения по коммуникациям, использовать запрещённые или дискриминационные признаки, терять историю решений или мешать ручному контролю спорных кейсов.

Журнал решенийХранит версию модели, скорбалл, сегмент, рекомендованное действие и ручные изменения.

ОбъяснимостьПоказывает ключевые факторы скоринга: платёжная история, контактность, сумма, legal-статус.

Ограничения 230-ФЗПроверяются до постановки задачи оператору, звонка, SMS или digital-касания.

Контроль 152-ФЗДоступ к данным, источники признаков и сроки хранения должны быть формализованы.

Чек-лист готовности к внедрению

Перед запуском ML-скоринга стоит проверить не только данные, но и операционную готовность агентства. Если модель некуда встроить, она останется отчётом, а не инструментом роста Recovery Rate.

Есть история платежей и коммуникаций минимум за 12 месяцев.
В CRM фиксируются результаты контактов, обещания оплатить и причины отказа.
Данные БКИ, ФССП и legal-статусы связаны с договором.
Понятны целевые метрики пилота: Recovery Rate, cost per recovered ruble, collected amount per FTE.
Есть контрольная группа для A/B-теста.
Очереди операторов можно менять автоматически.
Digital-каналы и legal-модуль принимают скоринговые сегменты.
Есть владелец модели со стороны бизнеса и регламент переобучения.

Что получает агентство

Не абстрактный AI-модуль, а управляемую систему приоритизации: скоринг в карточке должника, очереди операторов, правила маршрутизации, BI-дашборд, A/B-контроль эффекта и журнал решений для внутреннего аудита.

FAQ по ML-скорингу долгового портфеля

Сколько данных нужно для первой модели?

Для пилота обычно достаточно 12-24 месяцев истории по платежам, коммуникациям и действиям взыскания. Чем стабильнее заполнены статусы контактов и результаты действий, тем быстрее модель начинает давать полезный lift.

Можно ли начать без БКИ и ФССП?

Да, но качество legal score и оценки платёжеспособности будет ниже. На первом этапе можно обучить модель на внутренних данных CRM, а внешние источники подключить во второй итерации.

Как часто нужно переобучать модель?

Для активных портфелей модель обычно пересматривают ежемесячно или ежеквартально. Отдельно отслеживают drift: если структура портфеля, каналы или поведение должников меняются, модель нужно переобучить раньше.

Почему нельзя просто сортировать по сумме долга?

Высокая сумма не означает высокий возврат. Договор с меньшей суммой, но высокой вероятностью платежа и низкой стоимостью контакта может дать лучший экономический результат, чем крупный долг с низкой исполнимостью.

Как доказать эффект ML-скоринга?

Нужен A/B-тест или контрольная группа. Сравнивать нужно не только Recovery Rate, но и чистую экономику: дополнительный сбор, стоимость контактов, нагрузку операторов и результат legal collection.

Вывод: ML-скоринг - это инструмент управления портфелем

Machine learning повышает Recovery Rate только тогда, когда связан с ежедневной операционной работой. Модель должна отвечать на практические вопросы: где агентство заработает больше, какой канал дешевле, когда запускать legal collection, кому предложить рассрочку и какие договоры не окупят активное взыскание.

КоллектСофт разрабатывает ML-скоринг как часть CRM для взыскания: от подготовки данных и обучения модели до интеграции в рабочие очереди, BI-аналитику, compliance-контроль и регулярное переобучение. Такой подход позволяет не просто «посчитать балл», а перестроить работу портфеля вокруг ожидаемого экономического результата.