Блог/ML и аналитика

ML-скоринг долгового портфеля: как machine learning повышает Recovery Rate на 35%

28 мин чтенияОбновлено 17 июня 2026Автор: Алексей Громов
ML-скоринг долгового портфеля: как machine learning повышает Recovery Rate на 35%

Что показывают сильные решения рынка

После анализа конкурентных материалов видно, что сильные статьи и продуктовые страницы не ограничиваются общими словами про искусственный интеллект. Они объясняют, какую именно модель строит агентство, какие признаки входят в расчёт, как меняется маршрут взыскания и как бизнес доказывает эффект через метрики.

Прединвестиционный скорингОценивает портфель до покупки: ожидаемый сбор, дисконт, риск убыточных сегментов и приоритеты первичной обработки.
Collection scoreПрогнозирует вероятность платежа в горизонте 30-90 дней и помогает формировать очереди операторов.
Legal scoreОпределяет, какие договоры экономически целесообразно переводить в судебное взыскание.
Pre-collection scoreРаботает на ранней просрочке: отделяет клиентов, которые оплатят после мягкого напоминания, от тех, кому нужен звонок.

Поэтому полноценная статья о ML-скоринге должна отвечать не только на вопрос «что такое модель», но и на управленческий вопрос: какое действие система рекомендует по каждому договору и как это влияет на деньги.

Что такое ML-скоринг долгового портфеля

ML-скоринг долгового портфеля - это модель, которая рассчитывает вероятность возврата долга, ожидаемую сумму взыскания и оптимальный следующий шаг по каждому договору. В отличие от ручной сегментации по DPD и сумме долга, machine learning учитывает сотни признаков: историю платежей, контактность, обещания оплатить, судебный статус, данные БКИ, канал коммуникации и реакцию должника на предыдущие действия.

Главная задача скоринга - не просто поставить должнику балл. Система должна помочь агентству распределить ресурсы: кому звонить в первую очередь, кого вести через digital-напоминания, где запускать legal collection, а какие договоры дешевле продать, списать или оставить до обновления данных.

«Recovery Rate растёт не из-за самой модели, а из-за правильного действия после скоринга: приоритетов операторов, точного выбора канала, своевременного legal-сценария и контроля стоимости взыскания.»

— Команда КоллектСофт

Какие модели нужны агентству

Один универсальный скоринг редко закрывает весь цикл взыскания. В зрелой системе используется набор моделей: каждая отвечает за свой этап и свой бизнес-вопрос. Такой подход лучше работает на портфелях, где есть разные продукты, стадии просрочки, каналы коммуникации и legal-маршруты.

МодельЧто прогнозируетГоризонтГде применяется
Payment Propensityвероятность платежа30-60 днейочереди операторов, digital-кампании
Expected Recoveryожидаемую сумму возврата60-180 днейприоритизация крупных и средних долгов
Self-cure Scoreвероятность оплаты без звонка7-21 деньранняя просрочка, мягкие напоминания
Legal Scoreперспективность судебного взыскания90-360 днейотбор договоров в legal collection
Debt Sale Scoreцелесообразность продажи или списанияпортфельный горизонтуправление низкопотенциальными сегментами

Best Practice

Начинать стоит не с выбора алгоритма, а с бизнес-гипотезы: какой показатель улучшаем - Recovery Rate, collected amount per FTE, стоимость контакта, долю self-cure или окупаемость legal collection.

Какие данные нужны для модели

Качество ML-скоринга зависит не от названия алгоритма, а от полноты и чистоты исторических данных. Для первой версии модели обычно достаточно 12-24 месяцев истории по закрытым и активным договорам, где видно, какие действия предпринимались и чем они закончились.

Группа данныхПримеры признаковЗачем используется
Долг и просрочкасумма, DPD, дата уступки, тип продукта, дисконт покупкиоценка экономического потенциала договора
Платёжная историячастичные платежи, дата последнего платежа, регулярность, обещания оплатитьпрогноз вероятности и суммы возврата
Коммуникациидозвоны, SMS, email, мессенджеры, отказы, реакция на офферывыбор канала и частоты контакта
Внешние источникиБКИ, ФССП, банкротство, судебные данные, адресная актуальностьфильтрация рисков и legal-перспективы
Операционные действиякто работал, когда звонил, какой скрипт применялся, результат контактапоиск эффективных стратегий взыскания

Отдельно важно хранить не только факт платежа, но и контекст решения: какой канал использовался, какой оператор работал, какая скидка предлагалась, был ли запрет контакта, сколько стоило действие и какие ограничения 230-ФЗ применялись в момент коммуникации.

Как строится скоринговая модель

В production-системе модель обычно решает несколько задач одновременно. Один скоринг оценивает вероятность платежа в ближайшие 30-60 дней, второй - ожидаемую сумму взыскания, третий - перспективность судебного взыскания. Итоговый приоритет договора считается уже на уровне бизнес-правил: прогноз умножается на сумму долга и сравнивается со стоимостью действия.

  1. Формируем обучающую выборку. Берём исторические договоры, фиксируем состояние на дату скоринга и результат через выбранный горизонт прогноза.
  2. Собираем признаки. Нормализуем данные CRM, телефонии, платежей, БКИ, ФССП и истории коммуникаций.
  3. Обучаем модель. Для табличных данных чаще всего используются gradient boosting модели: CatBoost, LightGBM или XGBoost.
  4. Проверяем качество. Смотрим AUC, Lift/Gain, Precision/Recall, калибровку вероятностей и бизнес-метрики на отложенной выборке.
  5. Встраиваем в CRM. Скорбалл появляется в карточке должника, очередях операторов, digital-кампаниях, legal-модуле и BI-дашбордах.

Важно учесть

Нельзя обучать модель на данных, которые появились после принятия решения. Например, результат судебного этапа не должен попадать в признаки для прогноза до запуска суда. Такая утечка данных даст красивую метрику на тесте и провал в реальной работе.

Как скорбалл превращается в стратегию взыскания

Самая частая ошибка - построить модель и оставить её отдельным отчётом для аналитика. Скоринг должен автоматически менять рабочий процесс: очередь задач, канал контакта, размер скидки, дату следующего касания, передачу в legal collection и контроль ограничений ФЗ-230.

СегментПризнакиРекомендуемое действиеЦель
Высокий recoveryконтактный должник, свежий платёж, высокая суммаприоритет оператора, персональный сценарий, рассрочкабыстро закрыть максимальную сумму
Self-cureранняя просрочка, положительная история, высокая вероятность самостоятельного платежаSMS, push, email, мягкое напоминаниене тратить дорогие звонки
Legal-positiveсумма покрывает издержки, есть данные для суда, нет критичных стоп-факторовподготовка документов, проверка ФССП, судебный маршрутповысить возврат через правовой контур
Низкий потенциалстарый долг, нет контактов, низкая сумма, негативные внешние признакидешёвый digital, обновление данных, продажа или списаниеснизить стоимость взыскания

За счёт чего Recovery Rate может вырасти на 35%

Рост Recovery Rate обычно складывается из нескольких эффектов. Модель раньше находит договоры с высокой вероятностью оплаты, убирает лишние касания по слабым сегментам, помогает не запускать убыточный legal collection и даёт руководителю прозрачную аналитику по каждому каналу.

Корректный замер выглядит так: одинаковые по составу сегменты портфеля делятся на контроль и тест, тестовая группа работает по ML-приоритетам, контрольная - по прежним правилам. Через 60-90 дней сравниваются Recovery Rate, collected amount, cost per recovered ruble и нагрузка операторов.

ПоказательДо ML-скорингаПосле внедренияЧто изменилось
Recovery Rateбазовый уровень портфеля+15-35%приоритеты строятся по вероятности и сумме возврата
Стоимость контактаединая интенсивность по сегментамниже на 10-25%дорогие действия уходят только в перспективные группы
Legal-конверсиячасть исков убыточнавыше за счёт отборамодель учитывает сумму, статус и исполнимость
Производительность операторовручная очередь задачбольше сбор на FTEоператоры начинают с договоров с максимальным expected recovery
Формула ROI для пилота: дополнительный сбор по тестовой группе минус стоимость внедрения, интеграции, поддержки модели и дополнительных коммуникаций. Если модель повышает сбор, но одновременно резко увеличивает стоимость контактов, эффект нужно считать по чистой марже, а не по валовому Recovery Rate.

Интеграция в CRM и контроль качества

ML-скоринг должен быть частью операционной системы взыскания, а не отдельным ноутбуком аналитика. В КоллектСофт модель подключается через API или внутренний scoring service: CRM отправляет признаки, получает скорбалл, сегмент и рекомендованное действие, а затем сохраняет результат в историю договора.

  • скорбалл пересчитывается по расписанию или после значимых событий: платежа, контакта, обновления данных БКИ или ФССП;
  • руководитель видит распределение портфеля по сегментам, ожидаемый сбор и фактический результат;
  • оператор получает готовую очередь задач без ручной сортировки Excel;
  • аудит-лог фиксирует, какая версия модели дала рекомендацию и кто изменил решение вручную;
  • ограничения 230-ФЗ и 152-ФЗ применяются до отправки задачи в канал коммуникации.

Метрики, без которых модель нельзя выпускать в production

Хороший AUC не гарантирует роста денег. Перед запуском важно проверить не только качество классификации, но и бизнес-эффект: как модель ранжирует договоры по ожидаемому сбору, насколько стабильны прогнозы по продуктам и не ухудшается ли результат на новых портфелях.

  • Lift/Gain - показывает, насколько верхние сегменты модели лучше случайной выборки.
  • Calibration - проверяет, совпадает ли прогнозная вероятность с фактической частотой платежей.
  • Expected Recovery - сумма вероятности платежа и прогнозного размера возврата.
  • Cost per Recovered Ruble - сколько стоит каждый взысканный рубль по сегментам.
  • Stability Index - показывает, не деградировала ли модель на новых портфелях.

Compliance, объяснимость и аудит

Для взыскания важна не только точность прогноза, но и управляемость решения. Модель не должна нарушать ограничения по коммуникациям, использовать запрещённые или дискриминационные признаки, терять историю решений или мешать ручному контролю спорных кейсов.

Журнал решенийХранит версию модели, скорбалл, сегмент, рекомендованное действие и ручные изменения.
ОбъяснимостьПоказывает ключевые факторы скоринга: платёжная история, контактность, сумма, legal-статус.
Ограничения 230-ФЗПроверяются до постановки задачи оператору, звонка, SMS или digital-касания.
Контроль 152-ФЗДоступ к данным, источники признаков и сроки хранения должны быть формализованы.

Чек-лист готовности к внедрению

Перед запуском ML-скоринга стоит проверить не только данные, но и операционную готовность агентства. Если модель некуда встроить, она останется отчётом, а не инструментом роста Recovery Rate.

  • Есть история платежей и коммуникаций минимум за 12 месяцев.
  • В CRM фиксируются результаты контактов, обещания оплатить и причины отказа.
  • Данные БКИ, ФССП и legal-статусы связаны с договором.
  • Понятны целевые метрики пилота: Recovery Rate, cost per recovered ruble, collected amount per FTE.
  • Есть контрольная группа для A/B-теста.
  • Очереди операторов можно менять автоматически.
  • Digital-каналы и legal-модуль принимают скоринговые сегменты.
  • Есть владелец модели со стороны бизнеса и регламент переобучения.

Что получает агентство

Не абстрактный AI-модуль, а управляемую систему приоритизации: скоринг в карточке должника, очереди операторов, правила маршрутизации, BI-дашборд, A/B-контроль эффекта и журнал решений для внутреннего аудита.

FAQ по ML-скорингу долгового портфеля

Сколько данных нужно для первой модели?

Для пилота обычно достаточно 12-24 месяцев истории по платежам, коммуникациям и действиям взыскания. Чем стабильнее заполнены статусы контактов и результаты действий, тем быстрее модель начинает давать полезный lift.

Можно ли начать без БКИ и ФССП?

Да, но качество legal score и оценки платёжеспособности будет ниже. На первом этапе можно обучить модель на внутренних данных CRM, а внешние источники подключить во второй итерации.

Как часто нужно переобучать модель?

Для активных портфелей модель обычно пересматривают ежемесячно или ежеквартально. Отдельно отслеживают drift: если структура портфеля, каналы или поведение должников меняются, модель нужно переобучить раньше.

Почему нельзя просто сортировать по сумме долга?

Высокая сумма не означает высокий возврат. Договор с меньшей суммой, но высокой вероятностью платежа и низкой стоимостью контакта может дать лучший экономический результат, чем крупный долг с низкой исполнимостью.

Как доказать эффект ML-скоринга?

Нужен A/B-тест или контрольная группа. Сравнивать нужно не только Recovery Rate, но и чистую экономику: дополнительный сбор, стоимость контактов, нагрузку операторов и результат legal collection.

Вывод: ML-скоринг - это инструмент управления портфелем

Machine learning повышает Recovery Rate только тогда, когда связан с ежедневной операционной работой. Модель должна отвечать на практические вопросы: где агентство заработает больше, какой канал дешевле, когда запускать legal collection, кому предложить рассрочку и какие договоры не окупят активное взыскание.

КоллектСофт разрабатывает ML-скоринг как часть CRM для взыскания: от подготовки данных и обучения модели до интеграции в рабочие очереди, BI-аналитику, compliance-контроль и регулярное переобучение. Такой подход позволяет не просто «посчитать балл», а перестроить работу портфеля вокруг ожидаемого экономического результата.

Нужна консультация по теме статьи?

Наши специалисты ответят на технические вопросы и помогут определить оптимальное решение для вашего коллекторского агентства.