Что показывают сильные решения рынка
После анализа конкурентных материалов видно, что сильные статьи и продуктовые страницы не ограничиваются общими словами про искусственный интеллект. Они объясняют, какую именно модель строит агентство, какие признаки входят в расчёт, как меняется маршрут взыскания и как бизнес доказывает эффект через метрики.
Поэтому полноценная статья о ML-скоринге должна отвечать не только на вопрос «что такое модель», но и на управленческий вопрос: какое действие система рекомендует по каждому договору и как это влияет на деньги.
Что такое ML-скоринг долгового портфеля
ML-скоринг долгового портфеля - это модель, которая рассчитывает вероятность возврата долга, ожидаемую сумму взыскания и оптимальный следующий шаг по каждому договору. В отличие от ручной сегментации по DPD и сумме долга, machine learning учитывает сотни признаков: историю платежей, контактность, обещания оплатить, судебный статус, данные БКИ, канал коммуникации и реакцию должника на предыдущие действия.
Главная задача скоринга - не просто поставить должнику балл. Система должна помочь агентству распределить ресурсы: кому звонить в первую очередь, кого вести через digital-напоминания, где запускать legal collection, а какие договоры дешевле продать, списать или оставить до обновления данных.
«Recovery Rate растёт не из-за самой модели, а из-за правильного действия после скоринга: приоритетов операторов, точного выбора канала, своевременного legal-сценария и контроля стоимости взыскания.»
— Команда КоллектСофт
Какие модели нужны агентству
Один универсальный скоринг редко закрывает весь цикл взыскания. В зрелой системе используется набор моделей: каждая отвечает за свой этап и свой бизнес-вопрос. Такой подход лучше работает на портфелях, где есть разные продукты, стадии просрочки, каналы коммуникации и legal-маршруты.
| Модель | Что прогнозирует | Горизонт | Где применяется |
|---|---|---|---|
| Payment Propensity | вероятность платежа | 30-60 дней | очереди операторов, digital-кампании |
| Expected Recovery | ожидаемую сумму возврата | 60-180 дней | приоритизация крупных и средних долгов |
| Self-cure Score | вероятность оплаты без звонка | 7-21 день | ранняя просрочка, мягкие напоминания |
| Legal Score | перспективность судебного взыскания | 90-360 дней | отбор договоров в legal collection |
| Debt Sale Score | целесообразность продажи или списания | портфельный горизонт | управление низкопотенциальными сегментами |
Best Practice
Начинать стоит не с выбора алгоритма, а с бизнес-гипотезы: какой показатель улучшаем - Recovery Rate, collected amount per FTE, стоимость контакта, долю self-cure или окупаемость legal collection.
Какие данные нужны для модели
Качество ML-скоринга зависит не от названия алгоритма, а от полноты и чистоты исторических данных. Для первой версии модели обычно достаточно 12-24 месяцев истории по закрытым и активным договорам, где видно, какие действия предпринимались и чем они закончились.
| Группа данных | Примеры признаков | Зачем используется |
|---|---|---|
| Долг и просрочка | сумма, DPD, дата уступки, тип продукта, дисконт покупки | оценка экономического потенциала договора |
| Платёжная история | частичные платежи, дата последнего платежа, регулярность, обещания оплатить | прогноз вероятности и суммы возврата |
| Коммуникации | дозвоны, SMS, email, мессенджеры, отказы, реакция на офферы | выбор канала и частоты контакта |
| Внешние источники | БКИ, ФССП, банкротство, судебные данные, адресная актуальность | фильтрация рисков и legal-перспективы |
| Операционные действия | кто работал, когда звонил, какой скрипт применялся, результат контакта | поиск эффективных стратегий взыскания |
Отдельно важно хранить не только факт платежа, но и контекст решения: какой канал использовался, какой оператор работал, какая скидка предлагалась, был ли запрет контакта, сколько стоило действие и какие ограничения 230-ФЗ применялись в момент коммуникации.
Как строится скоринговая модель
В production-системе модель обычно решает несколько задач одновременно. Один скоринг оценивает вероятность платежа в ближайшие 30-60 дней, второй - ожидаемую сумму взыскания, третий - перспективность судебного взыскания. Итоговый приоритет договора считается уже на уровне бизнес-правил: прогноз умножается на сумму долга и сравнивается со стоимостью действия.
- Формируем обучающую выборку. Берём исторические договоры, фиксируем состояние на дату скоринга и результат через выбранный горизонт прогноза.
- Собираем признаки. Нормализуем данные CRM, телефонии, платежей, БКИ, ФССП и истории коммуникаций.
- Обучаем модель. Для табличных данных чаще всего используются gradient boosting модели: CatBoost, LightGBM или XGBoost.
- Проверяем качество. Смотрим AUC, Lift/Gain, Precision/Recall, калибровку вероятностей и бизнес-метрики на отложенной выборке.
- Встраиваем в CRM. Скорбалл появляется в карточке должника, очередях операторов, digital-кампаниях, legal-модуле и BI-дашбордах.
Важно учесть
Нельзя обучать модель на данных, которые появились после принятия решения. Например, результат судебного этапа не должен попадать в признаки для прогноза до запуска суда. Такая утечка данных даст красивую метрику на тесте и провал в реальной работе.
Как скорбалл превращается в стратегию взыскания
Самая частая ошибка - построить модель и оставить её отдельным отчётом для аналитика. Скоринг должен автоматически менять рабочий процесс: очередь задач, канал контакта, размер скидки, дату следующего касания, передачу в legal collection и контроль ограничений ФЗ-230.
| Сегмент | Признаки | Рекомендуемое действие | Цель |
|---|---|---|---|
| Высокий recovery | контактный должник, свежий платёж, высокая сумма | приоритет оператора, персональный сценарий, рассрочка | быстро закрыть максимальную сумму |
| Self-cure | ранняя просрочка, положительная история, высокая вероятность самостоятельного платежа | SMS, push, email, мягкое напоминание | не тратить дорогие звонки |
| Legal-positive | сумма покрывает издержки, есть данные для суда, нет критичных стоп-факторов | подготовка документов, проверка ФССП, судебный маршрут | повысить возврат через правовой контур |
| Низкий потенциал | старый долг, нет контактов, низкая сумма, негативные внешние признаки | дешёвый digital, обновление данных, продажа или списание | снизить стоимость взыскания |
За счёт чего Recovery Rate может вырасти на 35%
Рост Recovery Rate обычно складывается из нескольких эффектов. Модель раньше находит договоры с высокой вероятностью оплаты, убирает лишние касания по слабым сегментам, помогает не запускать убыточный legal collection и даёт руководителю прозрачную аналитику по каждому каналу.
Корректный замер выглядит так: одинаковые по составу сегменты портфеля делятся на контроль и тест, тестовая группа работает по ML-приоритетам, контрольная - по прежним правилам. Через 60-90 дней сравниваются Recovery Rate, collected amount, cost per recovered ruble и нагрузка операторов.
| Показатель | До ML-скоринга | После внедрения | Что изменилось |
|---|---|---|---|
| Recovery Rate | базовый уровень портфеля | +15-35% | приоритеты строятся по вероятности и сумме возврата |
| Стоимость контакта | единая интенсивность по сегментам | ниже на 10-25% | дорогие действия уходят только в перспективные группы |
| Legal-конверсия | часть исков убыточна | выше за счёт отбора | модель учитывает сумму, статус и исполнимость |
| Производительность операторов | ручная очередь задач | больше сбор на FTE | операторы начинают с договоров с максимальным expected recovery |
Интеграция в CRM и контроль качества
ML-скоринг должен быть частью операционной системы взыскания, а не отдельным ноутбуком аналитика. В КоллектСофт модель подключается через API или внутренний scoring service: CRM отправляет признаки, получает скорбалл, сегмент и рекомендованное действие, а затем сохраняет результат в историю договора.
- скорбалл пересчитывается по расписанию или после значимых событий: платежа, контакта, обновления данных БКИ или ФССП;
- руководитель видит распределение портфеля по сегментам, ожидаемый сбор и фактический результат;
- оператор получает готовую очередь задач без ручной сортировки Excel;
- аудит-лог фиксирует, какая версия модели дала рекомендацию и кто изменил решение вручную;
- ограничения 230-ФЗ и 152-ФЗ применяются до отправки задачи в канал коммуникации.
Метрики, без которых модель нельзя выпускать в production
Хороший AUC не гарантирует роста денег. Перед запуском важно проверить не только качество классификации, но и бизнес-эффект: как модель ранжирует договоры по ожидаемому сбору, насколько стабильны прогнозы по продуктам и не ухудшается ли результат на новых портфелях.
- Lift/Gain - показывает, насколько верхние сегменты модели лучше случайной выборки.
- Calibration - проверяет, совпадает ли прогнозная вероятность с фактической частотой платежей.
- Expected Recovery - сумма вероятности платежа и прогнозного размера возврата.
- Cost per Recovered Ruble - сколько стоит каждый взысканный рубль по сегментам.
- Stability Index - показывает, не деградировала ли модель на новых портфелях.
Compliance, объяснимость и аудит
Для взыскания важна не только точность прогноза, но и управляемость решения. Модель не должна нарушать ограничения по коммуникациям, использовать запрещённые или дискриминационные признаки, терять историю решений или мешать ручному контролю спорных кейсов.
Чек-лист готовности к внедрению
Перед запуском ML-скоринга стоит проверить не только данные, но и операционную готовность агентства. Если модель некуда встроить, она останется отчётом, а не инструментом роста Recovery Rate.
- Есть история платежей и коммуникаций минимум за 12 месяцев.
- В CRM фиксируются результаты контактов, обещания оплатить и причины отказа.
- Данные БКИ, ФССП и legal-статусы связаны с договором.
- Понятны целевые метрики пилота: Recovery Rate, cost per recovered ruble, collected amount per FTE.
- Есть контрольная группа для A/B-теста.
- Очереди операторов можно менять автоматически.
- Digital-каналы и legal-модуль принимают скоринговые сегменты.
- Есть владелец модели со стороны бизнеса и регламент переобучения.
Что получает агентство
Не абстрактный AI-модуль, а управляемую систему приоритизации: скоринг в карточке должника, очереди операторов, правила маршрутизации, BI-дашборд, A/B-контроль эффекта и журнал решений для внутреннего аудита.
FAQ по ML-скорингу долгового портфеля
Сколько данных нужно для первой модели?
Для пилота обычно достаточно 12-24 месяцев истории по платежам, коммуникациям и действиям взыскания. Чем стабильнее заполнены статусы контактов и результаты действий, тем быстрее модель начинает давать полезный lift.
Можно ли начать без БКИ и ФССП?
Да, но качество legal score и оценки платёжеспособности будет ниже. На первом этапе можно обучить модель на внутренних данных CRM, а внешние источники подключить во второй итерации.
Как часто нужно переобучать модель?
Для активных портфелей модель обычно пересматривают ежемесячно или ежеквартально. Отдельно отслеживают drift: если структура портфеля, каналы или поведение должников меняются, модель нужно переобучить раньше.
Почему нельзя просто сортировать по сумме долга?
Высокая сумма не означает высокий возврат. Договор с меньшей суммой, но высокой вероятностью платежа и низкой стоимостью контакта может дать лучший экономический результат, чем крупный долг с низкой исполнимостью.
Как доказать эффект ML-скоринга?
Нужен A/B-тест или контрольная группа. Сравнивать нужно не только Recovery Rate, но и чистую экономику: дополнительный сбор, стоимость контактов, нагрузку операторов и результат legal collection.
Вывод: ML-скоринг - это инструмент управления портфелем
Machine learning повышает Recovery Rate только тогда, когда связан с ежедневной операционной работой. Модель должна отвечать на практические вопросы: где агентство заработает больше, какой канал дешевле, когда запускать legal collection, кому предложить рассрочку и какие договоры не окупят активное взыскание.
КоллектСофт разрабатывает ML-скоринг как часть CRM для взыскания: от подготовки данных и обучения модели до интеграции в рабочие очереди, BI-аналитику, compliance-контроль и регулярное переобучение. Такой подход позволяет не просто «посчитать балл», а перестроить работу портфеля вокруг ожидаемого экономического результата.
