GBDTE. Виновник найден.
Я начал копать глубже и с помощью «железного друга» проверил несколько гипотез. В итоге нашел оптимальное выражение идеальной модели для этого датасета. Результат заслуживает отдельного поста. Оказалось, моя интуиция про линейную модель и линейный lift была верной: в построенном датасете оптимальный score линейно зависит от времени.
Сегодня я решил сравнить теорию с одним шагом моей модели. Картинку можно увидеть в начале поста. На этот раз проблема в vibecoding: модель решила сложить все признаки в дополнительную часть датасета. Следующий шаг очевиден - разделить их и прогнать тест снова. Продолжение будет.
