GBDTE
На канале довольно сложно ориентироваться, поэтому я создал этот навигационно-сводный пост. Речь идет о любимом проекте, который я начал около десяти лет назад. Основная идея заключается в том, что мы можем использовать слегка измененные деревья решений с градиентным усилением как для группировки объектов, так и для поиска тенденций для этих групп.
📈 начало - самая первая картинка, где собрана вся идея
📈 кредитный скоринг - постановка задачи и временная нестабильность
📈 dataset - подготовка датасета, ytzaurus vs Oracle
📈 Vanilla GBDTE - эксперимент с математикой в Instant View
📈 Small MSE Dataset - первый синтетический датасет для MSE-кейса
📉 Extracting components - как выделить идеальные компоненты из хаотического сигнала
📉 Leafs and components - анализ листьев дерева и компонент
📉 Evil of defaults - отладка: виноваты параметры по умолчанию
📉 Big MSE dataset - scatterplot с более четким месседжем про gradient boosting
📉 LogLoss dataset - нестационарный датасет для бинарной классификации
🎲 Experiment on LogLoss dataset - первый запуск алгоритма на этом датасете
🎲 bad results - ключевая ошибка: почему нельзя использовать интерполяционные факторы как экстраполяционные
🎲 illustration for unstable class - иллюстрация для презентации
🎲 learning curves LogLoss - кривые обучения для LogLoss-кейса
