CatBoost — open source библиотека градиентного бустинга на деревьях решений, которую два месяца назад презентовал Яндекс. Если верить разработчикам, она способна решить все наши проблемы: Кэтбуст устойчив к переобучению, может работать с категориальными признаками без дополнительной предобработки и работает лучше других аналогичных открытых библиотек. Вместе с исходным кодом Яндекс выложил серию экспериментов, в которых на наборе из 9 открытых датасетов Кэтбуст бьет и всем известный XGBoost, и майкрософтовский LightGBM, и библиотеку H2O — причем как после подбора гиперпараметров, так и с дефолтными параметрами.

Read More

785 просмотров всего, 3 просмотров сегодня