Как решать задачу бинарной классификации, зная только положительные примеры?

Необходимо решить задачу бинарной классификации, но в тренировочной выборке имеются только положительные примеры. Как быть и какие методы лучше использовать?


Ответы (1 шт):

Автор решения: passant

Ваша задача относиться к классу задач One-Class Classification Algorithms. Методов решения много. В качестве введения можно посмотреть, например, вот тут:

https://en.wikipedia.org/wiki/One-class_classification
https://machinelearningmastery.com/one-class-classification-algorithms/
https://cs.uwaterloo.ca/~s255khan/files/occ_survey09.pdf
https://blogs.sap.com/2020/12/29/outlier-detection-with-one-class-classification-using-python-machine-learning-client-for-sap-hana/

В последней статье даже какая-то реализация на Python есть, хотя я сам с ней детально не разбирался.

Один из новых подходов - применение нейросетей типа автоенкодера. Он учиться "восстанавливать" данные на одном классе из тренировочной выборки. НА этапе использования - он будет отлично восстанавливать данные из этого класса и существенно ошибаться при восстановлении данных не принадлежащих этому классу, что и есть признаком того, что это некоторая аномалия.

→ Ссылка