Что такое Pre-trained-model, предварительно обученная модель

следую туториалу Tensorflow. Object detection API. Вопрос, что такое "Предварительно обученная модель" или "Pre trained model"? На какие данные она обучена? Как понять, какая именно предобученная модель мне нужна, к примеру из этого списка?

Допустим, мне нужен классификатор и детектор холодильников определённой Фирмы, то какую именно модель я должен использовать?


Ответы (1 шт):

Автор решения: Vlad Chapl

Предобученная модель тренировалась на каком-то большом (как правило универсальном) наборе данных. Конкретнее про данные нужно смотреть описание к модели.

Подобные модели могут использоваться по разному.

  1. К примеру YOLOv5 можно сразу использовать, что бы найти на фотографии какие-то объекты ("машина", "человек") детектировать которые эта нейросеть обучена.

  2. Можно подобную модель дообучить на ваших данных (finetune). Это иногда быстрее и качественнее, нежели обучать с нуля. К примеру дообучить на холодильниках (при этом детектироваться люди и машины станут хуже, нейросеть их частично забудет).

  3. Можно "откусить" последние слои и мы получим генератор фич по нашей картинке. На основе этих фич мы самостоятельно можем обучить классификатор (к примеру холодильников).

Разумеется мы можем подобную модель использовать как часть большой модели. К примеру Stable Diffusion внутри себя использует CLIP.

→ Ссылка