Категоризация товаров с помощью AI GPT-модели
Я полный новичок в AI и решаю свою первую задачу с использованием GPT, и был бы очень рад, если бы меня кто-нибудь проконсультировал.
Мне необходимо распределять товары от поставщиков по списку категорий целевой платформы по их именам и описаниям.
Я решил задачу в лоб: закидываю в промпт список категорий с их IDs и список товаров (SKUимя и описание) в виде JSON-массивов, прошу указать 1-3 наиболее подходящих категорий и отвечать JSONом. Я использую GPT 3.5 Turbo 16K.
Всё вроде бы работает, но примерно 20% результатов содержат несуществующие IDs категорий, а среди прочих есть грубые ошибки категоризации. Я знаю, что галлюцинации GPT - нормальное оведение, но мне кажется, что я что-то сильно делаю не так.
Вот пример моего запроса:
I need to sort products with different categories into the categories of my store.
I'm giving you a list of products to sort and a list of categories in my store.
Give me an answer in the format of a JSON array containing objects with the fields “sku” (article of the product being sorted) and “subcategories” (the most suitable subcategories from the list).
Specify product subcategories as a JSON array containing the IDs of one to three of the most suitable subcategories.
The array of subcategory IDs must be of type array of numbers.
You should not provide explanatory text in your response.
Categories:
[
{
"categoryName": "Artykuły piśmiennicze",
"subcategories": [
{
"id": 251,
"name": "Długopisy"
},
...,
]
},
{
"categoryName": "Dom i kuchnia",
"subcategories": [
{
"id": 260,
"name": "Akcesoria do serwowania"
},
...
]
},
...
]
Products:
[
{
"sku": "8700007",
"name": "Zestaw narzędzi",
"description": " 25-częściowy zestaw narzędzi w aluminiowym etui ... "
},
{
"sku": "3000006",
"name": "Naklejka z motywem świątecznym",
"description": " Samoprzylepna naklejka 3D ... "
},
...
]
И вот пример ответа GPT:
[
{ sku: '9046001', subcategories: [ 295, 298 ] },
{ sku: '8050005', subcategories: [] },
...
]
Не мог бы кто-нибудь прокомментировать моё решение? Заранее спасибо!