Почему deepseek так медленно работает

Пробую использовать китайскую вундервафлю, пока в развлекательных целях. Хочу что бы он генерил ворчливые пользователям ТГ бота и всё бы ничего, но он катастрофически медленно работает.

INFO:aiogram.event:Update id=188900864 is handled. Duration 9625 ms by bot id=7920122287

9625 ms на генерацию фразы в 3 предложений... Даже сберовский гигачат делает это моментально не создавая проблем, а тут я даже успел подумать, что ошибка какая то в коде, прежде чем ответ получил, те заметное подтормаживание происходит. Это норм или я что то не так сделал?

async def bruzga():
    client = OpenAI(api_key="тут мой ключик доступа", base_url="https://api.deepseek.com")
    response = client.chat.completions.create(
        model="deepseek-chat",
        messages=[
            {"role": "system", "content": "Ты очень ленивый и брюзгливый сотрудник комании"},
            {"role": "user", "content": "Скажи что тебе было лень это делать и ты возмущен "},
        ],
        stream=False,
        max_tokens = 500
    )
    # print(response)
    return response.choices[0].message.content

Ответы (0 шт):