Ошибка запуска LLMs (wizardcoder-13b) в google colabolatory
На прошлые два вопроса по данной тематике мне так никто и не ответил, но и они чудесным образом решились (Вопрос №1, вопрос №2). Я пытаюсь запустить в google colab wizardcoder-13b и mistral-7b, но так чтобы получить API ключ формата chatGPT чтобы воспользоваться им как на этом видео. Но мои попытки не увенчались успехом, почти каждая новая генерация - это новая ошибка. Сейчас стараюсь запустить хотя бы wizardcoder чтобы он работал через API, но вот что происходит.
- у автора видео все запускается как есть и не нужны дополнительные манипуляции с google colab (кроме как создания папки wizarcoder-13b в models/), но у меня запуск сервера сразу написал в терминал, что нету модуля "flask_cloudflared" - пришлось устанавливать. (!pip install flask_cloudflared)
- после установки библиотеки терминал выводит все чисто и в конце мы видим:
2023-11-16 10:45:23 INFO:Loaded the model in 49.89 seconds.
2023-11-16 10:45:23 INFO:Loading the extension "openai"...
2023-11-16 10:45:23 INFO:Loading the extension "gallery"...
* Downloading cloudflared for Linux x86_64...
Running on local URL: http://127.0.0.1:7860
2023-11-16 10:45:28 INFO:OpenAI compatible API URL:
https://parameters-measurement-fat-venues.trycloudflare.com
INFO: Started server process [4940]
INFO: Waiting for application startup.
INFO: Application startup complete.
INFO: Uvicorn running on http://127.0.0.1:5000 (Press CTRL+C to quit)
Running on public URL: https://795071272280c83a8a.gradio.live
но если перейти по нужной мне сгенерированной API ссылке, то там мы увидим:
{
"detail": "Method Not Allowed"
}
а уже в терминале появится это:
INFO: 188.234.93.15:0 - "GET / HTTP/1.1" 405 Method Not Allowed
P.S. если перейти по public URL, то там будем рабочий wizardcoder с стандартным интерфейсом gradio, но проблема в том что эта ссылка не формата openAI API и при её использовании в autogen будет ошибка, но также люди спокойно указывают в конфиге autogen не API ключ, а local URL и все работает (это работает в случае pro аккаунта в google colaboratory, ведь тогда нету таких ограничений по сеансам и мощностям(в нашем случае можно ток один сеанс на один аккаунт) или при запуске локально через LMstudio, но у нас нет таких мощностей чтобы запускать несколько нейросетей локально). Если бы можно было использовать public URL, то это было бы просто отлично так как он не работает лишь в очень редких случаях.