Логистическая регрессия, алгоритм работы

Подскажите пожалуйста правильно ли я понял алгоритм.

Вот ссылка на методичку откуда я брал формулы.

Вот как я понял:

  1. Первый столбец в БД (который отвечает за то умер человек или нет) это y, остальные 6 и один фиктивный признак в начале, это вектор x.

  2. Из формулы формлу1 я получаю новый вектор θ^T = [θ0, θ1, ... θ6]

  3. В формулеформула2 N = 887, кол-во человек. Как я понял вся БД будет использована под обучающую выборку, было бы лучше 850 записей под обучение и например 27 под тестовую выборку?

    yi это элементы вектора y.

    Запись e^(θ^T*xi) означает: константа e в степени вектор θ^T скалярно умноженный на вектор Xi, где Xi это вектор x, для i-того человека.

    И как я понял, это формула нужна лишь для того, чтобы потом найти её градиент.

  4. Начальный вектор θ0, если я правильно понимаю, это вектор из 7 начальных коэффициентов, которые я могу сгенерировать случайно. (В каком только диапазоне? [0, 1]? [0.4, 0.6]?)

  5. μt - это шаг, который можно подобрать тренируя сеть, чтобы она быстрей обучалась, но изначально присвоить ему маленькое значение, например 0.01.

  6. Прогоняю через функцию градиента всю обучающую выборку t раз (где t кол-во эпох). В итоге, что я должен наблюдать? Что должно стремится к максимуму/минимуму?

Если я совсем не правильно понял алгоритм, можете пожалуйста объяснить простым языком или скинуть ссылку на какой-нибудь ресурс.


Ответы (0 шт):