Логистическая регрессия, алгоритм работы

Подскажите пожалуйста правильно ли я понял алгоритм.

Вот ссылка на методичку откуда я брал формулы.

Вот как я понял:

Первый столбец в БД (который отвечает за то умер человек или нет) это y, остальные 6 и один фиктивный признак в начале, это вектор x.
Из формулы я получаю новый вектор θ^T = [θ0, θ1, ... θ6]
В формуле N = 887, кол-во человек. Как я понял вся БД будет использована под обучающую выборку, было бы лучше 850 записей под обучение и например 27 под тестовую выборку?

yi это элементы вектора y.

Запись e^(θ^T*xi) означает: константа e в степени вектор θ^T скалярно умноженный на вектор Xi, где Xi это вектор x, для i-того человека.

И как я понял, это формула нужна лишь для того, чтобы потом найти её градиент.
Начальный вектор θ0, если я правильно понимаю, это вектор из 7 начальных коэффициентов, которые я могу сгенерировать случайно. (В каком только диапазоне? [0, 1]? [0.4, 0.6]?)
μt - это шаг, который можно подобрать тренируя сеть, чтобы она быстрей обучалась, но изначально присвоить ему маленькое значение, например 0.01.
Прогоняю через функцию градиента всю обучающую выборку t раз (где t кол-во эпох). В итоге, что я должен наблюдать? Что должно стремится к максимуму/минимуму?

Если я совсем не правильно понял алгоритм, можете пожалуйста объяснить простым языком или скинуть ссылку на какой-нибудь ресурс.

Источник

БЛОГ НА HUSL

Логистическая регрессия, алгоритм работы

Ответы (0 шт):