Логистическая регрессия, алгоритм работы
Подскажите пожалуйста правильно ли я понял алгоритм.
Вот ссылка на методичку откуда я брал формулы.
Вот как я понял:
Первый столбец в БД (который отвечает за то умер человек или нет) это
y, остальные 6 и один фиктивный признак в начале, это векторx.В формуле
N = 887, кол-во человек. Как я понял вся БД будет использована под обучающую выборку, было бы лучше 850 записей под обучение и например 27 под тестовую выборку?yiэто элементы вектораy.Запись
e^(θ^T*xi)означает: константаeв степени векторθ^Tскалярно умноженный на векторXi, гдеXiэто векторx, дляi-того человека.И как я понял, это формула нужна лишь для того, чтобы потом найти её градиент.
Начальный вектор
θ0, если я правильно понимаю, это вектор из 7 начальных коэффициентов, которые я могу сгенерировать случайно. (В каком только диапазоне? [0, 1]? [0.4, 0.6]?)μt- это шаг, который можно подобрать тренируя сеть, чтобы она быстрей обучалась, но изначально присвоить ему маленькое значение, например0.01.Прогоняю через функцию градиента всю обучающую выборку
tраз (гдеtкол-во эпох). В итоге, что я должен наблюдать? Что должно стремится к максимуму/минимуму?
Если я совсем не правильно понял алгоритм, можете пожалуйста объяснить простым языком или скинуть ссылку на какой-нибудь ресурс.
