Поиск параметров распределения
Нужна консультация специалиста по матстатистике.
Имеем набор случайных/псевдослучайных значений (вектор, массив), ожидается, что они имеют распределение вида AxD, где D < 0, и в диапазоне от m до M (от 0 до ∞ нельзя — интеграл расходится...). Задача - найти эти параметры (D, m, M).
Пробовал оценивать по оценке среднего значения x (сравнивая с теоретическим, полученным интегрированием), при этом в качестве оценки m и M брал просто минимальное и максимальное значения из набора. Показалось было :), что получается что-то похожее на правду, но для надежности сгенерировал несколько собственных тестовых наборов для разных D - получилось очень большое расхождение с правдой (типа, для -1 получаю -0.9, для -3 — -2.2).
Поискал в Интернете, напал на метод максимального правдоподобия, но что-то не пойму, оно ли это или нет, + как именно его применить к данной задаче.
Как вариант, подумал было для разных D поискать значение χ² и брать то D, для которого оно минимально, но пока не реализовал, так как с одной стороны, минимизация такой сложной функции — еще та проблема, а с другой — надо же разбить весь диапазон на несколько участков — а на сколько именно? как именно выбрать количество степеней свободы?
Словом, был бы признателен матстатистикам за советы...
Ответы (1 шт):
Вы дали ответ на вопрос в вопросе, используйте метод правдоподобия.
Метод максимального правдоподобия или метод наибольшего правдоподобия в математической статистике — это метод оценивания неизвестного параметра путём максимизации функции правдоподобия. Основан на предположении о том, что вся информация о статистической выборке содержится в функции правдоподобия.
Лучше всего максимизировать логарифм правдоподобия. Вам можно реализовать это с помощью метода градиентного спуска.